J'ai utilisé de l'OCR pour les rapports de la CNCCFP (les vieux que je suis allée pêcher directement à l'institution), oui, ça prend un peu de temps, c'est un peu laborieux mais si le Gouvernement dont le mantra est la dématérialisation nous dit qu'il n'y a pas d'argent pour ça,

Follow

c'est un peu ... léger comme argument. Même la question du stockage des données est fallacieuse. On n'a pas besoin d'avoir quelque chose avec des paillettes (et des moulures au plafond).

On a besoin du texte brut et éventuellement de la localisation (ça peut être bien de savoir que le texte vient du cahier de doléances de Triffouillis les Trois Canetons pour mettre dans un contexte).

Un index, un moteur de recherche vaguement intelligent et roule ma poule. L'argument de l'hébergement des infos, c'est vraiment l'excuse qui va faire mourir de rire tous les admins-sys et les développeurs que je connais (moi la première).

Accessoirement, c'est un manque de respect envers les personnes qui ont pris le temps d'écrire et envers les maires et le personnel de mairie, qui ont mis en place ces cahiers.

@Projet_Arcadie Sans aller jusqu'à l'OCR, rien n'empêche de mettre en ligne les scans des documents en indiquant la commune de provenance (ça, c'est vraiment pas long je pense!).

@Monsieur99 @Projet_Arcadie si j'ai bien compris, il y a aussi un argument d'anonymisation, à cause de contenus nominatifs ou contenant des données personnelles. Pour le reste, je partage votre avis.

@Projet_Arcadie Bah oui mais à qui veut tu vendre le palais Bourbon!

oui je sais où est la sortie…

Sign in to participate in the conversation
La Quadrature du Net - Mastodon - Media Fédéré

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!