Follow

J'ai utilisé de l'OCR pour les rapports de la CNCCFP (les vieux que je suis allée pêcher directement à l'institution), oui, ça prend un peu de temps, c'est un peu laborieux mais si le Gouvernement dont le mantra est la dématérialisation nous dit qu'il n'y a pas d'argent pour ça,

c'est un peu ... léger comme argument. Même la question du stockage des données est fallacieuse. On n'a pas besoin d'avoir quelque chose avec des paillettes (et des moulures au plafond).

On a besoin du texte brut et éventuellement de la localisation (ça peut être bien de savoir que le texte vient du cahier de doléances de Triffouillis les Trois Canetons pour mettre dans un contexte).

Un index, un moteur de recherche vaguement intelligent et roule ma poule. L'argument de l'hébergement des infos, c'est vraiment l'excuse qui va faire mourir de rire tous les admins-sys et les développeurs que je connais (moi la première).

Accessoirement, c'est un manque de respect envers les personnes qui ont pris le temps d'écrire et envers les maires et le personnel de mairie, qui ont mis en place ces cahiers.

@Projet_Arcadie Sans aller jusqu'à l'OCR, rien n'empêche de mettre en ligne les scans des documents en indiquant la commune de provenance (ça, c'est vraiment pas long je pense!).

@Monsieur99 @Projet_Arcadie si j'ai bien compris, il y a aussi un argument d'anonymisation, à cause de contenus nominatifs ou contenant des données personnelles. Pour le reste, je partage votre avis.

@Projet_Arcadie Bah oui mais à qui veut tu vendre le palais Bourbon!

oui je sais où est la sortie…

@Projet_Arcadie Ah bah si, justement, ils l’ont fait ! C’est bien pour ça que c’est du bon gros foutage de gueule !

@Projet_Arcadie
« Les préfectures, après avoir récupéré les cahiers, les ont transmis à la Bibliothèque nationale de France (BNF) pour qu’ils soient numérisés. Puis ces documents ont été transformés en texte informatique pour être analysés par des spécialistes. On appelle cela “l’océrisation”. »

@framasky
WTF ?! La BNF se retrouve à gérer ça alors qu'elle n'a même pas les moyens de numériser ses archives et qu'elle a dû faire un vieux partenariat public/privé avec Hachette pour se financer ??
@Projet_Arcadie

Sign in to participate in the conversation
La Quadrature du Net - Mastodon - Media Fédéré

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!