J'ai profité d'un confinement pour importer sur #WikiCommons les archives photos de l'#INRA. Cela représente 10 000 photos de 1958 à nos jours. Quelques photos illustrent des articles #Wikipedia qui sont consultés **un million de fois par mois.**
(
La requête pour les versements des #ArchivesNationales : +9 millions de vues par mois. poke @MaiwennBourdic https://wikimedia.org/api/rest_v1/metrics/commons-analytics/pageviews-per-category-monthly/Media_contributed_by_the_Archives_Nationales_(France)/deep/all-wikis/20240101/20241231 #GLAM #OpenGlam
Une bonne chose avec ces nouvelles données : "Pageviews to a wiki's Main page are not counted". Les outils de Magnus avaient ce problème : ils comptaient 30 fois le passage d'un jour en page d'accueil car techniquement c'est compliqué de voir quand est ajouté une image dans une page donc on simplifie en mesurant au mois.
Bref, si vous voulez des données :
Reste un problème : certains modèles en pied de page incluent des photos que personnes ne voient car c'est tout en bas et faut déplier le modèle. Mais ça peut fortement gonfler les stats comme ce modèle placé sur des articles avec un peu de trafic. On le voit bien avec l'outil GLAMorgan de Magnus.
Je publierai un mode d'emploi plus compréhensible dans mon cours sur Callisto
@Pyb ça fait 7 mois que j'attends je sais pas si ce projet est mort ou s'ils n'acceptent pas les contributions en fait https://gitlab.wikimedia.org/repos/data-engineering/airflow-dags/-/merge_requests/680
@Pyb woww... Avec des mois à 11 ou 12 millions. Merci pour ce lien de fin d'année juste avant de fournir les stats annuelles.
Les dumps sont tous les deux mois ?
@Pyb @daieuxetdailleurs question métier : vous incluez ces chiffres au bilan fait pour le SIAF ? Et question #commons / métier : c’est pour combien d’images déposées ? Car je pense que ça fait une gros nombres de vue par images non ?
@macgraveur : pour les stats, je les fournis systématiquement pour notre rapport annuel. Mais y a pas de case adéquate me semble dans les stats suaf. Sauf à additionner visionneuse et wiki.
Pour la répartition par image, glamorous permet d'en savoir un peu plus. Jeanne d'Arc, sceau de Philippe Auguste sont les plus vues. Mais les "petites" valent aussi la peine (signatures par ex.)
@Pyb
@daieuxetdailleurs merci je me disais « pourquoi pas additionner » :) et au total combien de fichiers déposés ? @Pyb
@macgraveur le nombre de fichiers est exponentiel et évolutif ;-)
Et puis il y a ceux mis par l'institution, et ceux téléchargés par les usagers (quand on les repère et les catégorise)
Moi en tout cas je fournis consciencieuse ment mes stats et elles sont reprises dans le rapport institutionnel.
Cc @Pyb
@daieuxetdailleurs @macgraveur - voilà la doc du jeu de données https://wikitech.wikimedia.org/wiki/Commons_Impact_Metrics/Data_Model
- les dumps mensuels sont là https://dumps.wikimedia.org/other/commons_impact_metrics/