Le jeu de données dont il est question est trouvable sur data.gouv.fr.
Janvier 2023. Comme souvent quand je m'ennuie, je traîne sur Wikipédia. Wikipédia, c'est bien, mangez-en. Et je tombe sur la page Professeur des universités.
En la parcourant, je tombe sur cette section...
Liste brouillon des postes universitaires, effectifs qui datent de 2008-2009, selon une typologie vraiment pas claire... Hm. Cette section mériterait d'être un peu dépoussiérée.
Du coup, je cherche l'évolution des effectifs... Et je ne trouve rien. Rien. Rien sur Data Gouv, rien sur le site du ministère, rien.
Vous sentez la douille arriver. Commence à monter la petite musique du "J'ai un peu de temps, et si je fouillais un peu, et puis encore un petit jeu de données qui va me prendre des dizaines d'heures...".
Sans y croire, je me mets à fouiller. Je tombe sur le site des archives statistiques de la Direction de l'évaluation, de la prospective et de la performance du Ministère de l'éducation. (dans les ministères, l'ESR a souvent été joint avec l'éducation)
Et là, je tombe sur une note intéressante. "Les personnels enseignants de l'enseignement supérieur, sous tutelle du MESR - 2011-2012".
Très, très intéressant. Les professeurs des universités, maîtres de conférences, et même les ATER et les doctorants contractuels ? Regroupés selon les groupes de sections CNU ? J'aurais préféré une granularité pour chaque section, mais c'est pas grave. Il y a vraiment de quoi faire.
Je regarde si cette étude est publiée régulièrement : oui, chaque année. C'est même à jour jusqu'en 2022, donc encore maintenu. Parfait. Maintenant voyons jusqu'où ça remonte.
...1990...1985...1972...oh bon sang... 1965. Près de soixante ans de statistiques.
À y regarder de plus près, les données antérieures à 1980 sont imparfaites : des trous, des changements de méthodologie... Allez, c'est pas grave. Je vais donc travailler depuis 1980.
Récolement des données
Voyons voir. Qu'est-ce qui serait intéressant ? Les professeurs des universités, naturellement. Il y a aussi les maîtres de conférences ? Allez. Et les ATER ? C'est un poste récent, ça ne me prendra pas trop de temps...
Il y a aussi les contractuels LRU, qui est un type de contrat précaire créé en 2016, des espèces de CDD. Je vais les ajouter, tiens, pour faire un état de la précarisation des universitaires, et dans quelles disciplines.
Bien. Quelle granularité vais-je choisir ? Les groupes de section, naturellement, mais vu que j'ai aussi moyen de regrouper par grande discipline, je vais le faire aussi. Ça offrira une visibilité différente de la répartition. C'est pas beaucoup d'effort : pour éviter les erreurs de saisie, je fais une fonction qui additionne les groupes de section des grandes disciplines.
En revanche, c'est la première fois que je travaille avec autant de documents différents, et pas depuis un site internet : c'est un challenge de bien garder trace de tout. Pour ne pas me perdre, j'imprime tout et je mets tout dans un grand classeur. Je ne m'en serais jamais sorti seulement sur écran.
Okay. Ce fut long, mais pas aussi long que les autres fois : ma base de données est prête ! Depuis 1980 (selon disponibilités), évolution du nombre de maîtres de conférences, de professeurs des universités, d'ATER et de contrats LRU. Une très belle visualisation.
Et maintenant, j'en reviens à mon idée originale : enrichir la page Wikipédia !
Publication sur Wikipédia
J'ai déjà vu passer sur Wikipédia des jolis tableaux de données, voire même des graphiques interactifs. Je me dis que comme pour les photos, il doit y avoir un moyen de déposer des données brutes ?
Avec l'aide du wikimédien chevronné Pierre-Yves Beaudoin, je découvre que oui : sur Wikimedia Commons !
Wikimedia Commons permet, avec un peu de bidouillage, d'importer des jeux de données en CSV pour les réutiliser sur les projets Wikimédia. Je m'y mets donc, je galère, je cherche, et finalement j'y arrive.
Et maintenant tout ça bien importé sur Commons, il ne me reste plus qu'à aller sur la page Wikipédia que je vise, lancer l'éditeur, eeeeeeeeet...
Voilà ! Il y avait un graphique aussi, permettant de voir l'évolution, mais le module est cassé.
Une petite publication sur data.gouv.fr, et hop, un petit jeu de données très satisfaisant !