Le jeu de données dont il est question est trouvable sur data.gouv.fr.
En décembre 2019/janvier 2020, la première réforme des retraites est dans les tuyaux, elle fait fortement réagir les avocats et avocates libérales de France, qui voient leur modèle économique fragilisé : il est prévu de fusionner les régimes autonomes de retraite et d'avoir une caisse unique de prélèvement des cotisations, de calcul des prestations et de leur versement. Le résultat aurait abouti, pour les 50% de cabinets les plus "petits" (aux revenus les moins élevés, notamment en droit pénal, ou en droit de la famille), un doublement des cotisations sociales, pour une réduction des prestations par rapport au maintien du régime autonome.
Les avocats ne sont pas contents. Chose incroyable : ils vont manifester.
En plus des cortèges dans les villes de France, notamment à Paris (j'y étais, c'était vraiment chouette), les barreaux de France votaient des motions de grève : les avocats refuseraient de se présenter en audience. Parfois même, les bâtonniers "frapperaient la barre d'interdit", interdisant à tous les avocats du barreau de plaider.
Twitter étant à son apogée, que rien ne pouvait troubler sinon le rachat par un milliardaire d'extrême-droite, antisémite, aussi mégalomane qu'incompétent, nous apprenions jour après jour que de nouveaux barreaux entraient en grève. C'était la belle époque.
Je me suis alors dit qu'on avait un peu de mal à visualiser quels barreaux étaient en grève, et quels barreaux ne l'étaient pas. Sans le savoir, je me lançais dans la création de mon premier jeu de données.
Les barreaux en grève
Je voulais donc travailler à une visualisation des barreaux en grève, par rapport au total des barreaux de France. Je me disais que j'allais en trouver la liste, puis marquer ceux qui protestaient.
Comme je me leurrais.
J'ai donc cherché partout, pour me rendre compte de l'évidence : il était extrêmement difficile de trouver une liste exhaustive des barreaux d'avocats de France. J'ai finalement trouvé un site du CNB qui en faisait la liste, et sur laquelle j'allais pouvoir travailler.
Je vois que cette liste contient un nombre d'"avocats référencés". Je me dis tiens, ça ne colle pas vraiment avec les chiffres de la profession que j'ai en tête. 5.700 avocates et avocats au barreau de Paris ? C'est peu. Je clique donc, par curiosité, pour voir...
Ah, finalement il y a un nombre d'avocats INSCRITS. Oui, c'est plus cohérent. Tiens, l'adresse de l'Ordre des Avocats est indiqué... Il y a beaucoup d'informations sur cette page. C'est intéressant, je vais garder ça en tête.
Mais pour l'instant, je vais m'en tenir à la liste précédente : j'établis une liste des villes contenant un barreau, je créé une uMap pour les afficher sur une carte, je change les couleurs, et hop, ma liste des barreaux en grève est faite.
Voilà. J'étais pas mécontent de mon résultat. Je mettais ça à jour pendant mes cours (toutes mes excuses à mon directeur de thèse, qui était mon directeur de Master, s'il me lit : j'avais vraiment l'impression d'être utile et de faire partie de quelque chose d'important), et ça plaisait aux gens sur Twitter. Ma mission était remplie.
Puis quelques jours plus tard, je me suis souvenu de ce site, que j'ai mis beaucoup de temps à trouver, mais qui contenait la liste de tous les barreaux de France, les informations, le nombre d'avocats... Et s'il y avait quelque chose à faire avec tout ça ?
La base de données des barreaux
Me souvenant de ma difficulté à trouver une liste des barreaux d'avocats exhaustive, je me suis dit que j'allais alors moi-même, sur la base des données trouvables en source ouverte, créer une base de données.
Problème : je n'y connaissais bougrement rien. Je ne savais pas comment j'allais créer ça, sous quel format, ni où le poster. Après un peu de réflexion, je me suis dit que la création sous tableur, et l'export au format CSV, pourrait être intéressants.
Je me demande donc quelles informations pourraient être intéressantes à faire figurer sur cette base. L'information principale est d'avoir une liste complète des barreaux, bon, certes. L'adresse du barreau ? Le numéro de téléphone ? Pourquoi pas. Le nombre d'avocats inscrits ? Ah oui, carrément, ça pourrait donner des visualisations.
Bon, ça n'allait pas être bien dur. Je commence à faire une liste sommaire... qui me prend un certain temps... beaucoup de temps... Résultat final : il existe 164 barreaux d'avocats en France.
Bon sang. Eh bien allez, au travail.
Devoir naviguer sur un site, cliquer sur une page après l'autre, saisir les informations, vérifier, corriger, passer à la page suivante... c'est excessivement long.
Au fur et à mesure, je me rends compte que deux informations supplémentaires seraient intéressantes : la cour d'appel de ressort, et le site internet.
La cour d'appel, aucun problème. Le site internet, en revanche, je vous prie de croire que c'était une TANNÉE. Il y avait un site internet indiqué sur le site du CNB, pour les barreaux. Je devais alors vérifier si le site existait, s'il fonctionnait, si le nom de domaine n'avait pas expiré et été repris à des fins de cybersquatting, s'il n'existait pas en réalité un autre site mis à jour par le barreau en question...
164 fois. C'était vraiment, vraiment long, comme récolement.
Mais j'ai fini par réussir. Enfin. Après des jours de saisie.
Je vais donc tester un import sur uMap, et... rien ne fonctionne. Ah, bah oui, j'ai saisi les adresses au format lisible par des humains, pas par des machines, forcément. Il fallait que je trouve une solution par rapport à ça.
En même temps que je découvrais le géocodage, je trouvais un formidable site du service public pour le faire : https://adresse.data.gouv.fr/csv. (un jour je vous parlerai de ma passion pour les services numériques développés par les branches de la DINUM, Code Gouv en tête)
Globalement, géocodage sans problème, sauf pour une poignée de barreaux dont l'adresse ne correspondait pas avec celle de la Base Adresse Nationale (cher barreau de Papeete, je vous enverrai la facture du temps que j'ai mis à fixer l'adresse de votre Maison des Avocats). Et quelques manipulations plus tard...
Et voilà, c'était fait. J'avais créé une base de données des avocats de France, qui comportait plein d'informations intéressantes, et mis en place une visualisation des données grâce à uMap.
C'est donc tout fier que j'ai créé un compte sur Data Gouv, et que j'ai posté mon jeu de données. Et que je me suis promis, au vu du travail que ça demandait, de ne pas y retoucher avant un bon moment. (j'ai finalement cédé, et fait une mise à jour fin-2023)
Fun fact : peu après, j'ai reçu une notice de copyright infringement de uMap. Je n'ai jamais bien compris ce qu'on me reprochait, je crois que ça avait à voir avec citer mes sources, mais j'ai trouvé ça un peu extrême, d'autant que j'avais laissé des moyens de me contacter pour me signaler des erreurs. Fort heureusement, la communauté du libre a été à la hauteur de sa réputation : assez hautaine, pas très ouverte aux erreurs de débutant, ni à aider ceux-ci à identifier leurs problèmes pour les aider à les résoudre. C'est donc, armé de leur non-aide, que j'ai essayé de résoudre le problème en ajoutant lapidairement mes sources en description. Il n'y a jamais eu de suite, et je n'ai toujours pas compris mon erreur. Mais pour l'instant, ça tient.