Classement technologique des villes françaises

Tuesday 13 May 2014

This post is in French. You can try to google translate it.

Quitter Paris pour de plus vertes contrées, telle est l'ambition qui habite certains d'entre nous. Mais comme tout ingénieur qui se respecte, il faut planifier minitieusement la relocalisation. Combien de développeurs habitent Tours ? Meetup déçoit car aucun groupe tech n'est constitué. GitHub quant à lui nous indique que 77 développeurs se sont déclarés, dont 6 avec pour langage principal Ruby.

J'ai voulu établir le classement des villes françaises en fonction du nombre d'utilisateurs GitHub, ce qui a rencontré un certain écho sur Twitter le week-end dernier.

Le classement obtenu présentant des limites, je l'ai repris en l'affinant.

Limites

Comme les twittos me l'ont fait remarquer, les résultats obtenus vendredi dernier ont les limites suivantes :

  1. Les agglomérations ne sont pas prises en compte (tant sur la population que sur la recherche d'utilisateurs GitHub)
  2. Un développeur peut ne pas avoir de compte GitHub
  3. Un utilisateur GitHub peut ne pas être un développeur
  4. Les informations de location sur GitHub peuvent être obsolètes, tout comme certains compte ont laissé ce champ vide.

Pour le point numéro deux, je fais l'hypothèse d'une équi-répartition des développeurs n'ayant pas de compte GitHub sur le territoire. Ainsi, cela changera le nombre absolu, mais pas l'ordre des ratios développeur sur nombre d'habitants (le ratio obtenu est alors une borne minorante du ratio réel). Concernant le point numéro trois, je pense qu'on peut appliquer le même argument. Finalement, le point numéro trois ne nous trouble pas trop car on peut supposer qu'a priori le taux d'informations obsolètes est équitablement réparti sur toutes les villes.

Le point numéro un nécessite un peu plus de travail.

Méthodologie

Wikipedia nous donne généreusement la liste des villes les plus peuplées. Elle m'a servi à établir le premier classement. À partir de cette liste, on peut explorer chaque ville pour voir à quelle communauté de communes elle est rattachée. Enfin, pour chaque communauté de communes, on récupère la liste exhaustive de toutes les communes la composant.

Ce travail a été réalisé de manière semi-automatique car les pages Wikipedia des communautés de communes ne suivent pas toutes le même patron. Vous pouvez consulter cette base de données des communautés de communes.

Ensuite, pour chaque ville, il faut demander à GitHub le nombre d'utilisateurs déclarés. On obtient cette liste qui nécessite un retraitement manuel. En effet, Orléans sort un trop grand nombre de résultats en raison de l'existence de la ville de New Orleans, Louisiane.

Il reste maintenant à aggréger les résultats par métropole. Voici le classement.

Top 20

Agglomération # GitHub Population Dev / 1000 habitants
1 Paris 7895 2249975 3.51
2 Nantes Métropole 642 582159 1.1
3 Grenoble Alpes Métropole 484 444810 1.09
4 Toulouse Métropole 774 714332 1.08
5 Montpellier Agglomération 429 423842 1.01
6 Rennes Métropole 396 413953 0.96
7 Grand Lyon 1134 1306972 0.87
8 Bordeaux Métropole 570 727256 0.78
9 Strasbourg 307 473187 0.65
10 Grand Nancy 153 256966 0.6
11 Région de Compiègne 43 74000 0.58
12 Plateau de Saclay 70 121276 0.58
13 Levallois-Perret 37 64629 0.57
14 Lille Métropole 630 1112470 0.57
15 Brest métropole océane 114 206893 0.55
16 Le Mans Métropole 95 197953 0.48
17 Annecy 66 140865 0.47
18 Pau-Pyrénées 60 150539 0.4
19 Métropole Nice Côte d'Azur 200 538613 0.37
20 Sophia Antipolis 64 176933 0.36

Si votre agglomération n'est pas dans le top 20, consulter la liste des 180 agglomérations sur GitHub.

Discussion

Paris a un ratio sensiblement plus élevé. Outre la concentration d'emplois dans le numérique, on peut tenir du raccourci qui consiste à indiquer "Paris" pour les habitants de la petite couronne. À l'heure où les villes candidatent pour le label FrenchTech, ce classement anticipe sans doute sur l'issue des délibérations.

N'hésitez pas à ouvrir une Pull Request sur ssaunier/github-french-cities. Vous pouvez également réexploiter le code / les données, ils sont placés sous license MIT. Merci à tous pour vos retours sur Twitter ! Et merci à @yannski pour la relecture :)

Photo credit: Terence S. Jones

Would you like to learn programming? I am CTO of Le Wagon, a 9-week full-stack web development bootcamp for entrepreneurs, and would be happy to have you on board!

comments powered by Disqus