L’ouverture du répertoire SIRENE par l’INSEE au 1er janvier 2017, une avancée majeure pour l’open data

Le mardi 12 janvier, Axelle Lemaire a organisé à Bercy le #DataDay, une conférence débat sur la stratégie d’open data pour le développement de l’économie de la donnée, en présence de start-ups et grandes entreprises. Etaient notamment présents Data Publica et SNIPS, deux anciens lauréats du concours Dataconnexions. La Secrétaire d’État chargée du Numérique a saisi l’occasion pour annoncer l’ouverture gratuite, en open data, du répertoire SIRENE, géré par l’INSEE, à compter du 1er janvier 2017. L’ouverture de ce registre de référence devrait ouvrir des opportunités nouvelles pour le tissu économique, tant les possibilités de réutilisation et de croisement de ces données, sont importantes.

« Le répertoire SIRENE » : la plus grande base de données existante sur l’état-civil des entreprises

Le répertoire SIRENE rassemble des informations économiques et juridiques relatives à environ 10 millions d’entreprises et d’établissements, quel que soit leur secteur d’activité, situés en métropole ou dans les départements d’outre-mer. En moyenne, 10 000 modifications par jour sont enregistrées dans le répertoire. L’INSEE travaille avec de nombreux organismes, comme les greffiers des tribunaux de commerce, qui récoltent les informations sur les immatriculations, les radiations et les modifications au répertoire. Les données de la base SIRENE, parmi les plus complètes au monde, comprennent des données d’identification et des données économiques essentielles, notamment  :

  • L’adresse des établissements et leur statut juridique;
  • Le numéro SIRET/SIREN : Le numéro SIREN est le numéro d’identification unique attribué à chaque entreprise par l’INSEE, ce numéro sert à identifier la personne juridique de sa création à sa dissolution. Le numéro SIRET est attribué à chaque établissement, il est composé du numéro SIRET de l’entreprise et un numéro interne de classement (NIC). Avec ces deux codes, tous les établissements en France sont identifiés;
  • Le code APE : Toute entreprise et chacun de ses établissements possède un code caractérisant son activité principale par référence à la nomenclature d’activités française Ce code permet des statistiques très précises sur la répartition des secteurs en France;
  • La base de données des effectifs par tranche pour les entreprises et les établissements…;

Parce qu’elles sont susceptibles d’une utilisation fréquente par un grand nombre d’acteurs tant publics que privés et parce que leur qualité est essentielle pour ces utilisations, le répertoire SIRENE est susceptible de contribuer aux données de référence, au sens du projet de loi pour une République Numérique en discussion au Parlement.

Un impact économique majeur

Tous les acteurs, privés (entreprises, associations…) comme publics (administrations, collectivités territoriales…) pourront ainsi y accéder gratuitement. L’ouverture de ce répertoire enrichira la liste des données déjà mise en open data par l’INSEE, qui compte parmi les plus grands fournisseurs de données sur data.gouv.fr. Elle viendra compléter la mise à disposition des données relatives aux entreprises produites par la DILA (Boamp, Bodacc et Balo), l’INPI (marques, brevets et dessins), Infogreffe, ainsi que celles du Registre National du Commerce et des Sociétés (RNCS). 

L’impact économique attendu s’annonce majeur grâce aux externalités positives associées à cette ouverture : mise à disposition de données pivot, fiabilisation d’études et d’estimation de potentiels de marché, efficacité des politiques publiques…

En ouvrant ces données, la France honore ses engagements pris dans le cadre de la Charte Open Data du G8, et pourrait ainsi devancer – grâce à la qualité et à la complétude de la base – le groupe des pays les plus en pointe ayant déjà ouverts leurs registres des entreprises, dont le Royaume-Uni, l’Australie, l’Indonésie, la Norvège ou la Roumanie. Plus largement, de nombreux exemples démontrent les effets attendus [1] d’une plus grande ouverture des données publiques:

  • une progression très nette de la réutilisation des données, tant en nombre et diversité de réutilisateurs que de fréquence d’usage. En France, le passage à la gratuité du Référentiel à grande échelle de l’IGN pour les acteurs chargés d’une mission de service public s’est traduit par une multiplication par 20 de l’usage des données,
  • un rapport coûts / bénéfices très favorable, tant pour le secteur public que privé – de 1 à 13 pour les données géo spatiales australiennes, parmi les premières à être ouvertes dès 2006,
  • une dynamisation du marché aval des services fondés sur les données, avec l’apparition de nouveaux acteurs et une incitation plus forte à innover pour les acteurs historiques. Aux Etats-Unis, la décision du National Oceanic and Atmospheric Administration (NOOA) d’ouvrir leurs données a permis la création d’une industrie météorologique qui pèse aujourd’hui plusieurs milliards de dollars dans l’économie américaine [2],
  • une réduction des coûts de transaction et de l’asymétrie d’information dont les bénéfices concernent tout autant les acteurs publics que privés. Le Danemark a ainsi calculé que 70% des bénéfices de l’ouverture des données d’adresses revenaient au secteur privé et 30% au secteur public, pour un retour sur investissement de 14 millions € de bénéfices contre un coût de 0,2 million € en 2010 [3],
  • une lutte accrue contre la corruption et la fraude fiscale par la réduction des asymétries d’information. Au Canada en 2010, une fraude fiscale de 3,1 milliards de dollars a pu être identifiée grâce aux données ouvertes [4]. En Ukraine, une fraude d’un 1.8 milliards de dollars a également été détectée [5].

[1] Voir « Open Data for Economic Growth » (World Bank, 2014) et « The Generative Mechanisms of Open Government Data » (Jetzek Thorhildur, 2013), « Cost and benefits of data provision » (Victoria University, 2011).

[2] http://www.nytimes.com/2008/07/07/business/media/07weather.html?_r=0

[3] http://www.adresse-info.dk/Portals/2/Benefit/Value_Assessment_Danish_Address_Data_UK_2010-07-07b.pdf

[4] http://eaves.ca/2010/04/14/case-study-open-data-and-the-public-purse/

[5] http://rue89.nouvelobs.com/2015/11/02/demandez-a-quoi-sert-lopen-data-allez-voir-ukraine-261916

Source : ADEC - Open data