data-gouv

Données françaises ouvertes réutilisables

En France, l’État met à disposition de nombreuses bases de données en open-data ou données ouvertes. Ces données sont réutilisables et chacun peut les utiliser et les valoriser. Au total, il s’agit de plus de 40000 bases de données et de plus de 230000 ressources émis par 3600 organisations. Ces données sont publiées volontairement ou parce que la loi l’exige.

Les bases de données disponibles se trouvent sur data.gouv.fr. Les jeux de données sont regroupés par catégories (élections, géographique, logement, emploi, sécurité, santé, comptes publics, associations…). On retrouve aussi les données dites de référence :

  • Base de données des adresses BAN (Base Adresse Nationale)
  • Base de données Sirene des entreprises SIREN, SIRET (entreprises + établissements)
  • Base de données géographique officielle COG (Code Officiel Géographique)
  • Cadastre, base de données RPG (Registre parcellaire graphique) et RGE (Référentiel à Grande Échelle)
  • Base de données des institutions et administrations
  • Base de données des associations RNA (Répertoire National des Associations)
  • Base de données des métiers ROME (Répertoire Opérationnel des Métiers et des Emplois)

Un puissant outil de recherche et de filtre permet d’affiner les recherches : par organisation, par mot-clé, par format, par couverture et granularité spatiale, par licence, par schéma.

Chaque jeu de données est décrit en détail. On peut télécharger les fichiers contenant les données et consulter les réutilisations réalisées. Beaucoup de fichiers sont facilement exploitables (CSV, XML, Json, tableurs) et sont régulièrement mis à jour. Des formats plus spécifiques notamment pour les systèmes d’informations géographiques sont présents. Certaines données sont accessibles via API ou webservices.

Les données ne contiennent pas d’informations personnelles et les acteurs qui publient des données sont encouragés à proposer des schémas de données permettant l’interopérabilité et les croisements avec d’autres jeux de données.