Retour à la liste
  • Articles de blog
  • Collecte de données

La liste des 8 principales sources Open data indispensables !

13 septembre 2023

Open Data

Découvrez les principales sources Open Data auxquelles vous pouvez accéder en ligne

L’avènement de l’ère numérique a apporté avec lui une abondance de données qui sont mises à la disposition du public. Ces données, connues sous le nom d’Open Data, offrent une mine d’informations précieuses et variées pour les chercheurs, les entreprises, les développeurs et le grand public.

Dans cet article, nous explorerons les différentes catégories de données Open Data disponibles en libre accès sur le web, allant des données météorologiques aux données économiques. Chaque catégorie sera illustrée par un exemple concret d’utilisation et accompagnée d’une source pour accéder à ces données.

1. Données Météorologiques

Les données météorologiques sont parmi les plus courantes et les plus largement utilisées en Open Data. En effet, la météo est corrélée à grand nombre d’évènements ou de comportements constatés par bien des métiers : achats d’articles de grande consommation (notamment vêtements ou chaussures), sinistralité ou accidentologie chez les assureurs, réservations de séjours dans les hôtels ou les campings, fréquentation de lieux touristiques (voir notre étude de cas pour le Musée d’Orsay)

Les organismes météorologiques nationaux et internationaux publient régulièrement des informations sur les conditions météorologiques actuelles, les prévisions à court et long terme, ainsi que les relevés historiques.

Ces données sont essentielles pour la planification agricole, la recherche climatique, la gestion des catastrophes naturelles et bien plus encore. Elles sont aujourd’hui très largement utilisées pour des analyses des tendances passées ou par les algorithmes prédictifs (machine learning).

Exemple : Météo France met à disposition en open data les données de climatologie (historique de la météo observée) sur une période longue et sur l’ensemble des stations d’observation Météo France. Elle fournit également les historiques d’alertes de vigilance ainsi que les modèles numériques de prédiction météo.

Source : Météo-France

2. Données Géospatiales

Les données géospatiales fournissent des informations sur la localisation géographique des objets et des événements. Ces données incluent des cartes, des images satellites, des informations sur les frontières administratives, les caractéristiques topographiques et bien d’autres. Elles sont utilisées dans des domaines tels que la navigation, la planification urbaine, la gestion des ressources naturelles et le suivi des catastrophes.

L’intérêt de ces données est qu’elles varient peu dans le temps et donc leur utilisation dans le cadre d’analyses régulières ou de modèles prédictifs ne nécessite pas forcément de mettre en place des mécaniques de rafraichissements réguliers, qui peuvent parfois s’avérer complexes pour qui n’est pas Data Engineer.

Exemple : Le site gouvernemental Géoportail met gratuitement à disposition des plans et cartes et vous permet également de créer vos propres cartes personnalisées.

Source : Géoportail

Autre exemple : le site OpenStreetMap est la plus grande base libre de données géographiques au monde. Elle compte plus d’un million de contributeurs et contributrices.

Source : OpenStreetMap

3. Données de Transport

Les données de transport couvrent une vaste gamme d’informations, allant des horaires et des itinéraires des transports en commun aux données de trafic en temps réel. Ces données permettent d’optimiser les déplacements, de réduire la congestion routière et d’améliorer la planification des infrastructures de transport. De nombreux services ou applications, gratuits ou payants, locaux ou globaux, se basent sur l’exploitation de ces données pour faciliter les mobilités. A tel point qu’un terme technique s’apparentant à ceux désignant les services cloud a émergé pour désigner ces nouvelles offres : Maas pour Mobility as a Service.

La difficulté est que les données de transport sont produites par des instances publiques ou privées, souvent locales, comme les communautés de communes ou les régies de transport et que pour le moment, aucun standard d’harmonisation n’a été défini. L’exploitation n’en est donc pas facilitée même si certaines initiatives ou tentatives d’homogénéisation commencent à émerger, comme le groupe TOMP ou Navitia, cité en exemple.

Exemple : Navitia.io propose une API open source pour intégrer les Open Data de la mobilité à tous vos projets. Par exemple pour connaître les horaires des bus, les retards éventuels et les alternatives de transport.

Source : Navitia

4. Données de Santé Publique

Les données de santé publique offrent un aperçu de l’état de santé d’une population. Elles comprennent des statistiques sur les maladies, les taux de vaccination, les dépenses de santé, les infrastructures médicales et d’autres facteurs de santé cruciaux. Ces données sont utiles pour les chercheurs en santé publique, les professionnels de la santé et les décideurs politiques. Malheureusement, au-delà de la statistique, les données de santé ont une réelle valeur marchande pour les acteurs de ce secteur. La donnée publique ne représente donc qu’une infime part des données de santé, dont la distribution se fait majoritairement par le biais de places de marché, moyennant rétribution. Néanmoins, il est possible de trouver des données publiques comme celles proposées par Santé publique France.

Exemple : Santé publique France met à disposition des données sur les maladies infectieuses, permettant aux chercheurs et aux décideurs de suivre et de gérer les épidémies.

5. Données Économiques

Les données économiques englobent des informations sur les marchés financiers, le chômage, le PIB, l’inflation, le commerce international et d’autres aspects économiques. Ces données sont essentielles pour les analystes financiers, les économistes et les entreprises qui cherchent à prendre des décisions éclairées sur la base de l’état actuel de l’économie.

Exemple : L’Insee propose des données économiques détaillées (France), permettant aux analystes de suivre les performances économiques du pays.

L’INSEE met également à disposition les données sur les communes et notamment des données démographiques, économiques, fiscales et sur les revenus, l’emploi ou encore la santé…

Source : INSEE Communes

Autre exemple : Les données du Registre National des Entreprises (RNE) mises à disposition par l’INPI qui permet d’accéder aux comptes annuels et bilans non confidentiels ainsi qu’aux créations, modifications ou cessions d’entreprises enregistrées.

Source : INPI

6. Données Environnementales

Les données environnementales couvrent des sujets tels que la qualité de l’air, la pollution de l’eau, la biodiversité, les émissions de carbone et les niveaux de déforestation. Elles sont cruciales pour comprendre l’impact de l’activité humaine sur l’environnement et pour élaborer des stratégies de durabilité. Ces données sont de fait de plus en plus nombreuses, organisées et diffusées. C’est d’ailleurs sans doute le type de données le plus appelé à se développer dans un avenir proche au vu des enjeux climatiques auxquels nous sommes confrontés et de l’appropriation que s’en font des acteurs publics, privés ou individuels, de plus en plus nombreux.

Exemple : Le site du Gouvernement Data.gouv.fr propose notamment des données liées à l’environnement. Ce site complet propose également des données en libre accès sur les thèmes suivants : santé, emploi, énergies, démographie, logement et urbanisme, agriculture et alimentation, sécurité…

Source : Data.gouv.fr

Autre exemple : L’ADEME fournit également de nombreuses données, dont des données liées aux déchets, à la pollution, au climat…

Source : ADEME

7. Données Culturelles et Éducatives

Les données culturelles et éducatives incluent des informations sur le patrimoine culturel, les musées, les bibliothèques, les données linguistiques, les performances artistiques et plus encore. Ces données favorisent la préservation culturelle, la recherche académique et l’accès à l’éducation. Ce patrimoine est malheureusement encore mal valorisé, en tout cas en France. Des acteurs privés piochent allègrement et massivement dans ces données pour contribuer à des offres de services commerciaux, typiquement en entraînant des modèles basés sur le deep learning.

Exemple : La Bibliothèque Nationale de France (BNF) offre des données sur ses collections, permettant aux chercheurs et aux passionnés de culture d’accéder à un trésor de connaissances.

Source : Gallica – BNF

8. Données de Recherche Scientifique

Les chercheurs partagent de plus en plus leurs données scientifiques dans le cadre de l’Open Data. Cela englobe des domaines tels que la génomique, l’astronomie, la physique des particules et d’autres disciplines scientifiques. Ces données favorisent la collaboration et accélèrent les avancées scientifiques, et pas seulement au niveau national.

Exemple : Le Centre National de la Recherche Scientifique (CNRS), via sa bibliothèque, met à disposition des données scientifiques dans divers domaines, contribuant à l’avancement de la connaissance.

Conclusion

Un grand nombre de données utiles et utilisables par les entreprises sont aujourd’hui disponibles en libre accès.

De nombreuses plateformes et portails sont disponibles en ligne et gratuitement pour la plupart, mettant ainsi ces trésors d’informations à portée de clic.

Ces données permettent de contribuer à éclairer les prises de décisions et à stimuler la recherche et l’innovation.

Besoin d’être accompagné ?

Vous avez besoin de rassembler toutes vos données et de les enrichir de données open data pertinentes pour votre activité ? Contactez nos experts qui sauront vous aiguiller !

Cabinet de conseil spécialisé dans l’analyse, l’exploitation et la valorisation des données depuis plus de 10 ans.

Nous sommes basés à Montpellier et intervenons sur toute la France.

Siège social : 187 rue Hélène Boucher, 34170 Castelnau-le-Lez