Les Open Data, synonymes de performance ?

Date de la dernière modification : 9 novembre 2020

Les Open Data, synonymes de performance ?

Les Open Data, c’est quoi ?

Une donnée en Open Data, ou donnée ouverte, est une donnée à laquelle vous pouvez avoir accès sur Internet, que vous pouvez utiliser et partager librement.

Pour une organisation ou une entreprise, l’Open Data consiste à donner accès à une partie de ses données sur Internet, à ses clients et partenaires, ou encore à ses prospects. Ainsi, sans le savoir, vous en avez sûrement déjà utilisées pour une étude de marché ou un projet d’entreprise.

Pourquoi utiliser des Open Data ?

Ce qui fait des Open Data des données très particulières, ce sont leurs caractéristiques peu contraignantes !

Tout d’abord, ces data sont accessibles par n’importe quel utilisateur sur Internet. Vous pouvez dès aujourd’hui télécharger directement des données ouvertes, et ce, sans enregistrement préalable ou échange de coordonnées.

Vous pouvez aussi réutiliser et exploiter gratuitement ces données. Leur licence est ouverte, ce qui signifie que vous pouvez les utiliser librement. Que vous soyez un particulier ou une entreprise, vous n’êtes soumis à aucune restriction. Vous êtes libres d’utiliser, de modifier, de combiner et de partager ces données quels que soit les usages, même à des fins commerciales !

En clair, ces data sont publiées pour vous ! C’est une réalité, les Open Data sont disponibles sur Internet pour que le plus grand nombre puisse en tirer un bénéfice.

 

Peut-on réutiliser ces Open Data pour l’activité de son entreprise ?

Bien sûr ! Quel que soit votre secteur, votre taille, votre chiffre d’affaires, tout le monde peut exploiter ces données pour son activité professionnelle. Par exemple :

  • Une administration ou collectivité locale qui enrichit ses propres données avec d’autres données ouvertes.
  • Une entreprise qui collecte ces données ouvertes pour son système d’information ou pour développer un nouveau service.
  • Une équipe marketing qui récupère ces données ouvertes afin de réaliser un Benchmark par exemple.
  • Des développeurs ou des éditeurs de logiciels pour créer des API et applications.
  • Les possibilités sont infinies !

Comment les Open Data peuvent-elles créer de la valeur pour les entreprises ?

De plus en plus d’entreprises voient en l’ouverture des données sur Internet l’opportunité de créer de la valeur. Les Open Data représentent désormais une mine d’or pour les entrepreneurs et les chefs d’entreprises qui souhaitent créer de nouveaux usages, services, applications ou croiser leurs jeux de données existants.

En effet, avec l’Open Data, de réelles opportunités business apparaissent ! Dès aujourd’hui, vous pouvez tirer profit de l’Open Data afin de développer de nouveaux produits ou services innovants. Les Open Data permettent également de collecter des informations utiles pour vos benchmarks et vos études de marché. Exploiter des données ouvertes peut ainsi vous aider à établir une stratégie d’entreprise solide, à booster votre développement commercial et à vous différencier de vos concurrents.

L’Open Data vous donne aussi l’opportunité de créer de la valeur avec vos clients ! Vous pouvez améliorer votre relation client en ouvrant l’accès à vos données en ligne. Vos clients peuvent obtenir les réponses à leurs questions en self-service à partir de votre site internet par exemple. Vous réalisez ainsi des économies sur vos services de support et vous améliorez votre satisfaction client !
 

Comment l’Open Data contribue aujourd’hui à un meilleur pilotage des entreprises ?

Il est possible aujourd’hui de mettre les Open Data au profit de votre entreprise, en optimisant le pilotage de votre entreprise. Notamment grâce aux outils de Data Visualisation !

Qu’est-ce que c’est ? La Data Visualisation, c’est l’art de présenter les données dans un format visuel compréhensible et attractif, qu’il s’agisse de graphiques, de cartographies ou d’infographies. L’enjeu est d’exploiter tout le potentiel de vos données afin d’aider vos métiers à mieux comprendre des informations complexes et à prendre de meilleures décisions stratégiques.

Tout l’intérêt de l’Open Data réside dans le croisement de plusieurs jeux de données. De plus en plus, les métiers des services informatiques s’outillent et montent en compétence pour pouvoir nettoyer, intégrer et mettre en forme des données ouvertes pour optimiser le pilotage de leur entreprise. Il existe pour cela de nombreux outils comme PowerBIQlikView et Tableau pour avoir des tableaux dynamiques et interactifs. Ces outils sont notamment très appréciés pour leur expérience utilisateur !

 

Comment l’Open Data vous aide à en savoir plus sur votre marché et vos clients ?

Connaître son marché et ses clients est aujourd’hui un enjeu marketing important pour toute entreprise. Cette connaissance est la clé d’une stratégie marketing réussie. Et si on vous disait que l’Open Data peut vous aider à faire ça ?

Pour vos benchmarks, l’Open Data est une source précieuse de données sur les marchés, les clients concernés, les secteurs d’activité, la conjoncture économique par région. Vos études de marché pourraient bien bénéficier d’un haut niveau d’information, vous permettant d’améliorer votre business model et votre marketing mix. Et ce, à moindre frais ! Plus besoin d’acheter des informations chez un fournisseur privé, les données ouvertes sont à vous en un seul clic !

L’Open Data peut également contribuer à l’optimisation de vos performances marketing en vous offrant une connaissance précise de vos clients et de leurs besoins. Les données ouvertes peuvent aider à optimiser votre segmentation client et à réaliser des opérations marketing et commerciales ciblées. De plus en plus de lieux touristiques souhaitent, par exemple, croiser leurs jeux de données clients avec des Open Data sur la météo et les vacances scolaires pour approfondir leur segmentation et ajuster leurs offres en fonction des saisons.

Vous souhaitez faire la même chose pour votre entreprise ? Ces plateformes d’Open Data peuvent vous aider : data.gouv.frdata.europa.euopendata.paris.frdonneespubliques.meteofrance.fr.

Vous l’aurez compris, l’Open Data est le nouvel El Dorado des entreprises. Faciles d’accès, gratuites et génératrices de valeur… Autant d’avantages qui attirent les entreprises aujourd’hui ! Que ce soit pour développer un produit innovant, pour améliorer le pilotage de votre entreprise, ou encore pour votre stratégie marketing, l’Open Data est une opportunité à saisir.

Ces données ouvertes pourraient bien vous aider à traiter vos enjeux métiers et à établir des stratégies solides pour booster votre performance. Les Open Data n’attendent plus que vous pour révéler leur potentiel !

 


 

Cet article a attiré votre attention et vous souhaitez vous aussi mettre à profit le potentiel de vos données pour votre entreprise ? 
Nous pouvons vous aider à identifier comment vos données peuvent doper votre performance !

Découvrez le Diagnostic PME Data Driven!

background

Que faut-il savoir des données collectées sur le web ?

Date de la dernière modification : 10 novembre 2020

Datasulting – DPO Consulting : un Café innovation​ autour de l’exploitation des données dans le respect de la RGPD

 

La Factory Valorisation des données de Montpellier vous dit tout !

Pour marquer le lancement de la Factory Valorisation des données de Montpellier, Datasulting et MSP Avocats ont joint leurs expertises pour un « atelier déjeunatoire » en partenariat avec Digital 113 à Cap Oméga, le 3 mars dernier. Ce fut l’opportunité d’étudier un sujet qui intéresse de plus en plus d’entreprises en Occitanie, comme partout en France : la collecte et la valorisation des données accessibles sur Internet.

 

A leur arrivée, les participants ont pu rencontrer les intervenants dans les locaux de Digital 113. En préambule de cet atelier, Gaël PHILIPPE, CEO chez Datasulting, a pris le temps de présenter la Factory Valorisation des données. Il s’agit d’un groupe de travail thématique créé par Digital 113 et piloté par ses adhérents. La Factory Valorisation des données de Montpellier est ainsi née de la volonté de rassembler les sociétés locales actives dans la valorisation des données et tous ses aspects juridiques. L’ambition est de se réunir une fois par mois à l’occasion d’un atelier collectif ou d’un projet collaboratif pour les membres.

C’est donc tout naturellement que Datasulting et MSP Avocats ont souhaité aborder le sujet de la collecte et de l’exploitation des données disponibles sur le web pour cette première édition.

 

L’objectif était de donner un cadre juridique à l’opération de collecte des données, de préciser les bonnes pratiques à adopter lors de l‘exploitation des données et d’expliquer dans quelle mesure ces données constituent de véritables gisements de performance pour les entreprises.

En première partie de cette intervention, Marie SONNIER-POQUILLON et Alphonse BERNARD, avocats, membres du MSP Avocats, spécialisé dans la propriété intellectuelle et les nouvelles technologies ont expliqué dans quelles conditions les données étaient susceptibles d’être juridiquement protégées à l’heure actuelle.

 

Cette première partie fut rythmée par des échanges interactifs avec les entreprises présentes, avant de poursuivre sur une présentation des technologies du « scraping ». Il s’agit d’une technique de récupération de contenu à partir de sites internet de manière automatisée à l’aide d’un programme informatique. Celle-ci tend à se développer et permet d’enrichir des bases de données avec des informations accessibles sur Internet. Cet exposé s’est poursuivi par une présentation de ce que nous appelons communément les « données ouvertes » ou « Open Data » qui, juridiquement, sont des données administratives que les institutions publiques souhaitent rendre plus ouvertes.

 

 

Pour donner aux participants une vision concrète, Yann FINCK, CTO chez Datasulting, a donné des exemples d’utilisation appliquées au marketing et au commerce tirés de cas clients. MSP Avocats n’a pas manqué de mettre en lumière les éléments juridiques à respecter en lien avec les lois en vigueur et le RGPD, notamment la récupération automatisée de données et la prospection.

La collecte et l’exploitation de ces données disponibles sur Internet peuvent ainsi contribuer à :

  • L’automatisation de veilles tarifaires 
  • L’optimisation du démarchage de prospects 
  • L’affinement du ciblage en BtoB 

 

Ce premier événement a été l’opportunité pour Datasulting et MSP Avocats de confronter les perspectives d’utilisation des Open Data et les aspects juridiques à ne pas négliger. Conclusion ? S’il est techniquement possible de récupérer du contenu ouvert à partir de sites web de manière automatisée et si la pratique largement répandue, elle n’est pas nécessairement exempte de reproches au plan juridique. Dans les faits, la règlementation est encore en construction et il convient d’apprécier chaque situation au cas par cas pour pouvoir se positionner.

En particulier, l’utilisation et l’exploitation des données suppose que l’on respecte les droits d’auteur et la réglementation protégeant les bases de données. Par ailleurs, lorsque l’on réutilise des données administratives ouvertes en Open Data, il convient de prendre garde à ne pas altérer les informations, d’indiquer la source et de vérifier les conditions de licence proposées pour chaque type de données. Et, dans tous les cas, il ne faut pas oublier de respecter le RGPD.

Cette première édition a réuni une vingtaine de participants chefs d’entreprise, DSI et data scientists et les retours sont très positifs ! Pour prolonger ce succès, la Factory Valorisation des données de Montpellier a pris l’initiative d’organiser un nouvel événement sur les outils décisionnels. Les experts de Datasulting, Flutilliant et d’Avizzeo confronteront leurs points de vue sur les avantages et les limites des outils Power BI, Qlik et bien d’autres. Plus d’informations à venir dans les prochaines semaines, restez connecté(e) !

 

Découvrez tous les résultats de l’étude : cliquer ici

Cette enquête est une première étape vers la création d’un observatoire de la maturité Data des entreprises de notre région, construit avec nos partenaires.

background

Machine Learning avec R et Prédictions

Date de la dernière modification : 10 janvier 2021

Machine Learning avec R et Prédictions

Le « Machine Learning », ce terme que l’on entend partout, tout le monde en parle, tout le monde le veut, ça a l’air d’en faire rêver plus d’un ! Mais qu’est-ce que c’est au juste ? Pourquoi tant d’engouement ces dernières années pour cet « Apprentissage Machine » ? Et puis, à quoi ça sert au juste ? En ai-je besoin pour mon entreprise ? Tant de questions autour d’un concept.

 

Le Machine Learning est une branche de l’Intelligence Artificielle qui se base sur des méthodes statistiques et des algorithmes pour permettre aux machines (les ordinateurs) d’apprendre des données structurées du passé pour prédire, classifier ou détecter.

Quel en est le principe ? Si le terme « Machine Learning » a été introduit à partir de 1959 par Arthur Samuel, le principe sous-jacent est simple et prend ses bases théorique au XIXème siècle : entraîner un modèle sur des données historiques : ce qu’on appelle « l’apprentissage » et l’appliquer sur les nouvelles données : ce qu’on appelle « la prédiction ».

Qu’est-ce que le Machine Learning ?

Mais puisque le concept existe depuis aussi longtemps, pourquoi cet effet de mode ces dernières années seulement ? Et bien, trois révolutions se sont opérées en même temps et ont permis l’avènement du Machine Learning tel qu’on le connaît aujourd’hui :

  1. La puissance de calcul des processeurs : Avec la miniaturisation et l’effet d’échelle de la production industrielle, la puissance de calcul disponible à prix constant n’a cessé de s’accroitre depuis l’avènement de l’informatique à un rythme exponentiel : x10 tous les 5,5 ans (Nordhaus). Les machines sont capables d’apprendre plus vite et pour moins cher.
  2. La digitalisation des processus : Grace à la digitalisation de l’économie, le nombre d’informations numériques (Données) générées par les systèmes d’informations croit exponentiellement (+35% par an entre 2000 et 2020). Or, plus un modèle prédictif dispose de données pour apprendre, meilleures sera sa précision. De plus le coût de leur stockage est faible (~18€/To/mois) et les technologies de stockage plus adaptées facilitent l’exploitation des données à moindre coût.
  3. La démocratisation des connaissances : Il y a quelques décennies, seuls les grands de ce monde maîtrisaient les systèmes et les outils de traitement du Machine Learning : IBM, Intel pour ne citer qu’eux. Aujourd’hui, les technologies sont disponibles gratuitement et pour tous grâce à l’Open source et les leaders du secteur partagent leur effort de R&D en open source. (Exemple : Tensorflow partagé par Google en 2015, pyTorch en 2016 et Prophet en 2018 par Facebook).

Qu’est-ce que les prédictions peuvent apporter à mon business ?

Quand on parle de prédictions, il s’agit d’estimer à un horizon donné, la probabilité d’un événement ou le niveau d’un indicateur en étudiant des données passées. C’est pour cela que le Machine Learning est applicable à de nombreux domaines, souvent centré sur les clients mais pas seulement : Prédictions de vente, de demande, d’affluence, de trafic, mais aussi de fraude, de publicité ciblée…

Quel que soit le métier et tant qu’on a des données en quantité et diversifiées, on peut faire du Machine Learning et prédire l’avenir proche ou plutôt estimer l’avenir avec un niveau de précision maitrisé, qui peut être assez fin si on a beaucoup de données explicatives et si le processus est prévisible ou régulier. Ces prédictions permettent entre autres d’optimiser la gestion de l’entreprise, en prenant des décisions appuyées sur de meilleures anticipations.

 

Quels outils choisir ?

Du fait du développement récent de cette discipline et du foisonnement open source, de nombreux outils existent et prolifèrent : R, Python, H2O, DataIku, SAS, Matlab, Stata, SPSS, Java, Keras, Tensorflow… Et il est parfois difficile d’y voir clair.

Ces outils ne sont pas comparables : chaque outil a ses applications. Concernant les prévisions dans une approche open source, gratuite (Licence GPL) et ouverte, 2 langages adaptés aux analyses statistiques et au Machine Learning se sont imposés : Python et R.

Python est un langage de programmation plus généraliste, qui pourra être utilisé également pour d’autres tâche de programmation informatique. De fait, il est plutôt dédié à des utilisateurs disposant d’une orientation de programmeur. L’essor de Python dans la data science est récent (2016) et il dispose de moins de bibliothèques d’algorithmes « historiques » que R, mais il a su s’imposer en 3 ans comme un outil incontournable, notamment dans le domaine du deep learning.

R est un outil dédié initialement aux statisticiens qui existe depuis 1993 et dont le développement a été fortement accéléré dès les années 2000. Il dispose de la plus grande richesse fonctionnelle, est plus simple à utiliser pour un acteur statisticien ou métier mais son positionnement « Utilisateur » le rend plus complexe à industrialiser.

 

Pourquoi choisir R ?

Tout d’abord, nous considérons que l’aspect open source d’un outil de Machine Learning est un prérequis important car il prémunit contre les limitations des outils « propriétaires », dont le modèle de licence est souvent basé sur le volume de données ou la capacité du processeur, ce qui est un facteur extrêmement préjudiciable pour une activité qui a besoin d’une très grande puissance … mais très rarement. Ce qui guide naturellement vers l’utilisation de R ou Python.

Le choix entre R ou Python est un arbitrage lié à la richesse fonctionnelle (R disposant de plus d’algorithmes notamment sur les aspects de série temporelle), au caractère innovant (Python est actuellement plus actif en termes de développement) et au profil des utilisateurs (R convient mieux aux acteurs métier, là ou Python correspond mieux aux attentes des développeurs informatiques) ou au domaine d’étude (le Deep Learning impose l’utilisation de Python, alors que le machine learning est réalisable avec les 2 outils).

 

Se former avec Datasulting ?

L’Intelligence Artificielle, le Big Data & la digitalisation impactent aujourd’hui en profondeur les métiers et fonctions des entreprises. Ils sont les nouveaux enjeux de l’entreprise moderne et vecteurs de performance !

C’est pourquoi Datasulting, cabinet de conseil en valorisation des données, accompagne la performance des entreprises par l’exploitation du potentiel de leurs données depuis 2013. Son positionnement unique de « copilote des entreprises Data Driven » s’appuie sur plus de 15 ans d’expérience de ses associés fondateurs dans la Data, le Digital et le Retail, sur une méthodologie inspirée des plus grands cabinets de conseil et sur les dernières technologies en matière de Data Science et de Machine Learning.

Si vous souhaitez en savoir plus sur le Machine Learning avec R, Datasulting propose des formations régulières sur le sujet « Apprendre le Machine Learning avec R), soit en groupe, soit en entreprise, n’hésitez pas à contacter grâce au formulaire si dessous.

 


 

Cet article a attiré votre attention et vous souhaitez vous aussi mettre à profit le potentiel de vos données pour votre entreprise ?
Nous pouvons vous aider à identifier comment vos données peuvent doper votre performance !

Découvrez le Diagnostic PME Data Driven!

background