L’open data comme levier stratégique

Date de la dernière modification : 14 décembre 2020

L’open data comme levier stratégique

Libre d’accès sur Internet, utilisée et partagée par tous, l’open data est particulièrement utile aux entrepreneurs, sans contrainte de domaine d’activité et à la tête d’une structure de n’importe quelle taille, car elle est une vraie mine d’or en matière d’informations. Explications.

En entreprise, l’open data sert à nourrir vos bases de données avec des informations impossible à générer ou obtenir autrement. Une partie de celles-ci peut être partagée à vos clients, partenaires ou prospects sans payer. Par exemple, diffuser en temps réel vos informations concernant les stocks de matières premières avec vos fournisseurs peut être intéressant pour éviter les ruptures d’approvisionnement. Autre exemple, l’un de nos clients cherchait une solution pour réduire le temps d’attente de ses visiteurs munis de billets achetés en ligne. L’open data a permis de déterminer une liste de facteurs qui influencent la fréquentation de leur cible, tels que la météo ou les événements concurrents pour comprendre les variations d’affluence. Une fois ces informations collectées, le client a pu les croiser avec ses propres informations (nombre de billets vendus par jour, lancement de nouveautés, etc.). Sur la base de ces données enrichies, il a pu simuler la fréquentation de son établissement en fonction de ces critères d’influence, réaliser des projections à l’aide de méthodes de Machine Learning et optimiser son organisation pour améliorer la prise en charge des visiteurs.

Pour en savoir plus

Comment accéder à l’open data ?

Trois possibilités s’offrent à vous :

  • Les communes, les agglomérations, les régions, etc. Elles incitent à les utiliser pour proposer aux citoyens des expériences plus précises, adaptées à leurs besoins au travers d’usages digitaux.
  • Les institutions nationales, comme sirene.fr, pour collecter des données assez riches sur les entreprises ou l’Insee, pour affiner les connaissances d’un marché, d’un client ou d’un prospect et agir en conséquence.
  • Les grands groupes, comme la SNCF ou l’aéroport de Paris. Elles ne sont pas directement exploitables, un retraitement est nécessaire.

Comment la traiter ?

Il est important d’anticiper la collecte de l’open data et évaluer sa pérennité. L’aide d’un expert ou d’un cabinet de conseil spécialisé peut, dès lors, s’avérer utile dans le traitement et la valorisation des données. Ce traitement implique une phase de nettoyage, voire de réorganisation des informations collectées. Ces dernières deviendront exploitables après une préparation minutieuse et un enrichissement optimal.

Les risques inhérents à la donnée en libre accès

Pensez toujours à vérifier la sécurité de vos sources données et restez prudents lors du téléchargement. Un seul cyber-risque peut mettre en danger votre entreprise. Un article instructif a été réalisé à ce sujet par Hiscox

L’open data est une clé pour comprendre les habitudes et attentes de vos clients. L’associer aux données de votre entreprise nourrit votre vision stratégique et peut transformer le tout en opportunités d’affaires.

 


 

Réalisez un diagnostic de votre potentiel Data.

Datasulting aide les entreprises à se confronter à ces enjeux et à dépasser leurs freins. Notre offre d’accompagnement comme le diagnostic PME Data Driven permet d’obtenir rapidement un état des lieux sur l’utilisation de vos données, de répondre à vos questions Métier et de révéler tous vos potentiels. La prestation est éligible à un financement à hauteur de 50% de la BPI.

Faites le test d’éligibilité !

 

background

Premiers pas pour découvrir son potentiel Data

Date de la dernière modification : 6 novembre 2020

Premiers pas pour découvrir son potentiel Data

Selon une estimation de Datasulting, exploiter des données engendre en général entre 2% et 10% de marge supplémentaire en fonction de la maturité de l’entreprise sur ce sujet. Pourquoi passer à côté de cette opportunité ? A l’heure où de nombreuses PME et ETI repensent leurs activités, leurs modèles économiques et leur organisation, les données apportent des éclairages nécessaires pour effectuer des choix stratégiques. Oui, mais comment s’appuyer sur la Data pour générer de la performance ?

Qu’est-ce qu’une stratégie « data driven » ?

C’est un sujet plus que jamais d’actualité : de plus en plus de données sont disponibles dans les entreprises, et pour certaines, les exploiter est un avantage compétitif incontournable. C’est le cas en particulier pour les secteurs BtoC, de services financiers et industriels qui cherchent à mieux toucher leurs cibles commerciales et à gagner en efficacité dans leurs processus de production.

En Français, l’expression « Data Driven » peut se traduire par « être guidé par les données ». Pour Datasulting, tout ce qui se mesure s’améliore. La stratégie Data se définit par la capacité à croiser ses données et à exploiter des indicateurs transversaux pour avoir une compréhension fiable et complète de ses activités. Elle implique une vision et intégration complète des outils, compétences, processus et technologies, au service de la création de valeur par la mise à profit des données.

Cette stratégie Data Driven permet ainsi de réaliser des cas d’usage qui contribuent à l’amélioration de la performance de l’entreprise : proposer au client le produit qui lui plait, prédire le nombre de commandes, anticiper le nombre d’appels au call center…

A quels enjeux peut répondre la valorisation des données ?

Ces enjeux sont multiples. En croisant toutes vos données, vous verrez véritablement l’agilité d’une stratégie data driven et vous pourrez profiter des opportunités suivantes :

  • Développer le chiffre d’affaires en ciblant et personnalisant au mieux les réponses que vous apportez à vos clients pour satisfaire leurs besoins, ainsi qu’en optimisant les investissements marketing.
  • Piloter votre entreprise avec une vision globale, facilitant la prise de décisions. Par exemple, réduire les campagnes marketing quand la production est saturée ou encore ajuster le prix de vente ou les promotions selon les stocks.
  • Gagner du temps en améliorant la performance de vos processus et en automatisant des tâches répétitives. Vos équipes qualifiées perdront moins de temps à préparer des tableaux de bord, qui pourront être réalisés par des intelligences artificielles. Vous gagnerez aussi dans la fiabilité de vos analyses.
  • Prévenir les risques. Vous pourrez anticiper et comprendre les failles dans vos processus. Par exemple, prédire des défauts de paiements, les anomalies dans la production, les fraudes ou encore les futures pannes.
  • Gagner en efficacité : en anticipant plus finement la demande des clients, vous pourrez prévoir votre plan de production, anticiper l’achat des matières premières et dimensionner vos équipes de vente (grands magasins et call center par exemple).

Grâce aux données, le champ des possibles est infini mais vous aurez toujours une certitude : vos décisions seront factuelles, réfléchies et mesurées.

Comment repérer les données utiles ?

Quand on parle de données utiles, ce sont les données créatrices de valeur, au cœur de vos métiers, qui vont vous permettre d’améliorer le fonctionnement de votre entreprise.

On peut les diviser en deux catégories. Pour les entreprises qui ont beaucoup de clients, les données utiles portent sur les interactions avec ses clients, afin de mieux les connaitre, proposer une expérience personnalisée et prédire leurs besoins et leurs achats. Les entreprises BtoB ou industrielles s’intéresseront plutôt aux tâches nombreuses et automatisées, afin d’optimiser leurs processus de production.

Pour savoir si elles sont exploitables, c’est une autre affaire. Vous ne pouvez pas le savoir avant de les utiliser, même si d’expérience certaines données sont plutôt faciles d’utilisation (comptabilité, factures, commandes) et d’autres souvent plus complexes à analyser tant qu’elles ne sont pas utilisées (notamment les données client).

Attention à garder en tête les directives du RGPD (retrouvez notre article sur le sujet), sur les données clients et marketing, pour que votre entreprise soit en conformité.

Comment intégrer les données dans ses prises de décision stratégiques ?

Une approche « Data Driven » se prépare sur plusieurs années. Elle implique en effet des choix technologiques, pour mettre en place une plate-forme Data et un système d’information adaptés. Elle exige aussi des compétences, la formation et le recrutement de spécialistes de la donnée : ingénieurs Data, Data analysts et Data Scientists. Enfin, elle touche à l’organisation même de l’entreprise. Il est nécessaire de sensibiliser et de mobiliser les collaborateurs de l’entreprise dans cette démarche : il est notamment crucial que les managers partagent et mettent à disposition les données essentielles de leur service (pour en savoir plus, retrouvez les résultats de notre enquête sur la maturité Data des entreprises d’Occitanie).

Bien entendu, il est important de garder en tête que les bénéfices à exploiter les données ne doivent pas dépasser le coût de la mise en place d’une telle stratégie.

Le Diagnostic PME Data Driven, qu’est-ce que c’est ?

Le Diagnostic PME Data Driven vous permet d’identifier le potentiel de création de valeur pour votre entreprise de construire votre plan de route Data : vision cible, architecture et trajectoire qui vous permettront de mettre les données au service de votre activité.

En lançant cet accompagnement, nous avons souhaité permettre à toute entreprise de mettre le pied à l’étrier et de déterminer les usages et actions prioritaires à mener pour valoriser les données utiles à son activité.

L’État, au travers de la BPI, cherche à accompagner les démarches d’innovation bénéfiques au renouveau des entreprises françaises, telles que celles proposées par Datasulting. C’est la raison pour laquelle la BPI France vous offre l’opportunité de participer au financement de votre Diagnostic PME Data Driven à hauteur de 50% de la prestation.
Cliquer ici pour en savoir plus !

 

 

background

Que faut-il savoir des données collectées sur le web ?

Date de la dernière modification : 10 novembre 2020

Datasulting – DPO Consulting : un Café innovation​ autour de l’exploitation des données dans le respect de la RGPD

 

La Factory Valorisation des données de Montpellier vous dit tout !

Pour marquer le lancement de la Factory Valorisation des données de Montpellier, Datasulting et MSP Avocats ont joint leurs expertises pour un « atelier déjeunatoire » en partenariat avec Digital 113 à Cap Oméga, le 3 mars dernier. Ce fut l’opportunité d’étudier un sujet qui intéresse de plus en plus d’entreprises en Occitanie, comme partout en France : la collecte et la valorisation des données accessibles sur Internet.

 

A leur arrivée, les participants ont pu rencontrer les intervenants dans les locaux de Digital 113. En préambule de cet atelier, Gaël PHILIPPE, CEO chez Datasulting, a pris le temps de présenter la Factory Valorisation des données. Il s’agit d’un groupe de travail thématique créé par Digital 113 et piloté par ses adhérents. La Factory Valorisation des données de Montpellier est ainsi née de la volonté de rassembler les sociétés locales actives dans la valorisation des données et tous ses aspects juridiques. L’ambition est de se réunir une fois par mois à l’occasion d’un atelier collectif ou d’un projet collaboratif pour les membres.

C’est donc tout naturellement que Datasulting et MSP Avocats ont souhaité aborder le sujet de la collecte et de l’exploitation des données disponibles sur le web pour cette première édition.

 

L’objectif était de donner un cadre juridique à l’opération de collecte des données, de préciser les bonnes pratiques à adopter lors de l‘exploitation des données et d’expliquer dans quelle mesure ces données constituent de véritables gisements de performance pour les entreprises.

En première partie de cette intervention, Marie SONNIER-POQUILLON et Alphonse BERNARD, avocats, membres du MSP Avocats, spécialisé dans la propriété intellectuelle et les nouvelles technologies ont expliqué dans quelles conditions les données étaient susceptibles d’être juridiquement protégées à l’heure actuelle.

 

Cette première partie fut rythmée par des échanges interactifs avec les entreprises présentes, avant de poursuivre sur une présentation des technologies du « scraping ». Il s’agit d’une technique de récupération de contenu à partir de sites internet de manière automatisée à l’aide d’un programme informatique. Celle-ci tend à se développer et permet d’enrichir des bases de données avec des informations accessibles sur Internet. Cet exposé s’est poursuivi par une présentation de ce que nous appelons communément les « données ouvertes » ou « Open Data » qui, juridiquement, sont des données administratives que les institutions publiques souhaitent rendre plus ouvertes.

 

 

Pour donner aux participants une vision concrète, Yann FINCK, CTO chez Datasulting, a donné des exemples d’utilisation appliquées au marketing et au commerce tirés de cas clients. MSP Avocats n’a pas manqué de mettre en lumière les éléments juridiques à respecter en lien avec les lois en vigueur et le RGPD, notamment la récupération automatisée de données et la prospection.

La collecte et l’exploitation de ces données disponibles sur Internet peuvent ainsi contribuer à :

  • L’automatisation de veilles tarifaires 
  • L’optimisation du démarchage de prospects 
  • L’affinement du ciblage en BtoB 

 

Ce premier événement a été l’opportunité pour Datasulting et MSP Avocats de confronter les perspectives d’utilisation des Open Data et les aspects juridiques à ne pas négliger. Conclusion ? S’il est techniquement possible de récupérer du contenu ouvert à partir de sites web de manière automatisée et si la pratique largement répandue, elle n’est pas nécessairement exempte de reproches au plan juridique. Dans les faits, la règlementation est encore en construction et il convient d’apprécier chaque situation au cas par cas pour pouvoir se positionner.

En particulier, l’utilisation et l’exploitation des données suppose que l’on respecte les droits d’auteur et la réglementation protégeant les bases de données. Par ailleurs, lorsque l’on réutilise des données administratives ouvertes en Open Data, il convient de prendre garde à ne pas altérer les informations, d’indiquer la source et de vérifier les conditions de licence proposées pour chaque type de données. Et, dans tous les cas, il ne faut pas oublier de respecter le RGPD.

Cette première édition a réuni une vingtaine de participants chefs d’entreprise, DSI et data scientists et les retours sont très positifs ! Pour prolonger ce succès, la Factory Valorisation des données de Montpellier a pris l’initiative d’organiser un nouvel événement sur les outils décisionnels. Les experts de Datasulting, Flutilliant et d’Avizzeo confronteront leurs points de vue sur les avantages et les limites des outils Power BI, Qlik et bien d’autres. Plus d’informations à venir dans les prochaines semaines, restez connecté(e) !

 

Découvrez tous les résultats de l’étude : cliquer ici

Cette enquête est une première étape vers la création d’un observatoire de la maturité Data des entreprises de notre région, construit avec nos partenaires.

background

Machine Learning avec R et Prédictions

Date de la dernière modification : 10 janvier 2021

Machine Learning avec R et Prédictions

Le « Machine Learning », ce terme que l’on entend partout, tout le monde en parle, tout le monde le veut, ça a l’air d’en faire rêver plus d’un ! Mais qu’est-ce que c’est au juste ? Pourquoi tant d’engouement ces dernières années pour cet « Apprentissage Machine » ? Et puis, à quoi ça sert au juste ? En ai-je besoin pour mon entreprise ? Tant de questions autour d’un concept.

 

Le Machine Learning est une branche de l’Intelligence Artificielle qui se base sur des méthodes statistiques et des algorithmes pour permettre aux machines (les ordinateurs) d’apprendre des données structurées du passé pour prédire, classifier ou détecter.

Quel en est le principe ? Si le terme « Machine Learning » a été introduit à partir de 1959 par Arthur Samuel, le principe sous-jacent est simple et prend ses bases théorique au XIXème siècle : entraîner un modèle sur des données historiques : ce qu’on appelle « l’apprentissage » et l’appliquer sur les nouvelles données : ce qu’on appelle « la prédiction ».

Qu’est-ce que le Machine Learning ?

Mais puisque le concept existe depuis aussi longtemps, pourquoi cet effet de mode ces dernières années seulement ? Et bien, trois révolutions se sont opérées en même temps et ont permis l’avènement du Machine Learning tel qu’on le connaît aujourd’hui :

  1. La puissance de calcul des processeurs : Avec la miniaturisation et l’effet d’échelle de la production industrielle, la puissance de calcul disponible à prix constant n’a cessé de s’accroitre depuis l’avènement de l’informatique à un rythme exponentiel : x10 tous les 5,5 ans (Nordhaus). Les machines sont capables d’apprendre plus vite et pour moins cher.
  2. La digitalisation des processus : Grace à la digitalisation de l’économie, le nombre d’informations numériques (Données) générées par les systèmes d’informations croit exponentiellement (+35% par an entre 2000 et 2020). Or, plus un modèle prédictif dispose de données pour apprendre, meilleures sera sa précision. De plus le coût de leur stockage est faible (~18€/To/mois) et les technologies de stockage plus adaptées facilitent l’exploitation des données à moindre coût.
  3. La démocratisation des connaissances : Il y a quelques décennies, seuls les grands de ce monde maîtrisaient les systèmes et les outils de traitement du Machine Learning : IBM, Intel pour ne citer qu’eux. Aujourd’hui, les technologies sont disponibles gratuitement et pour tous grâce à l’Open source et les leaders du secteur partagent leur effort de R&D en open source. (Exemple : Tensorflow partagé par Google en 2015, pyTorch en 2016 et Prophet en 2018 par Facebook).

Qu’est-ce que les prédictions peuvent apporter à mon business ?

Quand on parle de prédictions, il s’agit d’estimer à un horizon donné, la probabilité d’un événement ou le niveau d’un indicateur en étudiant des données passées. C’est pour cela que le Machine Learning est applicable à de nombreux domaines, souvent centré sur les clients mais pas seulement : Prédictions de vente, de demande, d’affluence, de trafic, mais aussi de fraude, de publicité ciblée…

Quel que soit le métier et tant qu’on a des données en quantité et diversifiées, on peut faire du Machine Learning et prédire l’avenir proche ou plutôt estimer l’avenir avec un niveau de précision maitrisé, qui peut être assez fin si on a beaucoup de données explicatives et si le processus est prévisible ou régulier. Ces prédictions permettent entre autres d’optimiser la gestion de l’entreprise, en prenant des décisions appuyées sur de meilleures anticipations.

 

Quels outils choisir ?

Du fait du développement récent de cette discipline et du foisonnement open source, de nombreux outils existent et prolifèrent : R, Python, H2O, DataIku, SAS, Matlab, Stata, SPSS, Java, Keras, Tensorflow… Et il est parfois difficile d’y voir clair.

Ces outils ne sont pas comparables : chaque outil a ses applications. Concernant les prévisions dans une approche open source, gratuite (Licence GPL) et ouverte, 2 langages adaptés aux analyses statistiques et au Machine Learning se sont imposés : Python et R.

Python est un langage de programmation plus généraliste, qui pourra être utilisé également pour d’autres tâche de programmation informatique. De fait, il est plutôt dédié à des utilisateurs disposant d’une orientation de programmeur. L’essor de Python dans la data science est récent (2016) et il dispose de moins de bibliothèques d’algorithmes « historiques » que R, mais il a su s’imposer en 3 ans comme un outil incontournable, notamment dans le domaine du deep learning.

R est un outil dédié initialement aux statisticiens qui existe depuis 1993 et dont le développement a été fortement accéléré dès les années 2000. Il dispose de la plus grande richesse fonctionnelle, est plus simple à utiliser pour un acteur statisticien ou métier mais son positionnement « Utilisateur » le rend plus complexe à industrialiser.

 

Pourquoi choisir R ?

Tout d’abord, nous considérons que l’aspect open source d’un outil de Machine Learning est un prérequis important car il prémunit contre les limitations des outils « propriétaires », dont le modèle de licence est souvent basé sur le volume de données ou la capacité du processeur, ce qui est un facteur extrêmement préjudiciable pour une activité qui a besoin d’une très grande puissance … mais très rarement. Ce qui guide naturellement vers l’utilisation de R ou Python.

Le choix entre R ou Python est un arbitrage lié à la richesse fonctionnelle (R disposant de plus d’algorithmes notamment sur les aspects de série temporelle), au caractère innovant (Python est actuellement plus actif en termes de développement) et au profil des utilisateurs (R convient mieux aux acteurs métier, là ou Python correspond mieux aux attentes des développeurs informatiques) ou au domaine d’étude (le Deep Learning impose l’utilisation de Python, alors que le machine learning est réalisable avec les 2 outils).

 

Se former avec Datasulting ?

L’Intelligence Artificielle, le Big Data & la digitalisation impactent aujourd’hui en profondeur les métiers et fonctions des entreprises. Ils sont les nouveaux enjeux de l’entreprise moderne et vecteurs de performance !

C’est pourquoi Datasulting, cabinet de conseil en valorisation des données, accompagne la performance des entreprises par l’exploitation du potentiel de leurs données depuis 2013. Son positionnement unique de « copilote des entreprises Data Driven » s’appuie sur plus de 15 ans d’expérience de ses associés fondateurs dans la Data, le Digital et le Retail, sur une méthodologie inspirée des plus grands cabinets de conseil et sur les dernières technologies en matière de Data Science et de Machine Learning.

Si vous souhaitez en savoir plus sur le Machine Learning avec R, Datasulting propose des formations régulières sur le sujet « Apprendre le Machine Learning avec R), soit en groupe, soit en entreprise, n’hésitez pas à contacter grâce au formulaire si dessous.

 


 

Cet article a attiré votre attention et vous souhaitez vous aussi mettre à profit le potentiel de vos données pour votre entreprise ?
Nous pouvons vous aider à identifier comment vos données peuvent doper votre performance !

Découvrez le Diagnostic PME Data Driven!

background