Data Science

Toutes vos données peuvent être utilisées par des algorithmes de machine learning pour automatiser, anticiper, prédire... les possibilités sont multiples et concernent de nombreuses fonction : marketing, vente, production, finance. Nous développons des solutions sur mesure pour doper votre activité à l'Intelligence Artificielle.
Contactez-nous

La science des données : de quoi s’agit-il ?

La science des données est une discipline récente qui recouvre usuellement les approches et les outils relatifs à l’exploitation des informations (les « données » n’étant autre que les informations numérisées, permettant ainsi l’automatisation de leur traitement) : le data mining, les algorithmes d’apprentissage automatisé, le deep learning et l’intelligence artificielle.

Cette discipline a pris un essor majeur depuis les années 2000 du fait de 3 facteurs combinés, souvent résumés sous l’acronyme « Big Data » :

  • La numérisation des processus de vente, de production et de communication qui alimentent le « gisement » des données disponibles.
  • L’accès à des ressources informatiques toujours plus puissantes et moins chère, accessibles en 1 click : machines virtuelles, stockage cloud.
  • Le développement d’outils de Data Science toujours plus avancés.

La promesse de valeur : le « Mythe » de la data science

Les promesses de la science des données sont multiples. Par une meilleure exploitation des données historiques, les approches de Data Science promettent de pouvoir identifier automatiquement la meilleure action ou décision à prendre, et ce à un niveau « fin », c’est-à-dire en réaction à un événement, une situation, une action client individuelle.

En un mot, la promesse générale est de remplacer par un automatisme, des tâches à valeur ajoutée historiquement dévolues à un humain telles que conseiller un client sur le meilleur produit, identifier un défaut de qualité, anticiper les ventes, prédire un défaut de paiement … le tout, sans avoir à en définir les règles a priori.

A la différence des « systèmes experts », popularisés dans les années 80, qui proposaient de reproduire le raisonnement d’un expert à partir d’une base de faits, d’une base de règles métier et d’un moteur d’inférence, la science des données propose « d’apprendre automatiquement ». L’apprentissage automatique consiste à observer des données passées et à en tirer automatiquement les enseignements pour anticiper le futur dans des situations similaires. En cela, la data science promet de réduire le temps passé (perdu ?) à la définition a priori des règles métier tout en améliorant la prise de décision.

L’amélioration récente des systèmes d’apprentissage automatiques et la disponibilité croissante des données sur les différents processus de l’entreprise (automatisation, équipements connectés, interfaces informatisées, connectivité) rend cette promesse de plus en plus réaliste chaque jour.

Quel intérêt a la Data Science pour votre entreprise?

Les usages réels de la data science sont nombreux et concernent aussi bien les services, l’industrie et l’agriculture. Nul besoin de s’appeler Google ou Amazon pour tirer de la valeur de ses données : toute entreprise ayant numérisé en partie ses processus sera susceptible de tirer profit de ces approches, pour peu qu’elle dispose de données suffisamment volumineuses et diversifiées. Un artisan ou un commerçant n’aura que peu de bénéfice à en retirer là où un industriel, un acteur des services financiers, un distributeur ou une chaine de commerçants de restaurants ou d’hôtels pourra générer plus de valeur.

Les principales fonctions de l’entreprises concernés par la promesse de valeur sont :

  • Le Marketing : mieux connaitre ses clients, anticiper leur comportement, maitriser la valeur à terme, proposer le bon produit et acquérir les clients à valeur ajoutée.
  • Production : Optimiser les processus, Anticiper les défauts et identifier les causes, Economiser l’énergie, adapter la production à la demande future.
  • Achat : Anticiper le besoin en matière première et l’évolution du prix ou de la disponibilité.
  • Opérations : anticiper la demande et dimensionner les équipes pour faire face à la demande.
  • Distribution : optimiser l’outil de distribution, optimiser le taux de transformations Web, réduire le temps d’attente client, optimiser l’usage des lignes de caisse.
  • Fraude : détecter des comportements frauduleux, cibler des contrôles.
  • Finance : estimer le risque de crédit, le risque de défaut d’une entreprise.

Une question nous est souvent adressée : à partir de quel volume de données est-il pertinent de lancer une démarche de Data Science ? La réponse à cette question est diverse et il n’existe pas une seule solution. La réponse dépend de votre niveau de digitalisation, de la maturité Data de votre organisation, des compétences développées en interne et des outils dont vous disposez.

Arcelor est réputé pour avoir investi 30 millions d’euros dans les années 90 pour réaliser un système expert de pilotage des hauts fourneaux (Sachem). Un tel système pourrait probablement être réalisé actuellement pour beaucoup moins cher avec une approche de Data Science, mais il ne serait pas judicieux de réinvestir pour refaire un système répondant au même besoin. Pour autant, certains de nos clients, disposant d’une quarantaine d’agence en France ou d’environ 20 000 clients web ont développé des approches de Data Science modernes apportant beaucoup de valeur.

Les défis de sa mise en œuvre dans votre entreprise

Dans quelle mesure les projets intégrant de la Data Science délivrent-ils la promesse de valeur et quels sont les écueils ?

Tout d’abord le potentiel est bien là : de nombreux projets mis en production viennent le confirmer. Oui, le ciblage client permet d’augmenter les taux de transformation et de réduire les coûts ou les promotions à fond perdu, oui il est possible d’optimiser le taux d’occupation des conseillers en call center ou des caissières en ligne de caisse, de réduire la consommation d’énergie par une meilleure régulation et d’améliorer le ciblage des contrôles.

Néanmoins, les entreprises qui mettent en œuvre des projets incluant un volet Data Science font face à de nombreuses difficultés et de nombreux projet sont en échec, car cette discipline récente remet en cause les modes de fonctionnement actuels de l’entreprise.

Vous trouverez ci-dessous un recueil des principales difficultés auxquelles toute entreprise mettant en œuvre une approche de Data Science doit se préparer à faire face :

  • L’agilité dans l’interaction entre les Métiers et la DSI. Les projets de Data science comportent toujours une phase d’exploration et de recherche consistant soit à tester de nouvelles modélisations soit à tester l’intégration de nouvelles données. Cette phase nécessite à la fois une expertise métier importante (car il est illusoire de modéliser un processus ou un acteur sans en avoir une compréhension intuitive) et une capacité technique à intégrer des données issues de diverses sources dans divers formats, le tout dans des cycles courts propre au processus analytique. Cette spécificité implique de nouveaux modes de collaboration itératifs courts entre la DSI et les métiers pour permettre à la data science de révéler son potentiel.
  • Le défi de l’industrialisation. Au-delà des enjeux de collaboration, les projets Data Science posent un nouveau défi lors de leur mise en production. En effet, le département informatique est traditionnellement en charge du « run », c’est-à-dire la surveillance du bon fonctionnement des systèmes après leur mise en production. Or les solutions contenant des modèles prédictifs nécessitent d’une part une supervision experte afin de s’assurer que les modélisations ne divergent pas et d’autre part une « révision » périodique pour garantir un niveau de performance stable dans le temps. Ces 2 aspects ne sont traditionnellement pas prévus dans les processus des DSI, menant certains projets Data Science à l’échec rapide après leur mise en production, en raison d’une perte de performance.
  • Le recrutement et l’encadrement des Data Scientists représente également un défi de taille pour les ressources humaines. Beaucoup d’entreprises ont le réflexe de confier leur projet Data Science à un junior, qu’il soit stagiaire/nouveau diplômé Bac +5 ou doctorant. Ce réflexe s’explique par de nombreux facteurs convergents : la difficulté à définir une fiche de poste pour un nouveau métier, la rareté et le salaire élevé des profils séniors, l’absence d’unité organisationnelle habituée à accueillir ces compétences. Après le recrutement, les employeurs ont également des difficultés à encadrer et développer ces jeunes Data Scientist par manque d’experts dans l’entreprise ou de parcours de carrière. Nous observons fréquemment que les embauches de Data Scientist se terminent prématurément (Démission, Licenciement, Burn Out) alors même que le profil semblait correspondre au besoin.
  • La qualité et la gouvernance des données représentent enfin un ultime défi révélé par les projets de Data Science. Si le problème d’incohérence des données entres les différents systèmes d’information préexiste aux projets de Data Science, la plupart des entreprises s’en accommodent très bien dans une approche en « silo » (chaque partie de l’organisation gère ses propres problèmes de données). L’arrivée des projets de Data Science, et plus spécifiquement le besoin de croiser les données issues de différentes parties du système d’information (ventes, achat, production, comptabilité, personnel, logistique) nécessite l’usage de référentiels commun et de conventions communes. Ces projets constituent donc un révélateur d’une gouvernance des données défaillante, rendant d’autant plus difficile leur mise en production effective car la résolution de ces questions d’organisation dépasse largement la responsabilité de l’équipe projet.

Nos recommandations pour générer de la performance grâce à la Data Science

Si vous souhaitez lancer dans votre entreprise une initiative de Data Science ou si vous sentez que ce type d’approche peut générer de la performance au sein de votre entreprise, nous vous recommandons de prendre plusieurs mesures :

  • Définissez vos objectifs : il n’y a pas de stratégie efficace sans un cap défini assorti d’objectifs financier priorisés en termes de gain et d’investissement.
  • Préparer l’organisation : comme évoqué plus haut, les approches Data Science remettent en cause l’organisation entre les métiers et l’informatique, ainsi que les modes de fonctionnements actuels. La définition de nouvelles responsabilités est un prérequis à la réussite d’une initiative Data Science.
  • Sourcez l’expertise nécessaire : vous aurez besoin de compétences séniors pour réunir les qualités nécessaires à la réussite d’un projet qui nécessitera à la fois des compétences métier et techniques tout en relevant des défis organisationnels. Le recrutement de ressources pourra se faire lorsque le socle organisationnel et expert sera stabilisé.