DATA'PÉRO #21 : Comment améliorer la qualité de vos données ?

Qualité des données

Comment améliorer la qualité de vos données ?

La qualité des données : un enjeu stratégique pour les entreprises

Peut-on réellement améliorer la qualité de ses données ? Est-ce qu’il ne s’agit pas d’un chantier colossal ?Comment faire et par quoi commencer ?

Ce sont les questions auxquelles répondent Bastien Pino, DSI d’Orchestra, Gaël Philippe, Président de Datasulting et Pierre Bouet, Manager Data de Datasulting, dans ce 21e épisode de notre série Data’péro !

Dans un monde où la data est devenue le carburant de l’économie moderne, la qualité des données s’impose comme un enjeu majeur pour les entreprises de toutes tailles. Ce sujet crucial a été au centre des discussions de ce Data’péro, où experts et professionnels ont partagé leurs expériences et conseils.

Pourquoi la qualité des données est-elle si importante ?

La qualité des données n’est pas qu’une préoccupation technique : c’est le cœur du réacteur de toute entreprise moderne. Comme l’explique Bastien Pino, DSI du groupe Orchestra (une entreprise présente dans 28 pays avec 400 magasins et environ 500 millions d’euros de chiffre d’affaires), ce sujet est omniprésent dans le quotidien des organisations.

« Un système d’information se caractérise par sa data et par la manière dont je vais mettre ma data à disposition. »

Pierre Bouet, Manager data chez Datasulting, va encore plus loin en affirmant que la qualité des données n’est pas seulement majeure, elle est essentielle : « Il n’y a pas de projet s’il n’y a pas de qualité data. »

Les défis de la qualité des données

Selon Pierre Bouet, les problématiques liées à la qualité des données se divisent en deux catégories principales :

  • Les données manquantes : absence d’informations cruciales qui peuvent avoir des implications juridiques ou commerciales importantes.
  • Les données erronées : informations incorrectes qui peuvent engendrer des comportements néfastes pour l’entreprise.

Pour illustrer ce second point, Pierre partage une anecdote révélatrice : un commercial qui avait ajouté deux zéros par erreur, transformant une vente de 10 000 € en 1 million d’euros. Cette simple erreur a eu des répercussions en cascade sur la comptabilité, la logistique et d’autres départements…

La sémantique : un enjeu souvent négligé

Un aspect crucial de la qualité des données réside dans la sémantique. Comme le souligne Bastien Pino :

« On dit souvent que la donnée n’est pas bonne, mais ça ne veut rien dire. Elle n’est pas bonne pourquoi ? Sous quel spectre ? »

Cette question de définition est fondamentale. Par exemple, quand différentes directions parlent de « marge« , s’agit-il de la même chose ? Les sources sont-elles identiques ? La définition est-elle partagée par tous ? La création d’un dictionnaire des concepts de l’entreprise est donc essentielle pour établir un langage commun pour toute l’entreprise.

L’implication des métiers : clé de la réussite

L’un des constats majeurs partagés lors de cette discussion est l’importance d’impliquer les équipes métiers à chaque étape d’un projet data. Pierre Bouet observe que « la majorité des projets data n’impliquent pas les métiers au tout début », ce qui conduit souvent à l’échec.

« Si on n’implique pas une personne à chaque étape, on ne peut pas dire à la fin : ‘Tiens, c’est pour toi, c’est exactement ce que tu veux.’ Si la personne n’a jamais dit ce qu’elle voulait, comment faire quelque chose dont elle a besoin ? »

Bastien Pino apporte une nuance importante : pour réussir, il faut éviter de présenter ces initiatives comme des « projets informatiques« . Cette étiquette peut désolidariser l’équipe et créer une distance avec les métiers.

« Si on prend un projet avec un angle business sur lequel on est en capacité très tôt d’aller dire voilà comment je vais mesurer mes enjeux, voilà comment je suis en capacité de calculer le retour sur l’investissement, de fait, in fine, la data quality est forcément prise en compte. »

Une approche itérative et collaborative

La solution proposée est d’adopter une démarche itérative, avec des interactions fréquentes entre les équipes techniques et métiers. Cette approche permet de définir clairement les besoins, d’identifier les données nécessaires et de mettre en place une véritable gouvernance des données.

Lorsque les utilisateurs comprennent l’importance de leur travail et l’impact de la qualité des données sur leurs objectifs business, ils sont naturellement plus enclins à s’investir dans la démarche.

La Gouvernance des données : démystification

La gouvernance des données n’est pas un concept abstrait réservé aux consultants. C’est avant tout une question simple : qui fait quoi et comment ? Pour mettre en place cette gouvernance, pas besoin d’outils sophistiqués. Un simple fichier Excel peut suffire pour commencer : listez les personnes impliquées, identifiez les environnements de données, et indiquez clairement les responsabilités de chacun. La vraie difficulté réside dans les arbitrages nécessaires pour déterminer qui s’occupe de quoi.

Une approche souvent préconisée est que la personne qui produit la donnée en est responsable. D’autres entreprises préfèrent déléguer cette responsabilité à la DSI ou à un pôle data dédié. L’important est de définir clairement les rôles.

Structuration des données et outils

Chez Orchestra, la structuration des données est un travail en cours. L’approche adoptée consiste à créer des « cockpits » d’indicateurs clés avec des définitions communes pour tous. Pour gérer le dictionnaire des données, les solutions vont du simple fichier Excel à des outils sophistiqués comme Data Galaxy. Mais attention : l’outil ne fait pas tout ! Mieux vaut un Excel bien renseigné qu’un outil coûteux mal utilisé.

‘Data as a Product’ et Data Domains

Deux concepts modernes sont évoqués dans cette vidéo :

  • Data as a Product : créer des produits data unifiés et les rendre accessibles à tous dans l’entreprise.
  • Data Domains : organiser la responsabilité des données en silos (marketing, commercial, production…) avec une coordination centrale.

Ces approches visent à mieux structurer la gouvernance des données dans un contexte où la quantité d’informations disponibles explose.

Questionner l’usage avant tout

L’une des premières erreurs commises par les entreprises est de se précipiter sur les outils sans définir clairement leurs besoins. Il faut revenir aux fondamentaux en se posant les bonnes questions :

  • De quelles sources de données avons-nous besoin ?
  • Ces données doivent-elles être agrégées ou nettoyées ?
  • Quelles actions concrètes pourrons-nous mener grâce à ces indicateurs ?

Le piège du « self-service BI »

Avec la démocratisation d’outils comme Power BI ou Tableau, il est facile de passer d’innombrables heures à créer des indicateurs sans réelle valeur ajoutée.

La supervision : voir pour agir

La supervision est un élément fondamental. Le premier outil indispensable est un tableau de bord de qualité des données permettant de visualiser et quantifier la fiabilité des informations.

Moins de KPI, mais des KPI fiables

Il n’y a pas besoin de 90 000 KPI pour faire tourner une entreprise. Mieux vaut se concentrer sur les indicateurs vraiment stratégiques et s’assurer qu’ils sont parfaitement fiables.

La qualité des données : un défi permanent

Créer un tableau de bord de qualité des données est « super compliqué« . Il faut définir le niveau de qualité nécessaire en fonction des besoins réels et des contraintes budgétaires.

L’erreur humaine : inévitable mais gérable

N’oublions pas que la plupart des données sont saisies par des humains. La solution passe par l’animation des équipes et la sensibilisation des opérateurs à l’importance de la qualité des données qu’ils saisissent.

La data quality, l’affaire de tous

Il ne faut pas laisser la qualité des données à l’informatique. Pour convaincre les décideurs d’investir dans la qualité des données, il est essentiel de démontrer le ROI (retour sur investissement). La data quality est un travail de concert entre les métiers et les techniques. C’est un catalyseur qui doit forcer toutes les personnes à travailler ensemble.

Ils ont animé ce Data’péro

Envie d’aller plus loin ?

N’hésitez pas à échanger avec notre équipe.