Gaël Philippe
Peut-on réellement améliorer la qualité de ses données ? Est-ce qu’il ne s’agit pas d’un chantier colossal ?Comment faire et par quoi commencer ?
Ce sont les questions auxquelles répondent Bastien Pino, DSI d’Orchestra, Gaël Philippe, Président de Datasulting et Pierre Bouet, Manager Data de Datasulting, dans ce 21e épisode de notre série Data’péro !
Dans un monde où la data est devenue le carburant de l’économie moderne, la qualité des données s’impose comme un enjeu majeur pour les entreprises de toutes tailles. Ce sujet crucial a été au centre des discussions de ce Data’péro, où experts et professionnels ont partagé leurs expériences et conseils.
La qualité des données n’est pas qu’une préoccupation technique : c’est le cœur du réacteur de toute entreprise moderne. Comme l’explique Bastien Pino, DSI du groupe Orchestra (une entreprise présente dans 28 pays avec 400 magasins et environ 500 millions d’euros de chiffre d’affaires), ce sujet est omniprésent dans le quotidien des organisations.
« Un système d’information se caractérise par sa data et par la manière dont je vais mettre ma data à disposition. »
Pierre Bouet, Manager data chez Datasulting, va encore plus loin en affirmant que la qualité des données n’est pas seulement majeure, elle est essentielle : « Il n’y a pas de projet s’il n’y a pas de qualité data. »
Selon Pierre Bouet, les problématiques liées à la qualité des données se divisent en deux catégories principales :
Pour illustrer ce second point, Pierre partage une anecdote révélatrice : un commercial qui avait ajouté deux zéros par erreur, transformant une vente de 10 000 € en 1 million d’euros. Cette simple erreur a eu des répercussions en cascade sur la comptabilité, la logistique et d’autres départements…
Un aspect crucial de la qualité des données réside dans la sémantique. Comme le souligne Bastien Pino :
« On dit souvent que la donnée n’est pas bonne, mais ça ne veut rien dire. Elle n’est pas bonne pourquoi ? Sous quel spectre ? »
Cette question de définition est fondamentale. Par exemple, quand différentes directions parlent de « marge« , s’agit-il de la même chose ? Les sources sont-elles identiques ? La définition est-elle partagée par tous ? La création d’un dictionnaire des concepts de l’entreprise est donc essentielle pour établir un langage commun pour toute l’entreprise.
L’un des constats majeurs partagés lors de cette discussion est l’importance d’impliquer les équipes métiers à chaque étape d’un projet data. Pierre Bouet observe que « la majorité des projets data n’impliquent pas les métiers au tout début », ce qui conduit souvent à l’échec.
« Si on n’implique pas une personne à chaque étape, on ne peut pas dire à la fin : ‘Tiens, c’est pour toi, c’est exactement ce que tu veux.’ Si la personne n’a jamais dit ce qu’elle voulait, comment faire quelque chose dont elle a besoin ? »
Bastien Pino apporte une nuance importante : pour réussir, il faut éviter de présenter ces initiatives comme des « projets informatiques« . Cette étiquette peut désolidariser l’équipe et créer une distance avec les métiers.
« Si on prend un projet avec un angle business sur lequel on est en capacité très tôt d’aller dire voilà comment je vais mesurer mes enjeux, voilà comment je suis en capacité de calculer le retour sur l’investissement, de fait, in fine, la data quality est forcément prise en compte. »
La solution proposée est d’adopter une démarche itérative, avec des interactions fréquentes entre les équipes techniques et métiers. Cette approche permet de définir clairement les besoins, d’identifier les données nécessaires et de mettre en place une véritable gouvernance des données.
Lorsque les utilisateurs comprennent l’importance de leur travail et l’impact de la qualité des données sur leurs objectifs business, ils sont naturellement plus enclins à s’investir dans la démarche.
La gouvernance des données n’est pas un concept abstrait réservé aux consultants. C’est avant tout une question simple : qui fait quoi et comment ? Pour mettre en place cette gouvernance, pas besoin d’outils sophistiqués. Un simple fichier Excel peut suffire pour commencer : listez les personnes impliquées, identifiez les environnements de données, et indiquez clairement les responsabilités de chacun. La vraie difficulté réside dans les arbitrages nécessaires pour déterminer qui s’occupe de quoi.
Une approche souvent préconisée est que la personne qui produit la donnée en est responsable. D’autres entreprises préfèrent déléguer cette responsabilité à la DSI ou à un pôle data dédié. L’important est de définir clairement les rôles.
Chez Orchestra, la structuration des données est un travail en cours. L’approche adoptée consiste à créer des « cockpits » d’indicateurs clés avec des définitions communes pour tous. Pour gérer le dictionnaire des données, les solutions vont du simple fichier Excel à des outils sophistiqués comme Data Galaxy. Mais attention : l’outil ne fait pas tout ! Mieux vaut un Excel bien renseigné qu’un outil coûteux mal utilisé.
Deux concepts modernes sont évoqués dans cette vidéo :
Ces approches visent à mieux structurer la gouvernance des données dans un contexte où la quantité d’informations disponibles explose.
L’une des premières erreurs commises par les entreprises est de se précipiter sur les outils sans définir clairement leurs besoins. Il faut revenir aux fondamentaux en se posant les bonnes questions :
Avec la démocratisation d’outils comme Power BI ou Tableau, il est facile de passer d’innombrables heures à créer des indicateurs sans réelle valeur ajoutée.
La supervision est un élément fondamental. Le premier outil indispensable est un tableau de bord de qualité des données permettant de visualiser et quantifier la fiabilité des informations.
Il n’y a pas besoin de 90 000 KPI pour faire tourner une entreprise. Mieux vaut se concentrer sur les indicateurs vraiment stratégiques et s’assurer qu’ils sont parfaitement fiables.
Créer un tableau de bord de qualité des données est « super compliqué« . Il faut définir le niveau de qualité nécessaire en fonction des besoins réels et des contraintes budgétaires.
N’oublions pas que la plupart des données sont saisies par des humains. La solution passe par l’animation des équipes et la sensibilisation des opérateurs à l’importance de la qualité des données qu’ils saisissent.
Il ne faut pas laisser la qualité des données à l’informatique. Pour convaincre les décideurs d’investir dans la qualité des données, il est essentiel de démontrer le ROI (retour sur investissement). La data quality est un travail de concert entre les métiers et les techniques. C’est un catalyseur qui doit forcer toutes les personnes à travailler ensemble.
Envie d’aller plus loin ?
N’hésitez pas à échanger avec notre équipe.
Diagnostic data et IA
Gestion et Analyse de données
Projets data et IA