La qualité des données est un sujet fondamental en matière d’exploitation des données car c’est souvent le point de départ des projets.
D’après l’enquête 2022 de l’Observatoire de la Maturité Data des Entreprises, 19% des répondants déclarent que le problème de qualité des données constitue un frein à l’exploitation des données dans leur entreprise. Et plus d’une entreprise sur deux déclare ne pas assurer de suivi de la qualité des données. Or, un pilotage d’activité fiable et pérenne implique de veiller à la qualité des données.
Mais qu’entend-on par « qualité des données » ? Que signifie avoir des « données de mauvaise qualité » ? Et surtout vos données sont-elles vraiment « pourries » ?
Nous vous expliquons tout dans cet article et nous vous montrerons que la réalité n’est pas toujours celle que l’on croit : vos données ne sont peut-être pas si mauvaises que vous pourriez le penser !
Plusieurs critères permettent d’évaluer la qualité de vos données. Parmi eux figurent : la fiabilité, la clarté, la récence, la complétude…
On peut qualifier les données comme étant de « mauvaise qualité » lorsque celles-ci sont manquantes, fausses, incohérentes, obsolètes, introuvables…
Bien souvent, le manque de qualité des données engendre de surcroit des effets collatéraux comme par exemple le fait que celles-ci ne peuvent pas être croisées entre les différentes sources ou les différents systèmes (par exemple entre le CRM et l’ERP).
Cela peut impacter les processus opérationnels. Une mauvaise qualité des données peut conduire à de mauvaises interprétations, des incompréhensions internes…
Bien souvent, personne ne prend en charge la résolution de ce problème de qualité des données car personne dans l’entreprise ne se sent ni légitime, ni compétent, ni responsable du sujet.
Qui plus est, le travail pour remédier au problème semble titanesque et on ne sait pas où commencer.
En attendant, tant que rien n’est fait et que les nouvelles données continuent à être mal collectées et saisies, la dégradation de la qualité se poursuit…
L’origine de la mauvaise qualité des données vient soit d’erreurs humaines lors de la saisie ou lors de l’interprétation des données, soit d’erreurs générées par le traitement automatique (par exemple lors d’une saisie de données par le client dans un formulaire en ligne).
Voici une liste détaillée des causes possibles d’erreurs :
1. Erreurs humaines à la saisie
2. Erreurs générées par le traitement automatique
3. Erreur générées par le traitement informatique
Identifier les sources d’erreur est la première étape pour mettre en place des actions correctives et stopper le processus de génération de données de mauvaise qualité.
Il est ensuite nécessaire de définir les critères qui vous permettront de déterminer si vos données sont ou ne sont pas de mauvaise qualité, en fonction de ce qui est important dans votre activité ou votre entreprise en termes d’évaluation de vos données.
Voici 10 critères qui permettent de qualifier la qualité de vos données.
1. Véracité
2. Complétude
3. Exhaustivité
4. Fraîcheur ou récence
5. Cohérence
6. Accessibilité
7. Référencement
8. Compréhension
9. Traçabilité
10. Intégrité
Afin de démarrer un travail sur la qualité des données, il est nécessaire de définir des priorités dans le retraitement ou le « nettoyage » de vos données. Nous vous exposons quelques questions clés qui peuvent vous aider à prioriser.
Quels usages sont impactés par la qualité des données ?
Quelles données doivent avoir un niveau garanti ?
Quel est le niveau de qualité à garantir pour ces données ?
Une fois que vous aurez défini les priorités, il vous faudra définir comment mettre en place votre démarche : qui ? comment ? quand ? quoi ?
1. QUI ? Définir qui est responsable de la gestion du projet d’amélioration de la qualité des données
2. COMMENT ? Définir comment seront traitées les données de mauvaise qualité ?
3. QUAND ? Correction à la saisie ou bien en aval ?
4. QUOI ? Normalisation des données ou conservation des données brutes ?
Le point N°1 est souvent le point de départ de toute démarche d’amélioration de la qualité des données. Il ne doit donc pas être négligé et vous permettra de mettre votre projet sur les bons rails.
Il est primordial de définir qui est responsable de la qualité des données pour chaque domaine ou système d’information source.
Il ne s’agit pas nécessairement des personnes en charge de la saisie mais plutôt des personnes en charge de la vérification de la bonne qualité des données.
Déterminer qui est responsable du processus d’amélioration et du pilotage de la qualité permettra :
Nous espérons que vous y voyez désormais plus clair en matière de qualité des données.
Nous pouvons vous accompagner et vous aider dans votre démarche data, alors n’hésitez pas à faire appel à nos experts !