Châteaux, monuments historiques ou religieux, musées, places ou même jardins, notre capitale regorge de sites plus prisés et incontournables les uns que les autres et des millions de touristes affluent chaque année pour les visiter.
La renommée croissante de certains lieux culturels et le développement du tourisme international génèrent un afflux de visiteurs croissant dans des lieux historiques. De plus en plus de directeurs de lieux touristiques sont confrontés aux problématiques d’attente et de gestion des flux. On peut ainsi voir des files d’attente qui peuvent atteindre jusqu’à 5 heures dans les musées les plus prisés en période d’affluence.
Les grands musées parisiens en font partie et sont fortement impactés par ce flot grandissant de visiteurs. L’un d’entre eux, le Musée d’Orsay, a fait appel à Datasulting pour gérer au mieux son parcours client. Les objectifs du Musée d’Orsay étaient :
Afin d’atteindre ces objectifs, le Musée a décidé de vendre une partie de ses billets en ligne. A l’issue de l’achat de son e-billet, le visiteur reçoit également un créneau horaire pour valider son entrée sur place. Au-delà de l’heure donnée, le visiteur perd la validité de son billet. Ce système permet de :
La contrainte de ce système, c’est qu’il nécessite d’anticiper le nombre de visiteurs à chaque instant afin de vendre le bon nombre de billets et de garantir la promesse de rentrer sans faire la queue.
Le Musée d’Orsay a donc fait appel à nous pour définir le quota de billets à vendre en ligne pour pouvoir garantir à ses visiteurs 30 minutes maximum d’attente. Il faut pour cela prédire l’affluence de visiteurs spontanés chaque jour et à chaque heure, ainsi que les ventes en ligne de billets à la demi-heure près.
Datasulting, au-delà de ses compétences en Data Science, s’intéresse également aux problématiques plus spécifiques de gestion des flux de personnes dans les lieux qui reçoivent un grand nombre de visiteurs (grande distribution, parcs, musées, etc.). La connaissance métier est un élément déterminant permettant d’adresser le sujet avec un avis éclairé sur les possibilités d’une valorisation efficace et opérationnelle des données, impliquant une approche sur mesure.
Il est important pour nous, au début de chaque nouveau projet, de bien comprendre le métier et les enjeux de notre client. Cela passe par l’exploration de son contexte, ses objectifs, ses contraintes, ses intuitions et les éléments disponibles au cours de nombreux échanges. Nous avons également organisé une visite sur place pour comprendre le fonctionnement de son parcours visiteur, étudier les flux clients en place et les problématiques d’accueil.
A la suite de cette visite, notre équipe a dressé, en collaboration avec le Musée, une liste des facteurs pouvant influencer la fréquentation de son musée. Le but étant de comprendre leur impact sur l’affluence du musée pour mieux prédire le nombre de visiteurs selon les périodes de l’année. Parmi ces facteurs, nous avons notamment intégré :
Ces données ne sont pas en possession du client. En revanche, elles peuvent facilement être récupérées sur des sites permettant d’accéder à la donnée sous forme d’Open Data. Il s’agit de données pour lesquelles l’accès est public et libre de droit, au même titre que leur exploitation et leur réutilisation.
Nous avons ainsi pu combiner les jeux de données de notre client concernant son historique des ventes de billets avec les données publiques. Grâce à des outils de Machine Learning (apprentissage automatique), nous avons pu établir des prévisions d’affluence à court et moyen terme et ainsi définir le quota optimal d’e-billet horodatés à vendre par créneaux horaires.
Avant d’établir les prédictions, nous nous sommes assurés avec le client de la qualité de ses données lors de leur collecte. Plus leur qualité est grande, mieux nous pouvons exploiter leur potentiel. Dans le cas du musée d’Orsay, nous avons effectué un gros travail de « nettoyage » des données provenant de différentes sources, saisies à la fois manuellement et stockées dans des fichiers XLS mais également provenant de logiciels métier (billetterie et logiciel de comptage des visiteurs par exemple).
En parallèle, nous avons extrait les Open Data correspondant aux mêmes périodes que les données que nous avons collectées avec notre client. Ces Open Data sont disponibles sous plusieurs formats modifiables comme json, csv, etc. Nous avons choisi le format qui convenait le mieux à nos outils d’analyse et de visualisation des données.
Nous nous sommes basés sur un outil de visualisation permettant de nettoyer et structurer l’ensemble des données. Dans ce contexte précis, nous avons utilisé le logiciel de visualisation des données Power BI de Microsoft. A l’issue de leur préparation, nous avons pu partager avec le client des visualisations, des graphiques et des infographies de ses données.
Nous avons travaillé avec le client par itérations, et avons ainsi construit avec lui les visualisations des données. Le client est ainsi en mesure de réutiliser ces visualisations et de les réactualiser dans le futur avec de nouvelles données.
Afin de prédire l’affluence des visiteurs au musée selon les créneaux de la journée, nous avons utilisé des algorithmes de Machine Learning lancés sur des logiciels spécialisés. Pour ce projet, nous avons choisi le logiciel R et sa bibliothèque de fonctionnalités H2O. Ces logiciels sont adaptés à la modélisation du comportement client.
A la fin du projet, nous avons pu fournir au Musée d’Orsay, les quotas de vente d’e-billets par tranches de 30 minutes. Le musée est ainsi en mesure de minimiser le temps d’attente en caisse et de lisser l’affluence des visiteurs en jouant sur les différents canaux et parcours de prise en charge à l’accueil.
A la clôture du projet, nous avons fourni au Musée d’Orsay tous les outils utilisés pendant la réalisation du projet. Il pourra réutiliser et améliorer ses résultats en les relançant avec ses futures données d’affluence et avec les Open Data qu’il pourra collecter à partir des sources que nous lui avons également fournies. Nous l’accompagnons également dans la mise à jour de l’algorithme pour maintenir sa performance.
Article rédigé par l’Equipe Datasulting
Vous souhaitez démarrer un projet data ?
N’hésitez pas à échanger avec nos experts.