L’analyse des données en entreprise tente de découvrir des corrélations et des informations en vue de générer de la valeur et une meilleure exploitation de la data. Cependant, la réussite des projets en data intelligence nécessite de respecter des contraintes techniques et organisationnelles spécifiques aux contextes data-driven. À travers le temps, différentes méthodologies ont émergé pour faciliter le pilotage des projets d’intelligence de la donnée et diminuer le risque de leurs échecs. Comment concevoir les systèmes Big Data afin de soutenir l’avancement des projets de data Analytics ? Comment implémenter de l’agilité au sein des programmes centrés sur la donnée ? Découvrez ici les clés nécessaires au management des projets data-centric : gestion des données, frameworks de gestion de projets, management des équipes, etc.
Définition des cas d’usage pour un pilotage efficace du projet Big Data
Un projet Big Data démarre après la définition d’un besoin et des cas d’usages qui peuvent apporter une solution à celui-ci. La conceptualisation des cas d’usage doit être suivie de démonstrations de faisabilité (appelées Proof of Concept en anglais). Un PoC sert à sonder et démontrer la faisabilité de la solution. La mise en place d’une expérience de faisabilité implique le traitement et la compréhension des données existant au sein du Data Lake de l’entreprise.
Lors de cette étape cruciale, les data scientists et data engineers peuvent déjà commencer à appréhender les problématiques liées aux données : nettoyage, transformation, données manquantes, uniformisation de jeux de données, détection des anomalies, interviews des experts métier, feature engineering, etc. Une fois le pré-processing des données effectué, la réflexion au sujet des modèles d’Intelligence Artificielle (machine learning, data mining, etc.) à implémenter peut prendre place. Une fois la faisabilité du projet à petite échelle vérifiée, le projet peut démarrer.
Gestion de la donnée et solutions Big Data
La réussite d’un projet Big Data passe par la qualité des données collectées par les entreprises. Une stratégie de la gouvernance des données est nécessaire en amont pour anticiper les problématiques liées à la collecte, au stockage et à l’exploitation de la data. Une entreprise qui se veut data-driven, doit penser la gestion de son data lake et de data lab afin de pouvoir s’engager dans des projets d’intelligence de la donnée à l’avenir.
Élaborer la gestion des données au niveau de tous les services de l’entreprise et des canaux d’acquisition de la donnée (réseaux sociaux, comptes-rendus des services clients, mails, CRM, système d’intégration IoT, etc.) passe par l’homogénéisation des pratiques entre les différents acteurs de votre structure. Les processus de stockage uniformisés facilitent l’accès aux données pour n’importe quel projet entamé.
L’équipe de gestion d’un projet Big Data
La création d’une solution basée sur l’intelligence artificielle nécessite une équipe dédiée et en adéquation avec ses besoins. Une application s’inscrivant dans le cadre de l’intelligence de la donnée nécessite la conjugaison de profils :
- techniques (data scientists, data architects, data analysts, data engineers) ;
- métier en fonction du projet. Si l’opération menée tente d’optimiser des processus marketing ou RH, le profil métier impliqué ne – sera pas le même. Ces acteurs apporteront les connaissances manquantes aux professionnels techniques ;
- agiles (Product Owner et Scrum Master notamment). Le projet doit être doté d’un cadre d’avancement itératif (Scrum Agile, etc.).
Le Product Owner apportera l’information nécessaire au sujet du produit à réaliser.
La combinaison de ces profils et des méthodologies de suivi de projet permet d’obtenir une vision globale du produit. Cela amène également à impliquer le client (interne ou externe) afin de limiter les risques d’échec du projet.
Framework de gestion de projet d’intelligence de la donnée
Comme nous l’avons vu précédemment, la mesure de l’avancement du projet nécessite un cadre de progression. Différentes méthodes de management de projet dédiées aux applications dans la data ont vu le jour depuis les années 1990. Elles permettent de prendre en compte l’évolution de la donnée à travers le temps et de répondre aux taux d’échecs élevés des projets data-driven en entreprise.
Le processus itératif agile KDD (Knowledge Discovery in Databases) fait partie des méthodes agiles développées pour accompagner les projets data centric. Ce cadre de travail tente de poser des itérations comprenant la définition des objectifs, la connaissance métier, l’analyse et le nettoyage de la donnée, le développement d’une fonctionnalité, le déploiement et l’analyse des résultats avant d’entamer un nouveau cycle de développement.
La méthode ASUM-DM (Analytics Solutions Unified Method) tente également de répondre aux problématiques liées au management de projets centrés sur les données. Créée pour répondre aux besoins des projets de data mining (fouille de données) et d’analyse prédictive, elle s’articule autour d’une première phase d’analyse et de design centrée sur les besoins de la solution (faisabilité, cas d’usages, technologies nécessaires, etc.). Une fois cette brique posée, interviennent les étapes de build et de déploiement suivies d’une cadre d’analyse et d’optimisation. Enfin, une méthodologie de management vient chapeauter le tout en assurant le monitoring de la progression future.
Le framework AABA (Architecture-centric Agile Big data Analytics) intègre la dimension DevOps dans la gestion du projet. Les phases de tests avant déploiement permettent de nourrir les rapports d’analyse de la qualité d’avancement du projet. Les équipes métiers et data travaillent conjointement avec les architectes afin de faciliter les futures prises de décisions et d’éviter les changements trop coûteux.
Le recours à ces méthodes de travail tente de diminuer le risque d’échec du projet en créant des synergies entre les différents acteurs du projet (équipes métier, data, architectes, etc.). Ces frameworks visent également à donner une plus grande visibilité sur le potentiel des solutions développées. Les itérations successives permettent aux équipes de développement d’éviter de s’enliser dans la création de fonctionnalités inutiles nécessitant des changements coûteux par la suite. Enfin, le management de programmes de développement centrés sur les données cherche à faciliter les échanges entre les différents acteurs du projet au vu de la complexité induite par les différentes spécialités impliquées.
En conclusion, la réussite du pilotage de projets dans la data intelligence requiert la création d’une culture d’entreprise centrée sur les données. Cela passe par la conception de politiques et de cadre de gouvernance des données, d’uniformisation des méthodes de collecte et de stockages du capital de données ainsi que la facilitation d’accès à celle-ci. Par ailleurs, le début d’un projet donné ne peut être envisagé sans la vérification de la faisabilité et de la valeur apportée par la solution envisagée. Enfin, l’avancement et la gestion du cycle de vie applicatif doivent être suivis grâce à des stratégies de management de projet agiles, centrées sur les données, voire sur l’architecture de la solution afin de diminuer les risques d’échecs et de coûts.
Nous vous recommandons ces autres pages :
- Intelligence de la donnée : qu’est-ce que la Data Intelligence ?
- Bien comprendre les enjeux de l’intelligence de la donnée
- Comment bien cadrer un projet d’intelligence de la donnée
- L’intérêt de créer un cadre de gouvernance de la donnée
- Intelligence de la donnée : quelques cas d’usage
- Les erreurs à éviter pour réaliser un POC sur un projet d’intelligence de la donnée
- Bien choisir ses indicateurs de performance d’informatique décisionnelle
Des questions ?
Contactez-nous dès aujourd’hui pour discuter de vos projets IT et découvrir comment nous pouvons vous aider à les réaliser avec succès.