Data Intelligence : les principaux enjeux à relever par les entreprises

Avec l’arrivée de l’Intelligence Artificielle dans le traitement des données provenant du Big Data, les entreprises connaissent une transformation importante de leur process. Chatbot, machine learning, blockchain, assistant vocal (comme Siri, Cortona ou encore Alexa), toutes ces nouvelles technologies issues de l’Intelligence de la donnée sont autant d’outils pour collecter et analyser davantage de données.

Pour cela, l’Intelligence Artificielle permet aux machines de reproduire et d’automatiser les tâches jusque-là réalisées par des humains grâce à des algorithmes complexes. Les machines sont désormais capables de comprendre le langage de l’Homme (tout du moins certains mots clés), prendre des décisions autonomes selon des critères définis ou d’apprendre au fur et à mesure de leurs expériences (le machine learning).

Comprendre comment réussir son projet d’intelligence de la donnée est une chose, en intégrer les enjeux et les limites à ne pas dépasser en est une autre.

 

Les enjeux d’une utilisation responsable et éthique de la Data Intelligence

La Data Intelligence, ou l’intelligence de la donnée, est née de la convergence entre :

  • le Big Data, l’ensemble de techniques de collecte, de stockage et d’analyse des données massives collectées ;
  • l’Intelligence Artificielle, des algorithmes complexes permettant le traitement d’un volume de données illimité en temps réel ainsi que la programmation de nombreuses tâches ou réactions.

Ainsi, l’intelligence de la donnée est dotée d’un fort potentiel dans l’automatisation du traitement analytique de toutes les données circulant sur internet ou dans l’entreprise et des informations produites (issues de la transformation des données brutes en informations utilisables), pour l’apprentissage autonome des machines (le machine learning) ou encore de la prise décision autonome.

Cependant, dans un contexte où les démarches RSE (Responsabilité Sociétale des Entreprises) se développent en réponse aux enjeux sociétaux et environnementaux de plus en plus prégnants, l’intelligence de la donnée est confrontée à la notion de responsabilité et d’éthique.

En effet, l’utilisation de la Business Data Intelligence est plurielle, et ses risques sont tout aussi nombreux :

  • l’adaptation automatique des volumes de production selon certains critères (météo, analyse prédictive des achats d’après le comportement des clients, etc.) avec des risques de surproduction (et de gaspillages des ressources ainsi que de pollution) en cas d’erreur d’analyse ;
  • la correction des process selon les préconisations émises par l’Intelligence Artificielle pour gagner en performance et en temps avec les risques sur le bien-être au travail ou la sécurité qu’elle pourrait engendrer ;
  • l’utilisation des données personnelles, voire sensibles (données bancaires par exemple) des clients ou/et des internautes à des fins marketing (comme la vente de fichiers de données ou l’envoi intempestif de messages publicitaires) ;
  • l’automatisation des tâches jusque-là effectuées par des humains, par exemple le tri automatique de CV selon des critères prédéfinis en amont lors d’un recrutement et la perte de la dimension humaine dans la gestion RH ;
  • etc.

 

L’intelligence de la donnée peut donc avoir des impacts sociétaux et environnementaux importants si le recours à l’Intelligence Artificielle en entreprise n’est pas contrôlé. En outre, le Big Data en lui-même un impact environnemental important, car le stockage et le traitement des données génèrent d’importantes dépenses énergétiques (environ 7 % des dépenses électriques dans le monde en 2018).

Le projet de Data Intelligence des entreprises se doit alors d’être responsable, c’est-à-dire que les intérêts de l’entreprise doivent composer avec ceux de son environnement (la nature, l’Homme, le cadre règlementaire, etc.). Pour cela, plusieurs valeurs peuvent être mises en place par les entreprises :

  • la transparence et l’éthique quant à la collecte et à l’usage de la Data Intelligence ;
  • un contrôle humain des activités des machines ;
  • la non-discrimination et la diversité en évitant les biais algorithmiques (nous y reviendrons dans ce qui suit) ;
  • l’égalité numérique pour tous ;
  • le respect de la vie privée de tous les partenaires de l’entreprise (clients, consommateurs, prestataires de service, fournisseurs, etc.).

 

Les enjeux de la fiabilité et la qualité des données de la Data Intelligence

La donnée est la matière première de la Data Intelligence. De cette donnée collectée, puis analysée découle un ensemble d’applications Business possibles (innovation technologique, développement de nouveaux produits et services, marketing prédictif, gestion de la relation client, gestion de la Supply Chain, mise en place de process, décisions stratégiques, etc.).

C’est pourquoi la fiabilité et la qualité des données, et par conséquent la pertinence des outils de collecte, d’analyse et de stockage, sont un enjeu crucial pour la performance et l’image de l’entreprise.

Aujourd’hui, 70 % des entreprises affirment que la mauvaise qualité des données traitées impacte négativement leur activité (sondage Gartner). À ce constat s’ajoute celui d’une augmentation annuelle de près de 61 % du volume des données, supposant un traitement Big Data encore plus conséquent.

Bien que l’arrivée de l’intelligence de la donnée (et notamment de l’apprentissage machine) semble prometteuse pour une meilleure préparation en amont de la donnée selon sa nature et son usage, encore faut-il avoir conscience des défis à relever.

  1. Les puissants algorithmes du machine learning sont la force de la Data Intelligence en matière d’amélioration de la qualité des données durant toute la chaîne de traitement. Cependant, leurs résultats peuvent comporter ce que l’on appelle des biais algorithmiques. Il s’agit d’un manque de neutralité provenant d’un entrainement de la machine à partir de données déjà biaisées. En s’appuyant sur son expérience passée, l’algorithme peut donc générer de la discrimination ou une réalité déformée.
  2. Toute information sortie de son contexte perd son sens d’origine. C’est pourquoi la contextualisation des données est un enjeu pour leur fiabilité. L’enjeu est même double, car il faut prendre en compte le contexte d’origine de la donnée et celui de son utilisation : l’exploitation d’une donnée par une administration (une date de naissance par exemple) ne sera pas la même pour un secteur d’activité spécifique, comme les assurances (la date de naissance, et donc l’âge, détermine la nature des contrats ou des cotisations).
  3. Enfin, il faut ajouter à cela les enjeux règlementaires liés à la collecte et l’utilisation des données, problématique complexe puisque les enjeux portent sur plusieurs échelles. Tout d’abord, l’intelligence de la donnée doit intégrer les contraintes liées au secteur d’activité des entreprises, comme la règlementation BCBS239 pour le secteur bancaire portant sur l’agrégation des données ou le Solvency2 pour les assurances.

Un cadre règlementaire en matière de sécurisation des données se dessine en Europe, avec le RGPD (Règlement européen Général de la Protection des Données) dont le rôle est d’encadrer le traitement et l’utilisation des données personnelles physiques. Mais, ces solutions se placent dans un contexte restreint du fait de leurs limites géographiques d’application, alors qu’il conviendrait de structurer les données de la société globale, à l’échelle du monde. En effet, qu’advient-il des données des ressortissants européens collectées par des entreprises étrangères ?

 

Nous vous recommandons ces autres pages :

Des questions ?

Contactez-nous dès aujourd’hui pour discuter de vos projets IT et découvrir comment nous pouvons vous aider à les réaliser avec succès.