La transition des modèles traditionnels de data science vers les nouvelles IA génératives représente une transformation notable dans la façon d’aborder le traitement informationnel. Les nouvelles IA nous permettent d’interroger des grandes masses de documents au sein des entreprises pour en extraire des informations pertinentes, même sur du “vrac numérique”. Une nouvelle approche dans la gestion documentaire bien adaptée à des cas d’usages précis, pour ne pas produire de réponses biaisées. Un décryptage de Laurent Rousset, directeur du digital chez EVERIAL.
Qu’est-ce que l’IA générative a transformé en matière de gestion documentaire ?
L’IA générative représente un tournant significatif dans la gestion documentaire. Elle permet de se concentrer sur l’information contenue dans des masses de documents au sein des entreprises et d’en extraire des éléments pertinents rapidement. On passe donc d’une gestion documentaire à une gestion de l’information, sans avoir besoin d’une structuration forte de la donnée. Car les IA génératives proposent une compréhension sémantique du document. On s’intéresse à la fois à la forme et au fond.
Comment cela fonctionne concrètement ?
Ces nouvelles Intelligences Artificielles sont entrainées pour comprendre le fond et la forme d’un média. On peut donc les questionner de manière très précise sur le contenu d’un document texte, mais aussi sur le contenu d’une image ou même d’une vidéo. Et c’est dans la précision de ce questionnement que réside le savoir-faire technologique à mettre en place, afin d’obtenir la réponse la plus adaptée.
Comme pour un humain, pour s’assurer de la bonne réponse on va fournir au moteur d’IA le contexte de la question. Par exemple : quel est le périmètre métier ? Les types de réponse attendus par un expert-comptable ou un assureur ne sont pas les mêmes. On va aussi fournir les historiques des questions et réponses posées avant. Et bien sûr on va fournir à l’IA un corpus documentaire le plus précis possible pour comprendre et formuler sa réponse. Ainsi, plus nous sommes précis plus le moteur va être intelligent.
Quelles sont les perspectives pour la gestion documentaire des entreprises ?
Nous constatons aujourd’hui, malgré ces progrès, qu’il n’y a pas de baguette magique. Au-delà des IA Génératives généralistes et grand public, la gestion documentaire nécessite de travailler finement sur des cas d’usages précis. Que l’on souhaite extraire des informations simples d’un ensemble documentaire, que l’on souhaite obtenir une comparaison entre deux contrats d’assurance, ou encore obtenir le résumé d’une thèse, nous pourrons utiliser les mêmes sous-jacents technologiques (LLM, RAG, …), mais adaptés précisément à chaque cas d’usages. Il n’y a pas vraiment de “One Size Fits All”.
Nous allons vers une génération “d’agents IA” qui vont être spécialisés pour tel ou tel cas d’usages, mais aussi capables de communiquer entre eux.
Enfin, au-delà des enjeux énergétiques associés à la consommation électriques, Il y a surtout un réel sujet d’éthique autour des LLM, de leur conception, à leurs jeux de données d’entrainement pour garantir le minimum de “biais cognitif”. La souveraineté des IA Génératives va devenir un enjeu crucial, car demain tous ces “agents IA” vont prendre des décisions à notre place et seront notre source d’informations.
En conclusion, l’IA générative révolutionne la gestion de l’information en permettant aux entreprises d’interroger de grandes bases documentaires multi-média, afin d’obtenir des informations pertinentes sans avoir à organiser les données au préalable. Une évolution qui a indéniablement des répercussions sur les compétences métiers requises avec des data scientist qui deviennent des “information scientist” experts en gestion de l’information s’appuyant sur des “agents IA” de plus en plus spécialisés.
Pour en savoir plus : https://www.everial.com/solutions/gestion-documentaire/