Déjà dynamisé par la généralisation du télétravail, le marché de la gestion de contenu d’entreprise devrait bénéficier pleinement des apports de l’IA générative. Faisant le pont entre le back et le front office, les solutions d’ECM sont plus que jamais incontournables. Par Xavier Biseul
ED, ECM, KM ou CSP : au cours de ces 25 dernières années, les solutions de gestion de contenu ont pris différents acronymes pour répondre à la même réalité. Il s’agit, dans tous les cas, de créer un référentiel unique, centralisant l’ensemble des documents et contenus d’une entreprise. Afin de les rendre plus accessibles, ce référentiel est doté d’un portail collaboratif et des fonctionnalités de recherche et de gestion de workflows.
Si l’appellation d’Enterprise Content Management (ECM) reste la plus utilisée, Gartner tente d’imposer depuis 2017 celle de Content Services Platform (CSP). En s’interfaçant avec des systèmes tiers comme des ERP ou des CRM, ces « plateformes de services de contenu » ont vocation à synchroniser toutes les données, structurées ou non, de l’entreprise. En fédérant ainsi les flux, un collaborateur n’a plus à zapper d’une application à l’autre pour accéder à la bonne information.
Covid-19 et pression réglementaire
Quel que soit le nom qu’on lui donne, ce marché devrait doubler d’ici 2028, porté par une croissance annuelle de près de 15 % selon le cabinet Mordor Intelligence (lire encadré « Un marché appelé à doubler d’ici 2028 », p. 28). Il bénéficie, de fait, de plusieurs courants porteurs. La « cloudification » des systèmes d’information autorise tout d’abord de dématérialiser un nombre croissant de processus. Cette numérisation a été encore accélérée par la crise liée au Covid-19.
« La crise sanitaire a servi de révélateur, estime Mountaha Ndiaye, directeur EMEA, Ecosystem Sales & Programs d’Hyland. Elle a permis aux entreprises de se rendre compte de la nécessité de rendre accessibles leurs documents. » Entré aujourd’hui dans le travail en mode hybride, un collaborateur doit pouvoir, à distance et en toute sécurité, consulter, valider ou signer un document quel que soit son lieu de travail.
La pression réglementaire est un autre élément déclencheur. Une plateforme permet d’assurer la confidentialité et la traçabilité de la donnée dans le cadre du RGPD ou, demain, du DORA (Digital Operational Resilience Act), le futur règlement européen sur la résilience des systèmes d’information. « L’ECM offre un socle de gouvernance qui permet d’aborder une nouvelle réglementation sans avoir à tout rebâtir », juge Mountaha Ndiaye.
Bien que repoussée, la réforme de la facturation électronique (lire encadré « Facturation électronique : une réforme reportée de plus de deux ans », p. 25) devrait également dynamiser le marché, selon Olivier Rajzman, directeur commercial France de DocuWare.
« Le passage à la facturation électronique conduit les éditeurs d’ERP, comme SAP, Sage ou
Cegid, à s’intéresser à la numérisation des documents. Ce sont à la fois des partenaires et des concurrents potentiels, compte tenu de leur importante base installée. En gérant des flux sans apport réel de valeur, ils devraient avant tout inciter les entreprises à se doter d’une vraie solution de gestion de contenu. »
Un marché en voie de consolidation
Pour couvrir un large spectre, nous avons donné la parole à des éditeurs se positionnant sur les différents segments du marché. DocuWare et M-Files proposent avant tout des solutions de GED pour les PME et ETI ; Hyland, Tessi et OpenText s’adressent à de plus grandes organisations. Des éditeurs qui conduisent des stratégies de développement sensiblement différentes.
Sur ce marché de l’ECM, Hyland joue le rôle du grand consolidateur. L’américain a racheté coup sur coup l’acteur open source Alfresco en septembre 2020, puis la société française Nuxeo en mars 2021. Avec sa propre plateforme
OnBase, Hyland peut proposer, selon les termes de Mountaha Ndiaye, « trois univers et trois propositions de valeurs ».
Avec son approche horizontale, OnBase a vocation à synchroniser l’ensemble des données d’entreprise en s’interfaçant avec plus de 500 applications tierces. Plateforme de gestion documentaire, Alfresco intègre les processus métiers grâce à l’apport du Business Process
Management (BPM). Créé pour le cloud et low-code, Nuxeo répond, avec ses hautes performances et sa capacité à manipuler des médias riches, à des cas d’usage exigeants.
Le canadien OpenText a aussi participé à la consolidation du marché en s’offrant Micro Focus pour 6 milliards de dollars en août 2022. L’éditeur peut exploiter le portefeuille d’actifs logiciels de ce dernier dans le domaine de la cybersécurité, mais également deux pépites acquises par Micro Focus auprès de HP en 2017, à savoir Vertica, une base de données en colonnes pour gérer les données structurées, et Idol, d’Autonomy, une plateforme de recherche avancée reposant sur des technologies d’apprentissage automatique (machine learning).
Avec son projet Titanium, initié en juin 2022, l’éditeur a accéléré ses investissements dans le cloud en renforçant son OpenText Cloud Platform, disponible dans un cloud privé ou public ou hors cloud. « OpenText n’impose pas de mode d’hébergement en proposant trois formats possibles : on-premise, cloud ou SaaS », avance Benoit Perriquet, vice-président Worldwide Head Global Accounts.
Les éditeurs européens jouent la carte de la souveraineté
Face à ces géants anglo-saxons, les autres acteurs affichent leurs différences. L’éditeur finlandais M-Files joue de son ancrage sur le Vieux Continent. « Le fait d’avoir des équipes commerciales locales et des racines européennes est un facteur différenciant, avance Ville Somppi, vice-président Industry Solutions. Notre compréhension des réglementations locales, comme le RGPD, et la garantie d’un hébergement des données dans l’Union européenne influencent positivement nos ventes. »
Avec des sièges sociaux en Allemagne et aux États-Unis, DocuWare, fondé il y a 35 ans outre-Rhin, conserve quant à lui un pied dans l’Ancien et le Nouveau Monde. Et si l’éditeur a été racheté il y a quatre ans par Ricoh, un de ses distributeurs, il conserve une large autonomie. « Nous travaillons aussi avec Minolta et Konica, précise Olivier Rajzman. Ce rachat a surtout accéléré notre croissance à l’international. »
Troisième par son importance, la filiale française affiche la plus forte croissance du groupe selon son directeur commercial. L’éditeur, qui a pris le virage cloud il y a dix ans, se concentre sur son marché des PME et ETI, même s’il peut accrocher quelques grands comptes comme Bouygues Telecom (6 000 utilisateurs). « Le taux d’équipement des TPE et PME est faible, de l’ordre de 20 à 30 %, en deçà de celui des ERP », évalue Olivier Rajzman.
Tessi : un pari à 10 millions d’euros
Tessi présente pour sa part un positionnement original. À la fois éditeur, intégrateur, hébergeur et infogérant, le groupe français propose une offre globale de numérisation des processus documentaires à ses clients, parmi lesquels on compte Enedis, Verisure, Foncia, Groupama ou encore Arkea. Il commercialise deux solutions à son portefeuille : Docubase, intégrant les fonctions de GED de workflow et de case management, et Data Content, dédiée à l’archivage électronique à valeur probatoire.
Hébergeant plus de 20 péta-octets (Po) de données dans ses propres data centers, la société grenobloise joue également la carte de la souveraineté. « C’est un critère clé pour nos clients qui souhaitent se protéger du principe d’extra-territorialité propre à certains États », rappelle Emmanuelle Ertel, DG Innovation&Trust, la digital factory du groupe Tessi. Nous nous fixons aussi pour objectif d’être certifiés SecNumCloud à horizon 2025, sur la dernière version du standard proposé par l’Anssi. »
Avec Tardigrade, Tessi affiche par ailleurs son ambition. Développée depuis plus de deux ans et faisant l’objet de 10 millions d’euros d’investissement, cette nouvelle solution d’iBPMS (Intelligent Business Process Management Systems) sera lancée le 1er avril 2024, intégrant des grands modèles de langage (LLM) de l’IA générative, dont GPT-3 d’OpenAI
et Llama 2 de Meta, afin d’automatiser des processus métier, cartographier des parcours clients et concevoir l’expérience utilisateur la plus adaptée.
Solution souveraine, Tardigrade développe aussi une couche de low-code/no-code afin de permettre à tout utilisateur d’automatiser ou d’accélérer certaines tâches fastidieuses, comme la saisie d’informations dans des bases de données ou la rédaction de fiches produits. « Cette approche permet de désiloter l’information en plaçant le sachant au centre, analyse Emmanuelle Ertel. En assurant lui-même l’automatisation du process, le citizen developer va pouvoir réaliser la convergence entre le back office et le front office. »
L’IA conjuguée à l’automatisation des processus métiers (RPA, Robotic Process Automation) permet par ailleurs « d’identifier des tâches redondantes et répétitives aisément automatisables ainsi que les goulots d’étranglement afin de déployer et de fluidifier les flux de travail », complète Emmanuelle Ertel. Avec Tardigrade, Tessi est « le premier acteur français à proposer ce type de solution face aux compétiteurs américains ».
IA générative : des apports déjà tangibles
En revanche, Tessi n’est pas le seul éditeur à capitaliser sur les apports de l’IA générative. Sur leurs feuilles de route R&D, ses concurrents ont placé les grands modèles de langage en tête de leurs priorités. Ils permettront d’aller un cran plus loin que l’IA « traditionnelle » qui permet déjà d’extraire des données de documents complexes – comme des formulaires manuscrits, des PDF ou des images – puis de les classer.
Avec Aino (prononcez « I know »), M-Files propose un assistant capable d’organiser l’information, de comprendre le contexte des documents et d’interagir en langage naturel.
« Les utilisateurs peuvent traiter rapidement de gros volumes de documents quelle que soit la langue, poser des questions et obtenir des réponses, juge Ville Somppi. Aino accélère le travail quotidien et aide à révéler la connaissance enfouie dans la masse de documents d’une organisation. »
« Agnostiques, nous ne voulons pas être dépendants d’un ChatGPT ou d’un Gemini. »
Mountaha Ndiaye, directeur EMEA,
Ecosystem Sales & Programs d’Hyland.
Olivier Rajzman voit également l’IA comme « une nouvelle interface homme-machine offrant un accès plus rapide et intelligible à l’information. Ce qui permettra d’améliorer la recherche de documents.Demain, un utilisateur posera la question en langage naturel : “Quelles clauses ce contrat comprend-il ?” ».
L’IA permettra aussi, selon lui, de classer automatiquement des documents dans des bacs virtuels sans contrôle humain. Les outils de reconnaissance intelligente (intelligent indexing) de DocuWare permettent d’ores et déjà d’assurer automatiquement la réconciliation des commandes et des factures et d’identifier d’éventuelles erreurs comptables.
Chez OpenText, l’assistant intelligent s’appelle Aviator. Présenté en octobre 2023, il permet de « comprendre » un document, de le résumer ou de le traduire à la volée, mais aussi d’améliorer la cybersécurité ou la productivité des équipes IT. « Dans une
deuxième vague, Aviator permettra de générer des documents personnalisés, comme des fichiers commerciaux, et de les associer automatiquement à des environnements Salesforce ou SAP », prévoit Benoit Perriquet. OpenText utilise notamment
le moteur LLM Vertex AI de Google Cloud.
De son côté, Hyland développe ses moteurs ou fait appel à ceux du marché, tels qu’Amazon Bedrock ou Google Vision. « Agnostiques, nous ne voulons pas être dépendants d’un ChatGPT ou d’un Gemini », estime Mountaha Ndiaye, qui voit dans l’IA générative la possibilité d’« augmenter » les documents en analysant ses métadonnées pour les définir et les classifier. « L’IA permet aussi de déterminer automatiquement le niveau de confidentialité à appliquer pour un type de document donné. »
Lutter contre les « dark data », un enjeu environnemental
Autre enjeu fort : la réduction de l’empreinte carbone du patrimoine informationnel. Une solution d’ECM peut apporter sa contribution à l’effort de sobriété énergétique en proposant une gouvernance de la donnée permettant de s’attaquer au problème des « dark data », à savoir ces données oubliées, incomplètes, inutiles ou redondantes mais qui génèrent des émissions de CO2.
« Une politique vertueuse consiste à nettoyer régulièrement ses données en supprimant celles qui ne sont pas consultées depuis des mois, voire des années, rappelle Emmanuelle
Ertel. Il s’agit, par ailleurs, d’appliquer le mode de stockage cloud “tiède” ou “froid” le plus adapté en fonction de la fréquence d’accès à la donnée et de sa durée de conservation. » Et comme on n’améliore que ce que l’on mesure, Tessi propose une calculette, baptisée Ekodata, pour mesurer l’empreinte carbone du numérique et définir des axes de progrès.