Eugene XIONG
Fondateur et Président du conseil d’administration de Foxit
Foxit est un fournisseur de produits et services PDF et d’e-signature innovants, qui aident les salariés à accroître leur productivité en améliorant l’utilisation des documents.
Les informations structurées sont généralement stockées et interrogées dans des bases de données relationnelles, des systèmes de gestion de la relation client (CRM) et des programmes de gestion intégrée (ERP). Mais les documents ne s’intègrent pas toujours parfaitement dans ces architectures structurées et nécessitent toujours des interactions humaines. Les graphiques, les tableaux, les textes, les dessins techniques, etc. sont des expressions humaines de la pensée et de l’information. Le cerveau humain ne calcule tout simplement pas comme une machine : l’humain a besoin de visualiser les informations et les idées pour les comprendre facilement. Les documents sont donc les supports d’informations et d’idées vitales dont nous avons besoin pour prendre des décisions.
Jusqu’à présent, l’intervention humaine était indispensable au traitement des documents — de l’absorption du contenu, l’extraction de l’information, la compréhension du propos, jusqu’à la prise de décisions en conséquence. Seuls les humains étaient capables de conduire ce processus de bout en bout. Or cette évidence s’estompe avec l’évolution constante de l’intelligence artificielle.
Dans un futur proche, les machines seront probablement capables de traiter des documents de bout en bout sans intervention humaine majeure. Alimentés par l’IA, ces systèmes pourront comprendre facilement les documents, en extraire des informations et des réflexions et prendre des décisions sur la base de leur contenu.
Cette transformation est déjà largement entamée. Comme nous l’avons tous constaté, les plateformes d’IA générative, qui utilisent des algorithmes de traitement du langage naturel et de grands modèles de langage pour l’apprentissage en profondeur, peuvent reconnaître, résumer, traduire et créer du contenu avec une précision croissante après un apprentissage adéquat.
Combiner PDF et IA pour un traitement intelligent des données
Le PDF, technologie universelle de traitement des documents, connaît une petite révolution : de plus en plus de tâches qui, autrefois, ne pouvaient être effectuées que par des humains, sont à présent prises en charge par l’IA générative. Des fonctions PDF comme la rédaction pour protéger les informations privées et sensibles sont désormais automatisées grâce à l’IA générative. En résulte un gain considérable en efficacité et en qualité de travail.
L’IA accroît aussi la puissance de reconnaissance optique de caractères (OCR) pour reconnaître et extraire les informations, structure, texte, graphiques et autres caractéristiques des documents pour offrir de nouvelles capacités telles que la synthèse, l’édition et la création de documents au format PDF. Elle offre la possibilité d’automatiser des processus documentaires entiers. C’est ce que l’on appelle le « traitement intelligent des documents » (IDP).
Quelques exemples : dans le secteur bancaire, les agents de crédit examinent les demandes et les pièces justificatives, puis prennent la décision d’accorder ou non un prêt. Dans les domaines de l’ingénierie ou de l’architecture, les professionnels créent et examinent des dessins ou des plans de bâtiment qui doivent répondre à certaines normes. L’IA pourrait à terme automatiser ces processus, les humains n’ayant plus qu’à superviser les exceptions en dehors de certaines normes.
On considère parfois à tort le format PDF comme un format statique de partage et d’archivage de documents que l’on ne peut pas modifier ni exploiter. Mais au fil du temps, le format PDF s’est adapté à toutes sortes de flux de travail avant l’archivage d’un fichier. En effet, grâce aux fonctions interactives, telles que le remplissage de formulaires, les utilisateurs peuvent modifier dynamiquement les champs de données dans les documents PDF.
Ce format est devenu une plateforme programmable avec l’introduction du JavaScript qui permet de personnaliser tous les types d’interactions avec l’utilisateur. L’introduction d’objets 3D, qui peuvent interagir avec d’autres parties d’un document PDF, en a fait naturellement le format destiné à l’échange de documents d’ingénierie 3 D.
Aujourd’hui, le format PDF englobe à la fois des données structurées et non structurées. En taguant les documents PDF avec des métadonnées, on permet d’identifier des listes, des tableaux, des en-têtes et d’autres éléments, ainsi que le contenu lui-même, pour rendre les PDF plus accessibles et plus utiles dans les flux de travail documentaires.
Il est donc facile d’imaginer que le traitement intelligent des documents, alimenté par l’IA générative, rendra le PDF exponentiellement plus utile dans les flux de travail. Ce format présente des avantages uniques, tels que l’indépendance vis-à-vis de l’environnement, la sécurité, la traçabilité et la vérifiabilité, qui peuvent en faire une plaque tournante de données précieuses entre les systèmes.
L’ère du traitement intelligent des documents est arrivée
Pour rendre possible le traitement intelligent des documents, deux paramètres sont essentiels.
Le premier paramètre est l’intelligence optimisée pour analyser les documents. Le document est un support humain qui sera toujours essentiel à la façon dont nous créons, échangeons, comprenons, préservons et agissons sur l’information et les idées. Cependant, le rendre plus accessible à l’automatisation par des machines pose des défis importants. Le traitement intelligent des documents alimenté par l’IA est la clé de grandes avancées pour combler le fossé entre la manière dont les humains et les systèmes informatiques traitent l’information.
Le second paramètre est la connaissance du domaine qui permet de former et de mettre cette intelligence au service de flux de travail significatifs tel que l’approbation de prêts, le traitement de plans d’ingénierie ou de documents médicaux.
L’IA générative prête à l’emploi n’est donc pas une solution de traitement intelligent de documents. Les plateformes d’IA telles que ChatGPT sont formées sur d’énormes volumes de données accessibles au public et non pour des domaines et des industries spécifiques. Des ajustements et un apprentissage important sont nécessaires pour intégrer l’IA aux divers processus documentaires.
En outre, les fournisseurs de solutions et les entreprises devront poursuivre l’encadrement de l’IA pour comprendre et traiter les flux de travail spécifiques à un secteur vertical, à une entreprise ou à un individu. Il s’agit actuellement d’un processus évolutif qui nécessite une intervention humaine, non seulement pour l’apprentissage, mais aussi pour le pilotage et la mesure des résultats.