L’intelligence artificielle (IA) crée de nombreuses opportunités pour un large éventail d’opérations intelligentes et automatisées. Parmi celles-ci, l’extraction de métadonnées et l’enrichissement de données font partie des actions les plus précieuses et les plus utilisées par les entreprises cherchant à exploiter rapidement le potentiel des données et contenus dont elles disposent. Optimisées grâce à l’IA, les techniques de tri, de filtrage et d’ajout de contexte à d’importants volumes de données peuvent vous aider à développer un véritable avantage sur la concurrence. En associant des services d’IA standard basés dans le Cloud à des solutions d’IA personnalisées et spécialisées, les entreprises sont en mesure d’orienter les services s’appuyant sur leurs données pour mieux répondre à leurs objectifs.
Le casse-tête du contenu
Même si les entreprises accumulent toujours plus de contenu, la plupart d’entre elles ne bénéficient pas du gain de connaissance recherché et ne voient pas de réel avantage opérationnel, comme le montre un article du Software Development Times. Basé sur les résultats d’une étude IDG, l’article précise ainsi que « les volumes de données augmentent en moyenne de 63 % par mois, 12 % des entreprises évoquant même une croissance mensuelle supérieure à 100 %. Selon une étude IDC, pour la seule année 2018, les fournisseurs de services de stockage ont accru leur capacité de stockage de plus de 700 exaoctets afin de répondre à cette augmentation des volumes de données. »
Le défi réside dans le fait que la connaissance et la valeur inhérentes à ces énormes volumes de données et contenus sont généralement submergées, rendues inaccessibles par des systèmes de gestion de l’information déconnectés, des métadonnées non uniformisées, une recherche ne rassemblant pas les divers systèmes métiers ou encore des processus de saisie lents, manuels et sujets aux erreurs. C’est là que l’intelligence artificielle et le machine learning s’avèrent intéressants, facilitant l’extraction de métadonnées pour les contenus visuels et textuels et automatisant les opérations métiers reposant sur la transformation de contenus non structuré ou de données provenant de différents systèmes en connaissance métier. Alors que les perspectives d’avenir sont nombreuses pour les technologies d’IA, le véritable défi reste l’enrichissement de documents et l’ajout de contexte à des données déjà disponibles aujourd’hui. En facilitant la recherche d’information, en la rendant plus accessible dans un réseau complexe de systèmes et en la contextualisant, les entreprises maximisent la valeur de leurs ressources.
Écrivant pour Forbes, Bernard Marr résume la situation :
Si l’on prend un peu de recul, l’intelligence artificielle (IA) n’en est encore qu’à ses débuts et la plupart des entreprises commencent seulement à l’adopter. Cependant, les leaders sont généralement excités à l’idée d’intégrer l’IA aux opérations quotidiennes de leur entreprise pour bénéficier de ses nombreux avantages.
Dans son article 10 Business Functions That Are Ready to Use Artificial Intelligence, Bernard Marr poursuit et liste les opérations pouvant être améliorées grâce à l’IA, dont plusieurs capitalisant sur la valeur inhérente des données et du contenu de façon innovante et pertinente.
Maîtriser l’IA pour enrichir les données
De plus en plus de services d’IA génériques proposent une base pour enrichir ses données et peuvent s’intégrer à une plateforme de services de contenu (CSP) moderne afin de donner plus de valeur aux documents, images, vidéos, etc. Les services d’IA proposés par Google, Microsoft, Amazon et autres incluent :
- le traitement automatique du langage naturel, l’analyse des sentiments et l’extraction d’entités (pour catégoriser et classifier les éléments textuels).
- la reconnaissance vocale et écrite (speech to text et text to speech), la reconnaissance de formulaires et l’analyse textuelle.
- la traduction de différents langages à l’aide de techniques de traitement neuronal.
- la création, l’entraînement et le perfectionnement automatisés de modèles grâce à des fonctionnalités de gestion complètes.
Les leaders du secteur proposant des services d’IA similaires, les utilisateurs sont libres de choisir la solution qu’ils préfèrent.
Un exemple d’utilisation de l’IA au quotidien est l’automatisation de la conversion d’un large volume d’images au format TIFF en PDF. Les documents ainsi créés sont plus riches et plus faciles à parcourir, proposant une indexation plein-texte ainsi que des recherches optimisées dans les documents. Par exemple, la recherche de termes spécifiques dans un PDF (nom du client, ville, référence produit, etc.) peut être exécutée rapidement et identifier chaque occurrence du terme cherché.
La conversion inclut les étapes suivantes :
- Utilisation d’un service d’OCR (reconnaissance optique de caractères) basé sur l’IA pour créer un fichier texte à partir de l’image TIFF, pour une indexation et une utilisation optimisées. Amazon Textract fait partie des services performants dans ce domaine.
- Transformer le contenu texte en fichier PDF, cartographier le contenu par rapport à l’image originale.
- Ingérer les fichiers PDF dans une plateforme de services de contenu pour bénéficier d’une indexation plein-texte et de capacités de recherche avancées.
- L’enrichissement des données est utilisé façons selon les secteurs. Par exemple, les assureurs peuvent combiner les dossiers clients, les données télématiques enregistrées pendant le fonctionnement du véhicule, les images d’accident et les vidéos (optimisées via l’IA) pour traiter plus rapidement les sinistres.
Grâce à l’IA, les opérateurs en centre d’appel peuvent appliquer une technologie d’analyse des sentiments pour analyser les réponses des clients au cours d’une conversation et automatiser la récupération d’informations pour que les données clients soient instantanément disponibles. Les banques peuvent détecter les activités frauduleuses, par exemple les opérations réalisées dans un pays éloigné du lieu de résidence du titulaire, et lui envoyer automatiquement une demande pour vérifier que tout est en ordre. Les éditeurs de jeux vidéo souhaitant distribuer des vidéos de gameplay peuvent trier et catégoriser les contenus vidéo par jeu, joueur ou tout autre critère. Optimisées grâce à l’IA et les modèles de machine learning, ces opérations peuvent être simplifiées et débarrassées de nombreuses tâches manuelles pour gagner en efficacité.
Nuxeo Insight pour des services d’IA spécifiques
L’intelligence artificielle a un impact croissant sur les services de contenu. Nuxeo a développé son propre service d’IA, Nuxeo Insight, qui permet aux clients d’entraîner facilement des modèles de machine learning à partir de leurs propres données. Ce service peut apporter un véritable avantage concurrentiel en générant des résultats spécifiques à certaines situations : traitement de sinistres, identification de produits ou service client ».
Jim Lundy, CEO et Lead Analyst chez Aragon Research
Nuxeo Insight permet aux entreprises qui font leurs débuts avec l’IA de profiter des services Cloud publics (notamment Amazon AI Services, Google Cloud AI et Microsoft Cognitive Services) et d’appliquer des modèles de machine learning à leurs opérations. S’appuyant sur ces fonctionnalités génériques, Nuxeo va plus loin et permet de développer des modèles de machine learning spécialisés adaptés aux pratiques, formats de documents et systèmes de gestion de l’information des entreprises. Nuxeo Insight repose sur le framework d’IA TensorFlow, reconnu pour sa flexibilité, et permet de perfectionner et développer des modèles répondant aux besoins de chaque secteur.
Les modèles génériques basés sur TensorFlow peuvent accomplir un large éventail de tâches, mais les modèles personnalisés permettent d’obtenir des résultats bien plus précis. Par exemple, un modèle TensorFlow basique faisant appel à un réseau neuronal complexe peut analyser des images et différencier les chiens des chats dans celles-ci, comme le montre la figure ci-dessous. Un modèle personnalisé et entraîné sera en revanche capable de déterminer si ce chien est un border collie, un golden retriever, un basset hound, etc.

Plus intuitive et destinée aux utilisateurs métiers, la nouvelle interface utilisateur de Nuxeo Insight permet de gérer plus efficacement les différents services d’IA et les ressources stockées sur la plateforme Nuxeo au moyen d’un tableau de bord. Celle-ci optimise également les processus de configuration et d’entraînement des modèles de machine learning, offrant des indicateurs visuels représentant leur efficacité. Vous trouverez de plus amples informations sur cette nouvelle interface visuelle dans l’article Nuxeo Insight : Encore plus performant. Cette approche granulaire offre un contrôle encore plus poussé des ressources.
Cet article est le premier d’une série qui met en avant les moyens dont les clients peuvent utiliser l’IA pour optimiser la gestion de leur contenu. Pour plus d’informations, nous vous conseillons de lire l’article suivant Powering your Content with AI: A 10-minute guide to artificial intelligence in content services platforms.