Dépassez l’engouement pour l’IA générative et ses potentielles conséquences néfastes pour vous intéresser aux technologies porteuses qui présentent un grand intérêt.
Dépassez l’engouement pour l’IA générative et ses potentielles conséquences néfastes pour vous intéresser aux technologies porteuses qui présentent un grand intérêt.
Auteur Arun Chandrasekaran | 14 novembre 2024
Lorsqu’il s’agit d’IA générative, on observe un engouement important, au même titre que l’évolution rapide des technologies et des techniques qui sous-tendent l’IA générative. Nous prévoyons que d’ici 2026, plus de 80 % des entreprises auront utilisé des API ou des modèles d’IA générative et/ou auront déployé des applications basées sur l’IA générative dans des environnements de production, alors qu’elles étaient moins de 5 % en 2023.
L’enthousiasme suscité par les technologies et techniques disponibles, ainsi que leur volume, peut rendre difficile pour les responsables de l’IA de déterminer lesquelles auront le plus de retombées commerciales dans l’immédiat et dans un avenir plus lointain. Utilisez le Hype Cycle relatif à l’IA générative pour identifier des innovations exploitables, en fonction de l’appétence de votre entreprise pour le risque lors de la recherche de gains potentiels.
Les technologies de base qui composent la panoplie des technologies de l’IA générative se répartissent en quatre grandes catégories : les modèles d’IA générative, les outils d’ingénierie de l’IA, les applications et les différents types d’utilisation, ainsi que les techniques et l’infrastructure permettant la mise en œuvre de l’IA.
Les modèles d’IA préalablement formés évoluent et deviennent des modèles multimodaux, ils sont également formés pour devenir des modèles conversationnels. Les innovations qui entrent dans cette catégorie sont les suivantes :
Les modèles de fondation : des modèles comportant un grand nombre de paramètres et qui ont été formés sur de nombreux ensembles de données en mode autosupervisé
Les modèles d’encodage vectoriel (embedding models) : des modèles de machine learning utilisés pour représenter des données multidimensionnelles (comme du texte ou des images) sous forme de vecteurs intégrés
Les modèles d’IA générative spécifiques à un domaine : des modèles optimisés pour les besoins de secteurs d’activités spécifiques, de fonctions commerciales ou de regroupements de tâches connexes
Edge GenAI ou IA générative en périphérie : fait référence au déploiement de modèles d’IA générative en périphérie du réseau ou à proximité, dans les smartphones, les PC, les appareils IdO et les serveurs en périphérie
Intelligence artificielle générale : l’intelligence artificielle générale (IAG) caractérise l’intelligence (encore théorique) d’une machine capable d’accomplir toutes les tâches intellectuelles qu’un être humain est en mesure d’accomplir
Un écosystème croissant d’outils et de techniques d’IA générative permet aux entreprises de concevoir, de gouverner et de personnaliser des applications d’IA générative. Les innovations qui entrent dans cette catégorie sont les suivantes :
AI TRiSM : la gestion de la confiance, des risques et de la sécurité en matière d’IA (AI trust, risk and security management, AI TRiSM) garantit la gouvernance du modèle d’IA, sa fiabilité, son équité, sa solidité, son efficacité et la protection des données.
Désinformation et sécurité : un ensemble de technologies permettant de lutter contre la désinformation dans le but d’aider les entreprises à susciter la confiance, à protéger leur image de marque et à sécuriser leur présence en ligne.
Structures d’orchestration des applications de l’IA générative : ces structures fournissent une couche d’abstraction permettant l’enchaînement d’invites, l’enchaînement de modèles, la mise en relation avec des API externes, l’extraction de données contextuelles à partir de sources de données et le maintien de l’état (ou de la mémoire) à travers diverses requêtes de modèles.
GraphRAG (génération par graphes augmentée d’information contextuelle) : cette technique améliore la précision, la fiabilité et les capacités à expliquer les résultats des systèmes de génération augmentée par récupération/enrichissement contextuel (RAG). L’approche fait appel à des graphes de connaissances (Knowledge Graphs, KG) pour renforcer la mémorisation et la précision de la recherche, soit directement en extrayant des faits d’un graphe, soit indirectement en optimisant d’autres méthodes de recherche.
Le nombre considérable d’applications et de scénarios d’utilisation de l’IA générative permet d’envisager une adoption rapide et une valeur commerciale. Les applications dans les domaines du service client, de l’informatique et du marketing sont les plus prometteuses. Les innovations qui entrent dans cette catégorie sont les suivantes :
Assistants virtuels faisant appel à l’IA générative : cette nouvelle génération d’assistants virtuels s’appuie sur de grands modèles de langage (Large Language Models, LLM) pour offrir des services qui ne seraient pas en mesure d’être assurés par les technologies traditionnelles d’IA conversationnelle.
Applications assistées par l’IA générative : cette technologie fait appel à l’IA générative pour améliorer l’expérience utilisateur (UX) et enrichir les tâches afin de faciliter et d’accélérer l’accomplissement des résultats souhaités par l’utilisateur.
Le génie logiciel enrichi par l’IA : la mise en œuvre de technologies d’intelligence artificielle pour assister les ingénieurs chargés de l’élaboration des logiciels tout au long du cycle de vie de ces derniers. Cela comprend la création, la validation, la sécurisation, le déploiement et la maintenance des applications.
Les agents autonomes : des ensembles de systèmes qui permettent d’atteindre des objectifs définis sans intervention humaine. Ils font appel à diverses techniques d’IA pour identifier des modèles dans leur environnement, prendre des décisions, exécuter une séquence d’actions et générer des résultats.
Données synthétiques : une catégorie de données générées artificiellement plutôt qu’obtenues à partir d’observations directes du monde réel. Les données synthétiques sont utilisées pour remplacer les données réelles dans un grand nombre d’applications, y compris dans le cadre de l’anonymisation des données.
L’IA générative existe (et progressera) grâce à de nouvelles techniques et à plusieurs méthodes d’IA préexistantes. Parallèlement, des infrastructures spécialisées, notamment des superordinateurs puissants, permettront de former plus rapidement des modèles et d’accélérer le processus d’inférence. Les innovations qui entrent dans cette catégorie sont les suivantes :
Accélérateurs de charge de travail pour l’IA générative : des puces qui fonctionnent aux côtés d’un processeur et prennent en charge des opérations de traitement hautement parallèles pour développer (entraînement) et exécuter (inférence) des applications basées sur de grands modèles d’IA générative
Simulation par IA : l’application combinée des technologies de l’IA et de la simulation pour développer conjointement des agents assistés de l’IA et des environnements simulés dans lesquels ceux-ci peuvent être formés, testés et parfois déployés
Le calcul intensif appliqué à l’IA : un domaine en pleine évolution où des systèmes supercalculateurs conçus à cet effet combinent des innovations de pointe en matière d’accélérateurs de calcul, de logiciels spécialisés, de réseaux à haut débit et de stockage aux performances optimisées pour créer une plateforme intégrée qui accélère la formation et le déploiement de modèles d’IA complexes et exigeants en termes de calcul
Apprentissage auto-supervisé : une approche de l’apprentissage automatique (Machine Learning) dans laquelle les données cataloguées ou les signaux de supervision sont créés à partir des données elles-mêmes, sans qu’il soit nécessaire de s’appuyer sur des données de résultats historiques ou sur des superviseurs humains pour attribuer des étiquettes ou fournir un retour d’information.
Apprentissage par transfert : Une technique d’IA qui réutilise des modèles de Machine Learning (ML) précédemment formés et les utilise comme point de départ avancé pour de nouvelles tâches, afin de réduire le temps d’apprentissage et les données nécessaires pour atteindre des performances acceptables pour ces nouvelles tâches
Le Hype Cycle relatif à l’IA est une représentation graphique établie par Gartner du degré de maturité, des critères d’adoption et des incidences commerciales des technologies de l’IA générative. Il permet aux DSI et autres responsables informatiques d’identifier les innovations de l’IA générative qu’ils peuvent exploiter, en fonction de leur appétence pour le risque dans le cadre de la recherche de gains potentiels.