Buy Crypto Markets Spot FuturesMU Earn Event Center

Les cofondateurs d'AI21 Labs (Israël), de gauche à droite : Ori Goshen, Yoav Shoham et Amnon Shashua.Les cofondateurs d'AI21 Labs (Israël), de gauche à droite : Ori Goshen, Yoav Shoham et Amnon Shashua.

Ce que le « miracle » de l'I.A. dit de l'avenir des technologies d'entreprise

Source : Fortune

2022/04/20 04:37

Temps de lecture : 7 min

Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : crypto.news@mexc.com

AI21 Labs ressemble un peu à la réponse israélienne à OpenAI, basée aux États-Unis. C'est à la fois un laboratoire de recherche, effectuant des travaux de pointe sur le traitement du langage naturel (NLP), et aussi une entreprise commerciale, espérant rapidement pousser ces développements de pointe dans des produits que les vraies entreprises peuvent utiliser—et payer.
AI21 Labs a été fondé par Yoav Shoham, professeur émérite d'intelligence artificielle à l'Université Stanford ; Amnon Shashua, fondateur de la société de logiciels de conduite autonome Mobileye, qui a été acquise par Intel ; et Ori Goshen, fondateur de la plateforme de financement participatif CrowdX. L'objectif ambitieux de l'entreprise est de « réimaginer la façon dont les gens lisent et écrivent, pour le mieux. »
Le laboratoire a construit un nouveau système qu'il appelle avec une certaine audace « Miracle », une version plus conviviale de MRKL, un acronyme pour Modular Reasoning, Knowledge and Language system (système de raisonnement modulaire, de connaissance et de langage). MRKL est important en raison de ce qu'il dit sur quatre tendances clés dans la façon dont les entreprises utiliseront l'IA à l'avenir.
Premièrement, MRKL est conçu pour gérer toutes sortes de tâches en langage naturel, pas seulement un travail spécifique comme la plupart de ces systèmes jusqu'à récemment. Par exemple, si vous vouliez un chatbot de service client, la même IA ne pouvait pas aider à analyser les sentiments des appels de résultats des PDG. Mais maintenant, un seul moteur NLP peut aider à gérer les deux tâches. C'est un autre exemple de la véritable révolution dans le NLP et de l'impact qu'il commence à avoir sur les entreprises.
La deuxième tendance, étroitement liée, à noter est que ces systèmes NLP à usage général seront de plus en plus construits sur des « modèles de langage ultra-larges », des algorithmes uniques qui apprennent des milliards de relations statistiques entre les mots. Ils sont entraînés sur de vastes quantités de texte extraites d'internet, y compris des livres écrits en anglais et dans d'autres langues, ainsi que des sources publiques comme Wikipedia et les fils Reddit. La plupart de ces systèmes sont entraînés soit à prédire un mot manquant dans une phrase, soit le mot suivant dans une phrase. Mais il s'avère que, lorsque vous construisez un système d'IA aussi grand et que vous l'entraînez à faire une chose, il est également capable de faire beaucoup d'autres choses avec peu ou pas d'entraînement supplémentaire : traduction, réponse aux questions et rédaction de passages de texte originaux.
De plus, avec juste un peu plus d'entraînement sur un nombre relativement petit d'exemples, ces grands modèles de langage peuvent souvent surpasser des systèmes d'IA plus petits qui ont été entraînés sur de grands ensembles de données—souvent organisés à grands frais—pour accomplir une seule tâche étroite. C'est cette capacité à fonctionner avec « peu de données » qui rend les modèles de langage ultra-larges si potentiellement attractifs pour les entreprises, car les utiliser pourrait être plus rapide et moins cher.
L'exemple le plus connu d'un modèle de langage ultra-large disponible pour un usage commercial est peut-être le GPT-3 d'OpenAI. OpenAI entretient une relation étroite avec Microsoft, qui a investi plus d'un milliard de dollars dans l'entreprise, et, sans surprise, Microsoft a intégré GPT-3 dans un produit qui écrit automatiquement du code informatique. Il met également la technologie à la disposition de ses clients cloud Azure.

AI21 Labs possède son propre modèle de langage ultra-large appelé Jurassic-1, qu'il a commercialisé l'année dernière et qu'il affirme être supérieur à GPT-3, en partie parce qu'il possède un « vocabulaire de tokens » plus large. Cela fait référence au nombre de mots et de parties de mots qu'il connaît. Jurassic possède un vocabulaire de tokens de plus de 250 000, soit cinq fois celui de GPT-3.
Il existe des problèmes bien documentés avec ces modèles de langage ultra-larges, notamment qu'ils peuvent être incités à produire un langage toxique. Mais un autre défaut majeur est qu'ils ont tendance à produire des informations inexactes en réponse à des questions factuelles.
Par exemple, demandez à GPT-3 d'additionner deux plus deux, et il vous dira avec assurance quatre, mais demandez-lui d'additionner plusieurs nombres à quatre et cinq chiffres, et il y a de fortes chances qu'il vous donne tout aussi confidemment la mauvaise réponse. Demandez-lui quel temps il fait actuellement à New York, et il vous le dira, mais ce sera probablement la température à New York au moment où les données d'AccuWeather ont été extraites dans son ensemble d'entraînement, pas la météo d'aujourd'hui. Le même problème s'applique aux questions sur l'actualité ou même la science. Et parce que ces grands modèles de langage sont si volumineux, ils sont extrêmement coûteux à entraîner—dans les millions de dollars—il n'est donc pas pratique de les mettre à jour constamment pour s'assurer que leurs données sont à la minute près.
C'est le problème qu'AI21 Labs a entrepris de résoudre avec MRKL (j'ai écrit sur l'une des innovations précédentes du laboratoire ici). Ce qui nous amène à la troisième grande tendance que MRKL représente : MRKL est un système hybride. Il n'utilise pas uniquement l'apprentissage profond, la méthode d'IA responsable de la plupart des grandes avancées technologiques au cours de la dernière décennie. Au lieu de cela, il combine différents modules, dont certains utilisent l'apprentissage profond, et d'autres utilisent une forme plus ancienne d'IA, le raisonnement symbolique, pour fournir des réponses précises et à jour aux questions factuelles.
Ce qui est ingénieux dans MRKL, c'est un module appelé routeur qui prend une question d'un utilisateur et détermine quel type d'information l'utilisateur recherche. Si la question implique des mathématiques, il envoie cette question à une simple calculatrice scientifique à l'ancienne. Si elle implique des taux de change, il la dirige vers un convertisseur de devises. Si elle concerne la météo, il l'envoie vers un site de prévisions météorologiques. Il y a 55 de ces modules spécifiques à des tâches que MRKL prend actuellement en charge, selon Shoham. Si le routeur n'est pas sûr du meilleur module, il fait appel à Jurassic-1. Jurassic aide également à composer le langage contextuel autour de la réponse de MRKL.
Une autre innovation ingénieuse ici est la façon dont AI21 Labs est capable d'obtenir le bon type de réponse de Jurassic. Il le fait avec une méthode appelée « prompt tuning », dans laquelle la façon dont une question initiale ou un fragment de texte est soumis au modèle de langage ultra-large aide à déterminer la nature du résultat. C'est une façon d'ajuster l'IA pour un type particulier de tâche sans avoir à l'affiner avec des données d'entraînement supplémentaires. Le problème avec l'entraînement supplémentaire est que, à mesure que le système s'améliore dans une tâche étroite, il se dégrade en réalité dans d'autres. Les chercheurs appellent ce problème « l'oubli catastrophique ».
Certains chercheurs en IA surmontent l'oubli catastrophique en entraînant le modèle pour une variété de tâches disparates en même temps, mais cela nécessite beaucoup de puissance informatique, de temps et d'argent. Le prompt tuning évite cela. L'innovation d'AI21 Labs avec MRKL est de créer de petits modules d'apprentissage profond qui peuvent automatiquement effectuer un prompt tuning de Jurassic à la volée, en prenant la requête d'un utilisateur et en composant le meilleur ensemble de prompts pour inciter Jurassic à fournir des réponses dans le style et le format corrects.
Et avec cela, voici le reste des nouvelles de cette semaine en matière d'IA.

Jeremy Kahn
@jeremyakahn
jeremy.kahn@fortune.com

Cette histoire a été initialement publiée sur Fortune.com

Combo Coupe du monde : 200x

20 matchs de la Coupe du monde en un seul ordre

Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter crypto.news@mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

Où les emplois en I.A. explosent en nombre (ce n'est pas dans la Silicon Valley)

Deux rapports indiquent de grandes disparités dans l'adoption de l'I.A. selon la géographie et le secteur.

Fortune2020/03/10 19:39

Shelly Group constate une demande croissante pour l'automatisation intelligente des bâtiments alors que les vagues de chaleur estivales s'intensifient

Shelly Group s'attend à ce que l'automatisation intelligente des bâtiments se développe avec l'augmentation des vagues de chaleur estivales. Leurs solutions IoT gèrent le refroidissement, l'occultation et l'énergie, en intégrant

Citybuzz2026/07/01 05:13

MAGA s'effondre après que Melania Trump défend la décision de la Cour suprême : « J'ai perdu le respect »

Les partisans de MAGA étaient furieux après que la première dame Melania Trump a publié mardi une rare déclaration exprimant son soutien à la communauté LGBTQ+. Trump a partagé ses commentaires

Rawstory2026/07/01 05:19

Prédisez & partagez 8M USDT

200K USDT quotidiennement et plus avec les séries

Actualités tendance

Plus

Actualités en direct 24h/24 et 7j/7

Plus

Mastercard développe un réseau de stablecoins, s'alignant sur les capacités existantes de Ripple. Le XRP fonctionne à grande échelle.

Auteur : Ripple Bull Winkle | Crypto Researcher 🚀🚨06:49

La notation de SNDK impacte le marché, Kioxia reste inchangée.

Auteur : DEG06:07

Cardone Capital a acheté 282 BTC, portant ses avoirs totaux à plus de 2 700 BTC.

Auteur : BlockNews04:11

Ripple obtient deux licences au Royaume-Uni, impact potentiel sur le marché du XRP.

Auteur : Ripple Bull Winkle | Crypto Researcher 🚀🚨04:03

Solana perçue comme la blockchain dominante, influençant la dynamique du marché.

Auteur : moon02:14

Prix des cryptomonnaies

Bitcoin

BTC

$58,621.57

$58,621.57$58,621.57

+0.41%

Ethereum

ETH

$1,569.90

$1,569.90$1,569.90

+0.29%

USDCoin

USDC

$1.00111

$1.00111$1.00111

-0.01%

Solana

SOL

$73.59

$73.59$73.59

+0.62%

XRP

$1.0395

$1.0395$1.0395

+0.55%

Ce que le « miracle » de l'I.A. dit de l'avenir des technologies d'entreprise

Vous aimerez peut-être aussi

Où les emplois en I.A. explosent en nombre (ce n'est pas dans la Silicon Valley)

Shelly Group constate une demande croissante pour l'automatisation intelligente des bâtiments alors que les vagues de chaleur estivales s'intensifient

MAGA s'effondre après que Melania Trump défend la décision de la Cour suprême : « J'ai perdu le respect »

Actualités tendance

La SEC sollicite des commentaires du public sur la réglementation de la prochaine génération d'ETFs indiciels

Le RLUSD de Ripple se réduit rapidement alors qu'un nouveau Stablecoin majeur émerge

Le plan de Strategy suscite le débat alors que les actions MSTR et STRC bondissent

La suprématie américaine en matière d'I.A. pourrait dépendre de ces politiques proposées

Dollar canadien : TD Securities voit un potentiel de reprise face au dollar américain

Actualités en direct 24h/24 et 7j/7

Prix des cryptomonnaies