Le chef de l’IA de Meta annonce que les modèles du monde sont la clé de l’IA de niveau humain – mais il pourrait falloir 10 ans

Generated with DALL·E 3

Les modèles actuels d’IA se souviennent-ils, pensent-ils, planifient-ils et raisonnent-ils exactement comme un cerveau humain ? Certains laboratoires d’IA voudraient nous faire croire que oui, mais selon le directeur scientifique de Meta, Yann LeCun, la réponse est non. Il pense cependant que nous pourrions y arriver dans une décennie ou plus, en poursuivant une nouvelle méthode appelée “modèle du monde”. Plus tôt cette année, OpenAI a lancé une nouvelle fonctionnalité appelée “mémoire” qui permet à ChatGPT de “se souvenir” de vos conversations. La dernière génération de modèles de la start-up, le o1, affiche le mot “réflexion” lorsqu’il génère une sortie, et OpenAI affirme que ces mêmes modèles sont capables de “raisonnement complexe”. Tout cela sonne comme si nous étions très proches de l’AGI (Intelligence Générale Artificielle).

Pourtant, lors d’une récente conférence au Hudson Forum, LeCun a tempéré les optimistes de l’IA, tels que le fondateur de xAI, Elon Musk, et le co-fondateur de Google DeepMind, Shane Legg, qui suggèrent qu’une IA de niveau humain est imminente. “Nous avons besoin de machines qui comprennent le monde ; [des machines] capables de se souvenir des choses, qui ont de l’intuition, du bon sens, qui peuvent raisonner et planifier au même niveau que les humains”, a déclaré LeCun lors de sa conférence. “Malgré ce que vous avez pu entendre auprès de certains des personnes les plus enthousiastes, les systèmes actuels d’IA ne sont pas capables de tout cela”. Selon LeCun, les modèles actuels de traitement du langage, comme ceux qui alimentent ChatGPT et Meta AI, sont loin d’être de l'”IA de niveau humain”. L’humanité pourrait prendre des “années voire des décennies” pour atteindre un tel accomplissement, a-t-il dit plus tard.

“Il va falloir des années avant que nous puissions faire fonctionner tout cela, si ce n’est une décennie”, a déclaré Lecun. “Mark Zuckerberg ne cesse de me demander combien de temps cela va prendre.”

LeCun explique que le problème réside dans la manière dont les modèles actuels fonctionnent : les grands modèles de langage (LLM) fonctionnent en prédisant le prochain jeton (généralement quelques lettres ou un mot court), et les modèles actuels d’image/vidéo prédisent le prochain pixel. En d’autres termes, les modèles de langage sont des prévisionnistes unidimensionnels, et les modèles d’image/vidéo sont des prévisionnistes bidimensionnels. Ces modèles sont devenus très bons pour prédire dans leurs dimensions respectives, mais ne comprennent pas vraiment le monde tridimensionnel. En conséquence, les systèmes modernes d’IA ne peuvent pas accomplir de simples tâches que la plupart des humains peuvent faire.

Pour accomplir des tâches plus complexes, LeCun suggère que nous devons construire des modèles tridimensionnels qui peuvent percevoir le monde qui nous entoure et qui se centrent sur un nouveau type d’architecture d’IA : les modèles du monde. “Un modèle du monde est votre modèle mental de la façon dont le monde se comporte”, a-t-il expliqué. “Vous pouvez imaginer une séquence d’actions que vous pourriez entreprendre, et votre modèle du monde vous permettra de prédire quel sera l’effet de la séquence d’action sur le monde.” Les modèles du monde peuvent traiter beaucoup plus de données que les LLM, ce qui les rend également très gourmands en calcul, raison pour laquelle les fournisseurs de cloud se précipitent pour s’associer aux entreprises d’IA.

Les modèles du monde sont l’idée phare que plusieurs laboratoires d’IA poursuivent actuellement, et le terme devient rapidement le prochain mot à la mode pour attirer le financement des entreprises en capital-risque. Un groupe de chercheurs en IA très respectés, dont Fei-Fei Li et Justin Johnson, vient de lever 230 millions de dollars pour leur start-up, World Labs. La “marraine de l’IA” et son équipe sont également convaincues que les modèles du monde permettront de débloquer des systèmes d’IA nettement plus intelligents. Cependant, LeCun indique que nous n’avons pas beaucoup progressé dans la mise en œuvre de ces systèmes. Il y a beaucoup de problèmes très difficiles à résoudre pour passer de l’endroit où nous en sommes aujourd’hui, et il affirme que c’est certainement plus compliqué que nous le pensons.

Partagez cet article
article précédent

Et si la fraude n’était pas une mauvaise nouvelle pour la formation ? – Digiformag

article suivant

IA : vers un renouveau de la suite SIRH ?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Lire plus d'articles