Medal, une plateforme dédiée au téléchargement et au partage de clips de jeux vidéo, a récemment fait un grand pas en avant en créant un nouveau laboratoire de recherche en intelligence artificielle, General Intuition. Ce dernier utilise une vaste collection de vidéos de jeux pour former et développer des modèles de base et des agents AI capables de comprendre comment les objets et les entités se déplacent dans l’espace et le temps, un concept connu sous le nom de raisonnement spatial-temporel. Avec un ensemble de données constitué de deux milliards de vidéos par an provenant de dix millions d’utilisateurs actifs mensuels à travers des dizaines de milliers de jeux, General Intuition mise sur une ressource unique qui surpasse des alternatives comme Twitch ou YouTube en matière de formation d’agents.
“Lorsque vous jouez à des jeux vidéo, vous transférez essentiellement votre perception, généralement à travers une vue à la première personne, vers différents environnements”, a déclaré Pim de Witte, PDG de Medal et de General Intuition, dans une interview accordée à TechCrunch. Il a noté que les joueurs qui téléchargent des clips ont tendance à poster des exemples très négatifs ou très positifs, fournissant ainsi des cas extrêmes qui s’avèrent particulièrement utiles pour l’entraînement. “Vous obtenez un biais de sélection vers précisément le type de données que vous souhaitez utiliser pour votre travail d’entraînement.”
L’objectif ultime de General Intuition est de rendre les agents capables de raisons spatiaux-temporels, une compétence cruciale pour le développement d’une intelligence artificielle générale.
Cette richesse de données a suscité l’intérêt d’OpenAI, qui aurait tenté d’acquérir Medal l’année dernière pour 500 millions de dollars, selon The Information. Général Intuition a également réussi à lever 133,7 millions de dollars lors d’un tour de table de financement initial, dirigé par Khosla Ventures et General Catalyst, avec la participation de Raine. Les fonds seront utilisés pour renforcer l’équipe de chercheurs et d’ingénieurs dédiée à la formation d’un agent général capable d’interagir avec le monde qui l’entoure, avec des applications initiales dans le domaine des jeux vidéo et des drones de recherche et de sauvetage.
De Witte a déclaré que l’équipe fondatrice avait déjà réalisé des avancées significatives : le modèle de General Intuition peut comprendre des environnements sur lesquels il n’a pas été formé et prédire correctement des actions dans ceux-ci. Ce faisant, les agents ne se basent que sur des entrées visuelles, ne voyant que ce qu’un joueur humain verrait. Cette méthode pourrait également être transférée à des systèmes physiques comme des bras robotiques, des drones et des véhicules autonomes, souvent manipulés par des humains à l’aide de contrôleurs de jeux vidéo.
Le prochain objectif de General Intuition est double : créer de nouveaux mondes simulés pour former d’autres agents et naviguer de manière autonome dans des environnements physiques totalement inconnus. Cette approche technique façonne la stratégie de commercialisation de la technologie de la startup et la distingue des concurrents qui construisent des modèles de mondes. Alors que General Intuition crée également des modèles de monde pour entraîner ses agents, ceux-ci ne constituent pas le produit final. “Notre objectif n’est pas de produire des modèles qui concurrencent les développeurs de jeux”, a déclaré de Witte. À terme, l’équipe estime que ses compétences en raisonnement spatial-temporel sont essentielles dans la quête de l’intelligence artificielle générale.