Standard Intelligence a récemment annoncé la sortie de FDM-1, un agent d’intelligence artificielle capable de prendre le contrôle n’importe quel ordinateur simplement en regardant l’écran et en cliquant comme le ferait un humain. Contrairement aux agents basés sur des modèles de langage (LLM), FDM-1 repose exclusivement sur une compréhension visuelle du flux vidéo, ce qui lui permet de s’adapter aux changements d’interface de manière exceptionnelle.
Ce système fonctionne à une vitesse impressionnante de 30 images par seconde avec une latence de seulement 11 millisecondes. Il peut genre remplir un tableur Excel, naviguer dans des logiciels métier comme SAP ou Salesforce, ou encore exécuter des tâches répétitives sous Windows, macOS ou Linux. Contrairement aux solutions RPA classiques qui échouent si un bouton est déplacé, FDM-1 comprend ce qu’il voit et s’adapte automatiquement, ce qui représente une avancée majeure dans l’automatisation.
Ce qui distingue également FDM-1, c’est son échelle d’entraînement, qui est tout simplement titanesque. Le modèle a été formé sur plus de 11 millions d’heures de vidéo, simulant plus d’un million de scénarios par heure via 80 000 machines virtuelles pilotées par un GPU NVIDIA H100. Cela lui permet de maîtriser des applications complexes comme la CAO sur Blender 3D, la conduite autonome avec moins d’une heure de vidéo, ou même le fuzzing d’applications bancaires.
Ce qui impressionne surtout, c’est la capacité de FDM-1 à comprendre et à s’adapter visuellement, sans dépendre de modèles de langage, ce qui ouvre des perspectives innovantes tout en suscitant des préoccupations majeures en matière de sécurité.
Malheureusement, aucune disponibilité publique n’a encore été annoncée, et les démos proviennent uniquement de l’équipe de développement, ce qui incite à la prudence quant à la mise sur le marché. Sur le plan sécuritaire, le potentiel de ce type d’agent soulève des inquiétudes, notamment en termes de phishing automatisé ou de clickjacking à grande échelle, si aucune garde-fous sérieux n’est mis en place. La promesse d’un agent autonome “comme vous” s’accompagne donc de risques qu’il faudra surveiller de près à l’avenir.
Pour en savoir plus, vous pouvez consulter les vidéos de démonstration via ce lien : vidéo FDM-1. La révolution apportée par cette technologie est indéniable, mais son utilisation responsable reste à définir, notamment en matière de sécurité et d’éthique.
