Ce week-end, Neel Somani, ingénieur logiciel, ancien chercheur en quantitatif et fondateur de startup, a mené des tests sur le nouveau modèle d’OpenAI, révélant une avancée inattendue dans la résolution de problèmes mathématiques complexes. Après avoir introduit un problème mathématique dans ChatGPT et laissé le modèle réfléchir pendant 15 minutes, il a constaté qu’une solution complète lui était revenue. Appréciant la véracité de cette preuve, Somani l’a formalisée à l’aide de l’outil Harmonic, qui a confirmé son exactitude. Cette découverte a permis de mieux situer la capacité des grands modèles de langage (LLMs) à résoudre des problèmes ouverts en mathématiques, comparé à leurs limites.
Ce qui est particulièrement impressionnant, c’est la façon dont ChatGPT a enchaîné des axiomes mathématiques tels que la formule de Legendre, la postulat de Bertrand ou encore le théorème de l’Étoile de David pour construire son raisonnement. Au fil de sa démarche, le modèle est même parvenu à retrouver une publication de 2013 sur Math Overflow où le mathématicien Harvard Noam Elkies avait proposé une solution élégante à un problème similaire. La solution finale de ChatGPT différait toutefois de celle d’Elkies, dans des aspects importants, tout en offrant une réponse plus complète à une version du problème posé par Paul Erdős, célèbre pour sa collection de problèmes non résolus. Cette performance témoigne d’un progrès notoire dans l’usage de l’IA pour repousser les frontières du savoir mathématique.
La capacité croissante de ces modèles à résoudre des problèmes non résolus ouvre des perspectives nouvelles, où l’IA ne se contente plus d’assister, mais commence à faire progresser activement la recherche mathématique.
Depuis la sortie de GPT 5.2, que Somani qualifie de “d’anecdotique plus compétent en raisonnement mathématique que ses prédécesseurs”, le nombre de problèmes résolus s’est considérablement accru. Parmi ces progrès, on note notamment la résolution de 15 conjectures issues des plus de 1 000 énoncés d’Erdős, en grande partie grâce à des modèles comme AlphaEvolve ou GPT 5.2. Une première en la matière, puisqu’il s’agit de solutions autonomes créditant explicitement l’IA, une tendance qui alimente le débat sur le rôle futur de ces outils dans la recherche mathématique.
Le mathématicien Terence Tao, tout en étant réservé, fait état de huit problèmes où l’IA a permis de faire des avancées significatives, souvent en s’appuyant sur des recherches antérieures. Selon lui, la nature scalable des systèmes d’IA les rend particulièrement adaptés pour s’attaquer à la « longue queue » de problèmes obscurs d’Erdős, dont beaucoup ont des solutions relativement simples. Tao prévoit que nombreux sont ces problèmes faciles qui seront potentiellement résolus par des méthodes purement automatisées, ce qui pourrait transformer la dynamique de la recherche en mathématiques.
Par ailleurs, la formalisation mathématique, qui consiste à rendre les raisonnements vérifiables, connaît une croissance grâce à des outils automatisés tels que le “proof assistant” open source Lean, développé en 2013. La montée en puissance des IA comme Harmonic’s Aristotle, qui vise à automatiser cette formalisation, témoigne de l’intérêt croissant porté à l’intégration de l’IA dans ces processus laborieux. Selon Tudor Achim, fondateur d’Harmonic, la véritable importance réside dans le fait que des figures influentes du monde académique commencent à utiliser sérieusement ces outils, ce qui constitue une preuve tangible de leur pertinence dans la communauté mathématique.
