OpenAI, en réponse à la pression concurrentielle, notamment de la société chinoise d’IA DeepSeek, modifie la façon dont son dernier modèle d’IA, le o3-mini, communique son processus de pensée étape par étape. Jeudi, OpenAI a annoncé que les utilisateurs gratuits et payants de ChatGPT, la plateforme de chatbot alimentée par l’IA de l’entreprise, verront une chaîne de pensée mise à jour qui montre davantage de “raisons” à ses réponses à des questionnements. Les abonnés aux plans premium de ChatGPT qui exploitent o3-mini en configuration “haute réflexion” verront également ce rapport mis à jour, selon OpenAI.
“Nous introduisons une chaîne de pensée mise à jour pour o3-mini conçue pour faciliter la compréhension de la façon dont le modèle pense”, a déclaré un porte-parole d’OpenAI à TechCruch par courriel. “Avec cette mise à jour, vous pourrez suivre le raisonnement du modèle, ce qui vous donnera plus de clarté et de confiance dans ses réponses.”
OpenAI ne montre toujours pas toutes les étapes de raisonnement de o3-mini, mais l’entreprise indique avoir “trouvé un équilibre” : o3-mini peut “penser librement” et ensuite organiser ses “pensées” en résumés plus détaillés.
Les modèles de raisonnement comme o3-mini vérifient soigneusement les faits avant de donner des résultats, ce qui les aide à éviter certains des pièges qui font généralement trébucher les modèles. Le compromis est que les modèles de raisonnement mettent un peu plus de temps à parvenir à des solutions, habituellement de quelques secondes à quelques minutes de plus. Le modèle R1 de DeepSeek, un modèle de “raisonnement” du calibre de o3-mini, révèle tout son processus de pensée, ce que de nombreux chercheurs en IA estiment être l’approche préférée.
En plus de rendre le modèle plus facile à étudier, les étapes de raisonnement offrent une meilleure expérience utilisateur dans certaines situations, aidant à indiquer quand le modèle pourrait être sur la bonne – ou la mauvaise – voie. OpenAI avait décidé de ne pas montrer toutes les étapes de raisonnement pour o3-mini et ses prédécesseurs, o1 et o1-mini, en partie pour des raisons de compétition. Au lieu de cela, les utilisateurs ne voyaient que des résumés des étapes de raisonnement – des résumés qui étaient parfois erronés.
“Pour améliorer la clarté et la sécurité, nous avons ajouté une étape de post-traitement supplémentaire où le modèle examine la chaîne brute de pensée, élimine tout contenu non sûr, puis simplifie les idées complexes”, a continué le porte-parole d’OpenAI. “De plus, cette étape de post-traitement permet aux utilisateurs non anglophones de recevoir la chaîne de pensée dans leur langue maternelle, créant une expérience plus accessible et amicale.”
Dans un AMA Reddit la semaine dernière, Kevin Weil, directeur produit d’OpenAI, a laissé entendre que le changement était imminent. “Nous travaillons sur la présentation de beaucoup plus de choses que ce que nous montrons aujourd’hui – [montrer le processus de pensée du modèle] sera très, très prochainement”, a-t-il déclaré.