
Timothy Gowers, médaillé Fields et titulaire de la chaire de combinatoire au Collège de France, a soumis à ChatGPT 5.5 Pro des problèmes ouverts issus d’un article du théoricien des nombres Mel Nathanson. Le résultat, décrit dans le blog de Gowers, situe la production du modèle au niveau d’un chapitre de thèse de doctorat.
Ce qui distingue cet épisode des démonstrations habituelles : Gowers affirme que sa propre contribution mathématique a été nulle, et qu’il n’a pas utilisé de prompts particulièrement sophistiqués.
A lire aussi
- OpenAI dévoile de nouveaux modèles pour ChatGPT, plus puissant et moins chers
- ChatGPT : sa plus grande mise à jour GPT-5 pourrait arriver bien plus tôt que prévu
Un problème résolu en 17 minutes
Le premier problème soumis au modèle portait sur une borne que Nathanson avait établie sous forme exponentielle, en demandant si elle pouvait être améliorée. ChatGPT 5.5 Pro a réfléchi pendant 17 minutes et 5 secondes, puis a proposé la meilleure construction possible, avec une borne quadratique.

L’idée centrale consistait à remplacer un composant de la preuve de Nathanson par une variante plus efficace, connue en combinatoire mais dont l’application à ce problème précis n’était pas évidente. Le modèle a ensuite rédigé le tout sous forme de prépublication LaTeX en un peu moins de deux minutes et demie.
Gowers a vérifié la correction du résultat, puis a demandé au modèle de traiter une variante connexe. Celle-ci a été résolue sans difficulté, et les deux résultats sont disponibles sous forme de prépublication.
Une idée jugée « complètement originale » par un chercheur du MIT
La version généralisée du problème s’est révélée plus difficile. Il existait des travaux préalables d’Isaac Rajagopal, un étudiant du MIT, qui avait établi une dépendance exponentielle. Gowers a fourni cet article au modèle et lui a demandé d’améliorer le résultat.
Après une première amélioration qualifiée de modification routinière, le modèle a franchi un cap supplémentaire : en moins d’une heure au total, il a fait passer la borne d’exponentielle à polynomiale. L’idée clé consistait à comprimer certaines structures algébriques dans un intervalle numérique beaucoup plus restreint sans en altérer les propriétés combinatoires essentielles.

Rajagopal a qualifié ce résultat d’assez ingénieux et a déclaré que c’est le genre d’idée dont un mathématicien humain pourrait être fier après une ou deux semaines de réflexion. Selon lui, l’idée était, dans la mesure où il pouvait en juger, complètement originale.
Des conclusions qui interrogent le métier de mathématicien
Gowers tire de cet épisode des conclusions qui dépassent le simple constat technique. Il avance que le seuil minimal pour contribuer à la recherche mathématique sera désormais de prouver ce que les grands modèles de langage ne peuvent pas prouver, et non plus simplement de prouver quelque chose que personne n’avait encore démontré.
Il soulève aussi une question sur la notion même d’accomplissement : si un mathématicien joue un rôle de guidage lors d’un échange avec un modèle, mais que toutes les idées techniques viennent du modèle, dans quelle mesure peut-on parler d’une réussite du mathématicien ? Il répond lui-même par la négative.
Ces résultats s’inscrivent dans une série d’avancées récentes. Des modèles de la même famille ont résolu plusieurs problèmes ouverts d’Erdos de manière autonome, et un physicien a publié en décembre 2025 un article dont l’idée centrale provenait d’un grand modèle de langage. Gowers prédit que quiconque entame un doctorat aujourd’hui trouvera la recherche mathématique profondément transformée d’ici 2029.
Des limites qui méritent d’être rappelées
Ces avancées restent à contextualiser. Google DeepMind a testé son agent Aletheia sur 700 problèmes mathématiques ouverts : seulement 6,5 % des réponses se sont révélées exploitables. Le mathématicien Terence Tao rappelle régulièrement que les problèmes d’Erdos varient en difficulté de plusieurs ordres de grandeur.
L’ancienneté d’un problème ne signifie pas qu’il ait résisté à des efforts humains intenses. Certains n’ont simplement jamais été sérieusement attaqués. Le cas rapporté par Gowers est néanmoins documenté, vérifié par un chercheur impliqué, et disponible sous forme de prépublication.
Source : The-decoder

