Un problema de Paul Erdős sobre números enteros llevaba décadas dando vueltas en la comunidad matemática. Y de repente, en abril de 2026, aparece una demostración atribuida a una sesión con GPT-5.4 Pro. ¿Estamos ante una revolución o ante un espejismo bien contado?
La respuesta, por ahora, es más interesante que el titular fácil. Sí, el problema 1196 figura como resuelto en el registro oficial. Pero también queda claro que la prueba no “salió lista” de un chat, y que el valor de la IA aquí está más en abrir una puerta rara que en sustituir el trabajo humano.
Qué pasó en abril
La ficha oficial del Erdős Problem #1196 se actualizó el 15 de abril de 2026 y lo marca como resuelto por GPT-5.4 Pro con un detalle importante. La solución aparece como “prompted by Price”, es decir, provocada por la interacción de un usuario llamado Liam Price.
La parte jugosa está en el debate técnico y en cómo se validó la idea. En el hilo de discusión del problema, varios participantes explican que la primera ejecución que apuntaba a una solución fue un “one-shot” que duró alrededor de 80 minutos, y a partir de ahí empezó el trabajo de lectura, depuración y contraste.
Aquí no hay un momento mágico de “la IA lo resolvió y ya”. Hay una cadena pública de comentarios, reescrituras y comprobaciones. Y sí, en esa conversación aparece Terence Tao, profesor en UCLA, discutiendo refinamientos y alternativas en el propio foro.
Un problema sobre conjuntos
El núcleo del problema 1196 habla de “conjuntos primitivos”. Suena técnico, pero la idea es simple. Es un conjunto de números enteros donde ninguno puede dividir exactamente a otro, como si dentro del grupo nadie fuera “múltiplo” de nadie.
El problema pregunta por el comportamiento de una suma que asigna a cada número un “peso” cada vez más pequeño cuanto más grande es el número. En la práctica, esa suma sirve para medir cuánto “ocupa” el conjunto cuando solo miras números enormes, algo parecido a contar sin contar del todo.
Antes de esta solución, ya había avances serios. Jared Duker Lichtman, matemático en Stanford, había obtenido un límite superior cercano a uno coma cuatro, según recoge la propia ficha del problema. Su perfil y su trabajo institucional pueden consultarse en la web del departamento de Mathematics de Stanford.
La pista de von Mangoldt
Lo que más ha llamado la atención no es solo que haya una prueba, sino el tipo de herramienta que aparece en ella. En el foro se repite una idea que suena muy “de manual” de teoría de números, pero que nadie estaba usando aquí de esa manera, la función de von Mangoldt.
Si no te suena, piensa en ella como un marcador que se activa cuando un número está construido a partir de un primo, o de potencias de un primo. Es una pieza clásica para hablar de números primos sin tener que enumerarlos uno a uno, y tiene una explicación accesible en Wolfram MathWorld.
En el hilo, Lichtman subraya el giro con una frase que resume bien el choque cultural. Dice que la clave fue sustituir una familia de pesos “más habituales” por pesos ligados a von Mangoldt, y remata que “the construction is quite special”. No es una forma de decir “qué listo es el modelo”, es una forma de decir “nadie estaba mirando por ahí”.
La letra pequeña
En el mismo hilo, el propio Lichtman mete una cuña que se ha perdido en muchos resúmenes virales. Señala que, “barring the initial prose quality”, la prueba es notable, lo cual es una manera educada de decir que el texto original no tenía forma de paper.
Y ese detalle importa porque marca dónde está el valor real. La IA parece haber aportado una estructura o un camino, pero el resultado útil ha salido de una interpretación humana cuidadosa, con reescritura, orden y verificación.
De hecho, el usuario natso26 lo dice sin rodeos en su página de actividad en el foro. Las aportaciones se centran en corrección y autonomía, “not a writeup at professional standard”, y avisa de que no se deben comparar directamente con escritura profesional. Es una aclaración sencilla, pero evita muchas confusiones.
El reto de medir a la IA
Para no depender solo de anécdotas, Tao y Nat Sothanaphan mantienen un registro público que clasifica intentos y resultados. Está en el registro en GitHub de contribuciones de IA a problemas de Erdős y, además de listar avances, incluye avisos incómodos. Uno de ellos es clave, los fracasos suelen no reportarse, así que el “éxito visible” tiene sesgo de selección.
Esa cautela viene de una polémica reciente. En octubre de 2025, un intercambio en X encendió críticas sobre vender como “resueltos” problemas que en realidad se habían desbloqueado por búsqueda de literatura, y Demis Hassabis, CEO de DeepMind, zanjó el tono con “This is embarrassing” en su respuesta pública. No era un debate filosófico, era una llamada a distinguir entre descubrir y encontrar referencias.
Por eso tiene interés otro intento más controlado de medir capacidades. En febrero de 2026, once matemáticos lanzaron “First Proof” con diez problemas nuevos, respuestas cifradas y una semana de margen para los sistemas de IA. El planteamiento está descrito en el preprint de First Proof en arXiv, y su mensaje preliminar es claro, todavía hay límites fuertes cuando se pide autonomía real y no hay datos previos a mano.
El trabajo principal se ha publicado en Erdős Problems.








