ChatGPT confirma que no tiene rival: OpenAI hace oficial su IA más avanzada capaz de planificar y ejecutar tareas complejas de forma autónoma

Publicado el: 3 de mayo de 2026 a las 15:37

Imagina que te llega un encargo con piezas sueltas por todas partes, un documento a medio hacer, una hoja de cálculo con datos repetidos y un fallo en el código que solo aparece a veces. Hasta ahora, lo habitual era guiar a la IA paso a paso, como si fuera un copiloto. OpenAI quiere que el modelo haga más trabajo de principio a fin, justo después de anunciar funciones como ChatGPT Images 2.0.

El 23 de abril de 2026, la empresa dirigida por Sam Altman presentó GPT-5.5 con datos sobre su rendimiento y su despliegue en ChatGPT, Codex y la API. En la tabla de evaluaciones, OpenAI destaca un 82,7 por ciento en Terminal-Bench 2.0 y un 58,6 por ciento en SWE-Bench Pro, y además apunta a una ventana de contexto de 400.000 tokens en Codex y a un modo «Fast» que genera texto una vez y media más rápido a cambio de un coste dos veces y media más alto. También publica tarifas para la API, con precios de 5 dólares por millón de tokens de entrada y 30 dólares por millón de tokens de salida, y habla de contextos de alrededor de un millón de tokens.

Qué significa que sea más autónoma

Cuando se habla de una IA «con agentes«, la idea es bastante simple. No es solo responder, es decidir qué pasos hacen falta para llegar a una meta y ejecutarlos en orden. En la práctica se parece más a hacer una lista de tareas que a pedir un texto suelto.

Lea también: Alemania desafía las reglas y lleva a cabo una maniobra militar que no se había atrevido a realizar en 81 años: quiere convertir a la Bundeswehr en el Ejército más fuerte de Europa con más de 460.000 soldados

Esto cambia el tipo de preguntas que se hacen, ¿quién no querría que alguien ordene ese caos? En vez de «escríbeme un párrafo», puede ser «arregla este proyecto y dime qué ha fallado», con varios pasos y revisiones por el camino. Suena práctico, pero también obliga a vigilar qué datos se comparten y qué permisos se conceden.

Qué miden Terminal-Bench y SWE-Bench

Los benchmarks son pruebas que intentan medir rendimiento de forma comparable entre modelos.Terminal-Bench 2.0 se centra en tareas de ingeniería dentro de un entorno de terminal, donde hay que planificar, iterar y coordinar herramientas, no solo «escupir» código bonito. Es el tipo de prueba que se parece a trabajar con comandos, repositorios y errores reales, y se nota.

Lea también: Las baterías de Litio tienen los días contados: los móviles van a usar tecnología SiC con una capacidad de carga de 420 mAh/g

SWE-Bench Pro apunta a otra clase de dificultad. Busca evaluar trabajos largos en repositorios reales, con ediciones en varios archivos y decisiones menos obvias, y además intenta reducir el problema de que los modelos se hayan aprendido parte de los datos. Por eso, entidades como Scale describen conjuntos públicos y privados y explican por qué los resultados cambian según el andamiaje del agente y los límites de coste.

La memoria de trabajo y la idea de los tokens

Otra pieza clave es cuánto texto puede manejar la IA sin perder el hilo. Ese margen se mide en tokens, que son trozos de texto, no palabras exactas, y funciona como una memoria de trabajo. Cuando el contexto es corto, el modelo tiende a olvidar detalles y a repetir preguntas.

Lea también: La neurociencia sugiere que el uso continuado de la IA va a tener a largo plazo serias consecuencias para la memoria y el aprendizaje

Con contextos largos, la IA puede leer más material de una sentada y mantener coherencia en tareas largas. Esto importa en cosas muy normales, como revisar un contrato largo, comparar versiones de un documento o seguir el rastro de un bug a través de varios archivos. Y sí, también puede acelerar el trabajo, pero no elimina la necesidad de revisar.

Dónde se puede usar y qué cambia en los planes

En ChatGPT, OpenAI coloca GPT-5.5 Thinking en los planes de pago que permiten elegir modelo, y reserva GPT-5.5 Pro para suscripciones más altas como Pro, Business, Enterprise y Edu. En algunos entornos empresariales, el acceso puede depender de ajustes del administrador y de políticas internas. Eso marca la diferencia entre «lo tengo en el menú» y «no aparece».

Lea también: Una jubilada de 65 años se hace experta en Inteligencia Artificial y monta su propio negocio desde casa, un caso de resiliencia que demuestra que nunca es tarde para aprender

Más allá del chat, OpenAI ofrece GPT-5.5 en Codex, pensado para programación, y en su API, la puerta para integrarlo en otras apps, productos y procesos. Ahí entran las decisiones menos glamorosas, cuánto contexto necesitas, si te compensa el modo rápido y cuánto cuesta cada respuesta larga. Para muchas empresas, este punto acaba siendo el verdadero freno o el verdadero acelerador.

Seguridad y el foco en ciberseguridad

Cuanto mejor se le da a un modelo encontrar fallos, más fácil es que también ayude a explotarlos si cae en malas manos. En su system card, OpenAI clasifica a GPT-5.5 con capacidad «alta» en ciberseguridad, aunque por debajo del nivel «crítico» de su propio marco de preparación. El mismo documento menciona evaluaciones antes del despliegue y colaboración con entidades como el U.S. Center for AI Standards and Innovation, el UK AI Security Institute y el laboratorio Irregular.

Lea también: El fin de ChatGPT está cada día más cerca: Moonshot AI lanza Kimi K2.6, una IA gratuita con 1 billón de parámetros que coordina 300 agentes a la vez

Esto no significa que la herramienta sea «peligrosa» por definición, pero sí que requiere controles más estrictos, sobre todo cuando se usa para analizar sistemas o código sensible. En la práctica, se espera más filtrado, más límites y más revisión humana, incluso cuando el objetivo sea defensivo. Y ese equilibrio, rapidez contra riesgo, será parte del debate a partir de ahora.

El anuncio oficial se ha publicado en OpenAI.

ChatGPT confirma que no tiene rival: OpenAI hace oficial su IA más avanzada capaz de planificar y ejecutar tareas complejas de forma autónoma

Qué significa que sea más autónoma

Lea también: Alemania desafía las reglas y lleva a cabo una maniobra militar que no se había atrevido a realizar en 81 años: quiere convertir a la Bundeswehr en el Ejército más fuerte de Europa con más de 460.000 soldados

Qué miden Terminal-Bench y SWE-Bench

Lea también: Las baterías de Litio tienen los días contados: los móviles van a usar tecnología SiC con una capacidad de carga de 420 mAh/g

La memoria de trabajo y la idea de los tokens

Lea también: La neurociencia sugiere que el uso continuado de la IA va a tener a largo plazo serias consecuencias para la memoria y el aprendizaje

Dónde se puede usar y qué cambia en los planes

Lea también: Una jubilada de 65 años se hace experta en Inteligencia Artificial y monta su propio negocio desde casa, un caso de resiliencia que demuestra que nunca es tarde para aprender

Seguridad y el foco en ciberseguridad

Lea también: El fin de ChatGPT está cada día más cerca: Moonshot AI lanza Kimi K2.6, una IA gratuita con 1 billón de parámetros que coordina 300 agentes a la vez

Techy44

Noticias Relacionadas

Parecía imposible pero Elon Musk tiene un plan para dominar el mundo: Optimus será «el producto más grande de la historia» y ya se confirma una inversión de 25.000 millones

La neurociencia sugiere que el uso continuado de la IA va a tener a largo plazo serias consecuencias para la memoria y el aprendizaje

Una jubilada de 65 años se hace experta en Inteligencia Artificial y monta su propio negocio desde casa, un caso de resiliencia que demuestra que nunca es tarde para aprender

El fin de ChatGPT está cada día más cerca: Moonshot AI lanza Kimi K2.6, una IA gratuita con 1 billón de parámetros que coordina 300 agentes a la vez

Nvidia y Starcloud se unen para llevar la Inteligencia Artificial al espacio con 80.000 satélites de centros de datos en órbita

OpenAI llevaba años fallando en el mismo proceso pero la actualización de ChatGPT Images 2.0 confirma que el futuro ya está aquí

Deja un comentario Cancelar la respuesta

Las regletas de siempre tienen los días contados: su sustituto es un invento chino que ocupa menos espacio, es más práctico y cómodo

Giro inaudito en Gmail que te va a solucionar la vida: llega la carpeta «correo electrónico verificado» para registros instantáneos en aplicaciones

Después de 16 años pidiéndolo Spotify acaba de confirmar que llega la función que va a cambiar la forma en la que escuchas música

La peor noticia se confirma: EA Sports FC 27 ha cambiado las normas y la comunidad estalla porque el giro ha sido como un jarro de agua fría

Llega el F-35 Lightning II: el mega avión que redefine las guerras aéreas porque es capaz de absorber las señales de radar para no ser detectado

El iPhone de siempre tiene los días contados: se filtra el último modelo de Apple y lo que llega no tiene sentido porque va a ser la auténtica revolución

Hace tiempo dejé de usar Google Maps en Android Auto y ahora uso una APP con mapas en 3D que se ven en la luna del coche

Los fabricantes de drones de Alemania confirman un cambio inaudito en el mundo armamentístico y lo que augura no es bueno: las presas están en peligro

ChatGPT confirma que no tiene rival: OpenAI hace oficial su IA más avanzada capaz de planificar y ejecutar tareas complejas de forma autónoma

Qué significa que sea más autónoma

Lea también: Alemania desafía las reglas y lleva a cabo una maniobra militar que no se había atrevido a realizar en 81 años: quiere convertir a la Bundeswehr en el Ejército más fuerte de Europa con más de 460.000 soldados

Qué miden Terminal-Bench y SWE-Bench

Lea también: Las baterías de Litio tienen los días contados: los móviles van a usar tecnología SiC con una capacidad de carga de 420 mAh/g

La memoria de trabajo y la idea de los tokens

Lea también: La neurociencia sugiere que el uso continuado de la IA va a tener a largo plazo serias consecuencias para la memoria y el aprendizaje

Dónde se puede usar y qué cambia en los planes

Lea también: Una jubilada de 65 años se hace experta en Inteligencia Artificial y monta su propio negocio desde casa, un caso de resiliencia que demuestra que nunca es tarde para aprender

Seguridad y el foco en ciberseguridad

Lea también: El fin de ChatGPT está cada día más cerca: Moonshot AI lanza Kimi K2.6, una IA gratuita con 1 billón de parámetros que coordina 300 agentes a la vez

Noticias Relacionadas

Deja un comentario Cancelar la respuesta

Últimas Noticias

Categorias

Enlaces importantes

Síguenos en: