Kimi vuelve a la pelea de la inteligencia artificial con una versión que apunta directamente a una de las zonas más calientes del sector, la programación autónoma. La nueva Kimi K2.6, desarrollada por Moonshot AI, no solo responde preguntas o escribe fragmentos de código. Según la compañía, puede trabajar durante horas, usar herramientas, corregirse y coordinar agentes como si fueran un pequeño equipo técnico.
La clave no está en que la IA «sepa programar» en abstracto. Eso ya lo hacen muchos modelos. La novedad es que Kimi K2.6 intenta mantener el hilo durante tareas largas, con miles de pasos intermedios, algo parecido a dejar a un becario muy rápido revisando un proyecto enorme mientras tú te tomas un café. Con matices, claro. Los benchmarks publicados por Moonshot la sitúan por delante de GPT-5.4 y Claude Opus 4.6 en algunas pruebas de código y uso de herramientas, aunque no gana en todo.
Una IA con agentes
Kimi K2.6 pertenece a la familia de modelos llamados agénticos. Dicho fácil, un agente de IA no se limita a contestar en un chat, sino que puede usar herramientas, abrir archivos, ejecutar pasos, comprobar resultados y volver a intentarlo si algo falla.
Moonshot AI explica que el modelo está pensado para tareas de «largo horizonte», es decir, trabajos que no se resuelven con una sola respuesta bonita. En la práctica, eso significa depurar código, cambiar partes de una aplicación, analizar errores y mantener una secuencia de decisiones durante mucho tiempo.
El salto más llamativo está en Agent Swarm. Esta función permite coordinar hasta 300 subagentes y miles de pasos en una sola ejecución, repartiendo tareas entre agentes especializados. Es como dividir un trabajo de clase en muchas partes, solo que aquí el reparto lo hace el propio sistema.
Programar durante horas
En una demostración descrita por Moonshot AI, Kimi K2.6 descargó y optimizó en un Mac la ejecución local de un modelo llamado Qwen3.5-0.8B. El proceso duró más de doce horas, incluyó más de cuatro mil llamadas a herramientas y terminó con una mejora notable de la velocidad de generación.
La compañía también probó el modelo con exchange-core, un motor financiero de código abierto usado para gestionar órdenes de compraventa. Kimi K2.6 trabajó durante trece horas, aplicó doce estrategias de optimización y modificó miles de líneas de código. Según Moonshot, el rendimiento medio mejoró un 185 por ciento y el pico de rendimiento subió un 133 por ciento.
Aquí conviene no perder el suelo. Son pruebas comunicadas por la propia empresa y deben leerse como resultados de lanzamiento, no como una auditoría independiente. Aun así, muestran hacia dónde va la carrera: menos chat bonito y más trabajo técnico sostenido.
Qué dicen las pruebas
En SWE-Bench Pro, una prueba diseñada para medir tareas complejas de ingeniería de software, Kimi K2.6 obtiene 58,6 puntos, por delante de GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro en la tabla publicada por Moonshot. SWE-Bench Pro no mide ejercicios de juguete, sino problemas de repositorios reales que pueden exigir cambios en varios archivos.
En Humanity’s Last Exam con herramientas, otra evaluación pensada para preguntas difíciles y variadas, Kimi K2.6 logra 54,0 puntos. También queda por delante de GPT-5.4 y Claude Opus 4.6 en esa configuración concreta, según los datos de Moonshot.
Pero la foto completa es menos redonda. En Toolathlon, Kimi supera a Claude y Gemini, aunque no a GPT-5.4 en la tabla oficial. En razonamiento puro y visión, Kimi K2.6 queda por detrás de varios rivales en diferentes pruebas. En otras palabras, no es «mejor que todos» en todo. Es más fuerte en un tipo muy concreto de trabajo.
Código abierto con límites
Una diferencia importante frente a modelos cerrados es que Kimi K2.6 se presenta como un modelo de código abierto. Sus pesos y su código están disponibles en Hugging Face, lo que permite a desarrolladores e investigadores probarlo, integrarlo o ejecutarlo en sus propios sistemas con las herramientas adecuadas.
La licencia es una MIT modificada. Permite un uso amplio, incluso comercial, pero exige mostrar «Kimi K2.6» en la interfaz si el producto supera los cien millones de usuarios activos mensuales o más de veinte millones de dólares de ingresos mensuales. Para una startup pequeña, no cambia mucho. Para una gran plataforma, sí puede ser una línea legal a revisar.
También hay un punto práctico. Aunque el modelo sea accesible, ejecutarlo de forma local no es como instalar una app cualquiera. Los modelos de este tamaño necesitan infraestructura potente, y muchas empresas lo usarán mediante API o servicios externos.
Por qué importa
La batalla de la IA ya no va solo de quién escribe el mejor poema o resume mejor un PDF. Cada vez pesa más la capacidad de hacer tareas reales, largas y aburridas, como revisar un repositorio, preparar una web o coordinar informes, hojas de cálculo y presentaciones desde una sola instrucción.
Moonshot AI afirma que Kimi K2.6 está disponible en Kimi.com, en la app, mediante API y a través de Kimi Code. La documentación oficial también señala que el modelo admite texto, imagen y vídeo, además de modos de chat y de agente.
La gran pregunta es sencilla. ¿Hasta qué punto queremos que una IA trabaje durante horas sin supervisión humana? Para tareas repetitivas puede ser útil, pero en código crítico, finanzas o sistemas sensibles, la revisión humana seguirá siendo una capa necesaria. Al final del día, una IA que programa sola no elimina la responsabilidad de quien la despliega.
La nota oficial se ha publicado en el blog técnico de Kimi.













