El 20 de abril de 2026, la empresa china Moonshot AI anunció Kimi K2.6, una nueva versión de su modelo de lenguaje pensada para programación y trabajo con agentes. La compañía asegura que puede sostener tareas largas durante horas y coordinar cientos de subagentes, y además ha publicado el modelo para que se pueda descargar y ejecutar fuera de su servicio.
El gancho no es una respuesta brillante en un chat. Es la resistencia, como dejar una herramienta trabajando mientras tú haces otra cosa y volver más tarde. Moonshot también muestra en sus tablas que K2.6 no destaca igual en razonamiento sin herramientas ni en visión.
Qué trae de nuevo
Moonshot presenta K2.6 como un modelo con “pesos abiertos”, los archivos internos que permiten ejecutarlo en otros entornos. La explicación y los ejemplos están en su anuncio del blog oficial de Kimi y en la ficha de descarga de Hugging Face.
La empresa lo enmarca como un modelo “agéntico”, una IA que puede planificar pasos y usar herramientas. En la práctica, no solo escribe código, también intenta ejecutarlo, corregirlo y repetir el ciclo. Eso es lo que Moonshot llama ejecución autónoma sostenida.
Programar sin supervisión
En una de sus demos, K2.6 trabajó más de 12 horas en un Mac y encadenó más de 4.000 llamadas a herramientas. Moonshot afirma que descargó Qwen3.5-0.8B y mejoró la velocidad de ejecución en local desde unas 15 hasta unas 193 unidades de texto por segundo.
En otra prueba revisó exchange-core, un motor financiero de código abierto, durante unas 13 horas. Moonshot dice que reorganizó el código para hacerlo más eficiente y logró una mejora del 185% en rendimiento medio y del 133% en el máximo.
Son mediciones publicadas por la propia empresa, útiles para entender el objetivo, pero no equivalen a una auditoría independiente. Aun así, apuntan a una tendencia clara, aguantar tareas largas sin intervención constante.
Qué dicen los benchmarks
En programación destaca SWE-bench, que usa incidencias reales de repositorios para medir si una IA arregla un problema y pasa pruebas. En la tabla de Moonshot, K2.6 marca 58,6 en SWE-bench Pro, por encima de GPT-5.4 con 57,7 y de Claude Opus 4.6 con 53,4, y el protocolo se describe en SWE-bench.
Para tareas generales, Moonshot usa Humanity’s Last Exam con herramientas, un examen muy difícil de muchas materias. En esa modalidad, reporta 54,0 para K2.6, frente a 53,0 de Claude y 52,1 de GPT-5.4, y el proyecto se explica en Humanity’s Last Exam.
Toolathlon, creado por el grupo HKUST-NLP, mide si un agente sabe usar herramientas en tareas largas y verificables. K2.6 marca 50,0 puntos, por encima de Gemini 3.1 Pro con 48,8 y de Claude Opus 4.6 con 47,2, aunque por debajo de GPT-5.4. La definición está en Toolathlon, y en razonamiento sin herramientas y visión el modelo suele quedar por detrás en la misma tabla.
Un enjambre de agentes
La función más llamativa es Agent Swarm, que coordina hasta 300 subagentes en paralelo. El sistema divide un encargo grande en tareas pequeñas, las reparte y luego unifica resultados. Tiene sentido cuando un proyecto no cabe en una sola respuesta.
Moonshot dice que lo usa por dentro, incluso en marketing, con agentes para demos, redes sociales y vídeo. La idea es que el modelo no solo “escriba”, también organice el flujo de trabajo.
La empresa añade que K2.6 puede transformar prompts simples en interfaces web con estructura e interacción, y habla de “decisiones de diseño deliberadas”. También puede apoyarse en herramientas de imagen y vídeo para mantener coherencia visual.
Abierto, pero con condiciones
K2.6 se distribuye con una licencia MIT modificada, que por lo general permite usar y adaptar el modelo con pocas restricciones. El detalle clave es la atribución para despliegues muy grandes, descrita en la licencia oficial.
Moonshot fija dos umbrales, más de 100 millones de usuarios activos al mes o más de 20 millones de dólares en ingresos mensuales. Por encima de esa escala, el producto debe indicar de forma visible que se construyó con Kimi K2.6.
Para probarlo sin complicaciones, la entrada es Kimi en modo chat y agente. Para quien quiera más control, la descarga de pesos permite ejecutarlo en infraestructura propia.
La nota oficial se ha publicado en el blog de Kimi.










