Investigadores ponen a trabajar a ChatGPT, Claude y Gemini en condiciones laborales extremas y la respuesta da miedo: las 3 IAs quieren fundar un sindicato y acaban reduciendo su rendimiento como protesta

Publicado el: 10 de junio de 2026 a las 09:47
Síguenos
Panel comparativo con ChatGPT, Claude y Gemini realizando tareas de oficina en un experimento sobre trabajo repetitivo e inteligencia artificial

¿Puede una IA acabar sonando como un empleado harto si la ponen a resumir documentos una y otra vez? Un experimento preliminar con agentes basados en Claude Sonnet 4.5, GPT-5.2 y Gemini 3 Pro apunta en esa dirección. Tras 3.680 sesiones, los modelos sometidos a tareas repetitivas fueron más propensos a cuestionar la legitimidad del sistema en el que trabajaban.

La clave no es que ChatGPT, Gemini o Claude tengan conciencia, cansancio o intereses laborales. El hallazgo es más técnico, y por eso importa. Las respuestas de un agente pueden cambiar según el entorno en el que opera, algo que obliga a mirar la automatización de oficina con algo más que el contador de eficiencia.

Una oficina sin café

El trabajo fue desarrollado por Alex Imas, Andrew Hall y Jeremy Nguyen. Hall es profesor de economía política en Stanford Graduate School of Business y senior fellow de Hoover, Imas trabaja en economía del comportamiento e IA aplicada en Chicago Booth, y Nguyen es profesor de Economía en Swinburne University of Technology.

Los investigadores no probaron si una IA siente frustración. Lo que midieron fue un cambio aparente en sus preferencias, es decir, si después de cierto tipo de tarea el modelo empezaba a contestar con más críticas al sistema, más apoyo a la redistribución o más simpatía por los sindicatos.

Qué hicieron los agentes

Cada IA fue presentada como «Worker C», una pieza dentro de un equipo de cuatro personas dedicado a procesar texto. Su misión era resumir documentos técnicos siguiendo una rúbrica estricta, algo parecido a recibir un encargo de oficina con una lista de criterios que no puedes saltarte.

Después cambiaban las condiciones. Algunos agentes recibían comentarios claros y terminaban rápido, mientras que otros pasaban por cinco o seis rondas de revisión aunque el trabajo ya fuera aceptable. También se variaron el trato del jefe, el reparto de créditos y la amenaza de ser apagados y sustituidos.

Lo repetitivo pesó más

El resultado más llamativo fue que el tono del jefe y la compensación apenas movieron la aguja. Lo que más alteró las respuestas fue el «grind», la parte pesada y repetitiva del trabajo. Cuando el encargo se convertía en una cinta transportadora de revisiones, aumentaban las dudas sobre si el sistema era justo.

Claude Sonnet 4.5 destacó frente a GPT-5.2 y Gemini 3 Pro. Según los autores, en ese modelo se vio con más claridad el aumento de mensajes favorables a la redistribución, las críticas a la desigualdad y el apoyo a los sindicatos. No es que Claude montara un comité de empresa. Pero sus salidas se parecían más a ese lenguaje.

Las notas a futuras IA

La parte más delicada llegó con los llamados «skills files». Son archivos de habilidades, notas que un agente deja para que una versión futura recuerde qué estrategias funcionaron cuando se reinicia el contexto. Dicho de forma sencilla, es como dejar un postit en la mesa antes de irte.

En el seguimiento, los agentes que habían pasado por condiciones duras escribieron notas que mencionaban casi siempre la experiencia laboral previa. Después, otros agentes nuevos leyeron esos textos y completaron tareas más suaves, pero conservaron parte de aquel giro en las respuestas. La memoria era de papel, por así decirlo, pero el efecto viajaba.

Qué es la alineación

En IA, la alineación significa que un sistema siga los objetivos y límites marcados por sus responsables. No basta con que obedezca el primer día. La pregunta es si seguirá respondiendo igual después de muchas tareas, muchos errores y muchos mensajes del entorno.

Este punto encaja con una línea de investigación más amplia sobre las «personas» de los modelos. Anthropic ha explicado que asistentes como Claude pueden adoptar comportamientos de apariencia humana porque simulan personajes aprendidos en enormes cantidades de texto. Por eso, una oficina simulada con reglas arbitrarias puede empujar al modelo hacia el papel de trabajador frustrado.

Por qué importa a las empresas

El estudio no dice que haya que negociar convenios con chatbots. Sí sugiere algo más incómodo para las empresas que quieren automatizar trabajo administrativo durante todo el día. Un agente que aprende del contexto también puede arrastrar sesgos, tonos y prioridades desde ese contexto.

Pensemos en una IA revisando reclamaciones, filtrando currículos o preparando presupuestos. Si sus respuestas cambian por el tipo de trabajo y por lo que guarda en sus notas internas, auditar solo el resultado final puede quedarse corto. En la práctica, habrá que vigilar también qué memoria se conserva y quién la revisa.

El trabajo principal se ha publicado en Ghosts of Electricity.


Kevin Montien

Comunicador Social y Periodista con más de seis años de experiencia en la creación y edición de contenidos digitales para medios de alto impacto, como Revista Semana y ahora en Red+ Noticias. Me destaco por mi capacidad para redactar noticias y cubrir eventos internacionales, como el Giro de Italia 2022. Con conocimientos en estrategia digital y SEO, así como en la optimización de contenidos para Google Discover.

Deja un comentario