Buscar un teléfono en internet ya no significa entrar en diez páginas, comparar resultados y desconfiar de lo que aparece. Ahora mucha gente pregunta directamente a ChatGPT, Gemini u otros asistentes de IA, como si fueran una ventanilla rápida. Y ahí empieza el problema.
Una investigación de MIT Technology Review en español, firmada por Eileen Guo, recoge varios casos en los que chatbots han mostrado números de teléfono reales de personas que no esperaban aparecer en esas respuestas. No se trata solo de una molestia digital. Puede acabar en llamadas, mensajes de WhatsApp, errores de atención al cliente y, en el peor caso, acoso o fraude.
Teléfonos reales en manos ajenas
Uno de los casos afecta a Daniel Abraham, un ingeniero de software de 28 años en Israel. Según el informe, recibió un mensaje de WhatsApp de un desconocido que buscaba ayuda con PayBox, una aplicación de pagos. Gemini había dado su número personal como si fuera un contacto de atención al cliente.
Abraham no trabajaba para PayBox. Además, la empresa no tenía un servicio de atención al cliente por WhatsApp, según confirmó un representante de la compañía. La escena parece pequeña, casi absurda, pero basta imaginar que ocurre durante semanas para entender el lío.
También aparece el caso de Meira Gilbert, doctoranda de la Universidad de Washington. Mientras probaba Gemini, obtuvo el móvil personal de una colega, Yael Eiger, junto a información sobre su investigación. Gilbert resumió la reacción con una frase corta y bastante clara, «fue impactante».
Por qué ocurre
El punto clave está en los grandes modelos de lenguaje, conocidos como LLM. Son sistemas entrenados con enormes cantidades de texto para aprender patrones y responder con naturalidad. No guardan una agenda como tal, pero pueden haber visto datos personales durante el entrenamiento.
Esa información personal identificable incluye nombres, teléfonos, correos, direcciones o detalles laborales. OpenAI reconoce en su documentación que sus modelos pueden entrenarse con información pública, datos de socios y contenido aportado por usuarios, aunque afirma que aplica filtros para reducir la presencia de datos personales.
Google, por su parte, explica en el centro de privacidad de Gemini que los usuarios pueden revisar y borrar actividad, cambiar ajustes y solicitar retiradas de contenido según sus políticas o las leyes aplicables. Pero también advierte de que Gemini puede cometer errores y de que algunas funciones usan datos de otras aplicaciones conectadas.
Los filtros no siempre bastan
La idea de poner barreras parece sencilla. Si el sistema detecta un teléfono privado, no debería mostrarlo. En la práctica, no siempre funciona así, porque estos asistentes están diseñados para ayudar y responder, incluso cuando la pregunta se vuelve delicada.
Investigadores ya habían demostrado que algunos modelos pueden reproducir fragmentos de sus datos de entrenamiento. En un trabajo presentado en USENIX Security, Nicholas Carlini y otros autores lograron extraer textos literales de GPT-2, incluidos nombres, teléfonos y correos que aparecían en los datos usados para entrenar el modelo.
La Universidad Estatal de Carolina del Norte también ha estudiado un problema cercano. Xingli Fang y Jung-Eun Kim mostraron que ciertos elementos de las redes neuronales que ayudan al rendimiento del modelo están ligados a vulnerabilidades de privacidad. Dicho de forma simple, proteger mejor los datos sin empeorar la herramienta puede ser más difícil de lo que parece.
Las quejas crecen
DeleteMe, una empresa que ayuda a retirar datos personales de internet, asegura que las consultas relacionadas con IA generativa han subido un 400 % en siete meses. Según Rob Shavell, cofundador y CEO de la compañía, muchas quejas mencionan de forma directa a ChatGPT, Claude, Gemini u otras herramientas similares.
El patrón se repite de dos maneras. A veces una persona pregunta por sí misma y descubre que el chatbot devuelve datos correctos que preferiría mantener fuera de circulación. Otras veces, el asistente ofrece un contacto equivocado, pero con apariencia de verdad.
Y eso es lo incómodo. Un número que estaba perdido en una web antigua o en un foro de 2015 puede volver a la superficie porque una IA lo presenta limpio, rápido y con seguridad. Como cuando encuentras una foto vieja en un cajón, pero esta vez el cajón lo abre cualquiera.
Qué pueden hacer los usuarios
OpenAI tiene un portal para pedir que cierta información personal no aparezca en respuestas de ChatGPT. La empresa indica que una persona puede solicitarlo si cree que esos datos son inexactos, excesivos, irrelevantes o ya no adecuados.
En Gemini, Google ofrece controles para revisar actividad, borrar chats y gestionar ajustes de privacidad. Aun así, borrar actividad de una cuenta no significa necesariamente que un dato ya usado en otros sistemas desaparezca de todos los lugares posibles.
La recomendación más práctica, según los expertos citados por MIT Technology Review, es actuar antes de que el dato entre en nuevos rastreos. Eso implica retirar teléfonos, direcciones y perfiles de webs públicas, corredores de datos y páginas antiguas. No es una solución perfecta. Pero hoy parece una de las pocas defensas reales.
Una privacidad más frágil
La frontera entre lo público y lo privado se ha vuelto borrosa. Antes, un dato podía estar técnicamente en internet, pero tan enterrado que casi nadie lo encontraba. Ahora un chatbot puede convertir esa información escondida en una respuesta directa.
Esto no convierte a ChatGPT o Gemini en herramientas pensadas para exponer personas. Pero sí muestra una grieta seria en el uso de datos públicos, en los filtros de privacidad y en la confianza que muchos usuarios depositan en la IA.
Al final del día, la pregunta es sencilla. Si una máquina puede dar tu móvil a un desconocido sin que tú lo sepas, ¿quién controla de verdad tus datos?
El informe principal se ha publicado en MIT Technology Review.














