Un hito en la inteligencia artificial ha sido alcanzado: un modelo de IA ha superado la famosa prueba de Turing, diseñada para evaluar si una máquina puede imitar el pensamiento humano. Un nuevo estudio revela que el modelo GPT-4.5 de OpenAI fue identificado como humano en el 73 % de los casos, superando el umbral de azar y planteando importantes interrogantes sobre el futuro de la inteligencia artificial.
La prueba de Turing y los sorprendentes resultados

La prueba de Turing, propuesta en 1950 por el matemático Alan Turing, establece que si un humano no puede distinguir a una máquina de una persona en una conversación, la IA ha demostrado inteligencia humana. Este principio ha sido utilizado durante décadas para medir el progreso de la inteligencia artificial, aunque con algunas limitaciones.
En este experimento reciente, los investigadores llevaron a cabo una versión tripartita de la prueba en la que los participantes interactuaban simultáneamente con un humano y con una IA, evaluando quién era quién. Se probaron varios modelos, incluyendo GPT-4.5 de OpenAI, LLama 3.1-405B de Meta, GPT-4o y el antiguo chatbot ELIZA.
Los resultados fueron impactantes. Cuando GPT-4.5 recibió instrucciones de adoptar una personalidad específica, los participantes lo identificaron como humano en el 73 % de los casos, superando con creces la tasa de azar del 50 %. En contraste, sin indicaciones de personalidad, su tasa de éxito bajó al 36 %. Por su parte, GPT-4o solo logró un 21 %, mientras que ELIZA, a pesar de su antigüedad, obtuvo un 23 %.
Estos hallazgos evidencian el avance en la capacidad conversacional de los modelos actuales. Sin embargo, la superación de la prueba de Turing no implica necesariamente que la IA posea una verdadera comprensión del mundo o que piense como los humanos.
Implicaciones y preocupaciones sobre el futuro de la IA

A pesar de su relevancia histórica, la prueba de Turing no es un criterio definitivo para medir la inteligencia de las máquinas. Como señaló el ingeniero de software de Google François Chollet, la prueba fue concebida más como un experimento mental que como un estándar absoluto de evaluación.
Los modelos de lenguaje actuales, como los de OpenAI y Meta, no poseen conciencia ni razonamiento genuino. Su éxito en la prueba de Turing se debe a su capacidad para generar respuestas plausibles basadas en patrones de texto, no a un entendimiento real de lo que dicen.
Este avance, sin embargo, plantea preocupaciones importantes. El investigador principal del estudio, Cameron Jones, advierte que la indistinguibilidad de las IA respecto a los humanos en conversaciones breves podría facilitar la automatización de empleos, mejorar las tácticas de manipulación en ingeniería social y generar disrupciones sociales. La facilidad con la que las IA pueden imitar a los humanos podría tener implicaciones significativas en la confianza digital y la autenticidad en línea.
Por otro lado, el estudio también sugiere que la percepción humana de la IA está evolucionando. A medida que más personas interactúan con chatbots avanzados, podrían desarrollar una mayor capacidad para reconocerlos, haciendo que la prueba de Turing sea cada vez menos relevante en el futuro.
El hecho de que GPT-4.5 haya superado la prueba de Turing marca un punto de inflexión en el desarrollo de la inteligencia artificial. Sin embargo, esto no significa que las IA piensen o razonen como los humanos. Más bien, demuestra su creciente capacidad para imitar el lenguaje humano de manera convincente. A medida que estas tecnologías se integran más en la sociedad, será crucial evaluar sus implicaciones éticas, laborales y de seguridad para garantizar un futuro en el que la inteligencia artificial beneficie a la humanidad en lugar de reemplazarla.
New preprint: we evaluated LLMs in a 3-party Turing test (participants speak to a human & AI simultaneously and decide which is which).
GPT-4.5 (when prompted to adopt a humanlike persona) was judged to be the human 73% of the time, suggesting it passes the Turing test () pic.twitter.com/GBEtoFJHVY
— Cameron Jones (@camrobjones) April 1, 2025
Referencia:
- arXiv/Large Language Models Pass the Turing Test. Link.
Relacionado
Descubre más desde Cerebro Digital
Suscríbete y recibe las últimas entradas en tu correo electrónico.
