¿Puede la IA aprobar un test de CI? ¿Tienen un CI los modelos de lenguaje?

Sí y no: los grandes modelos de lenguaje pueden puntuar alto en ciertos ítems tipo test de CI (analogías verbales, algunas matrices), con cifras reportadas en torno a 120-135 en pruebas concretas, pero eso no significa que tengan un CI humano. Esos resultados reflejan datos de entrenamiento y reconocimiento de patrones, no inteligencia general (g) tal como se mide en personas.

IQ Test › ¿Puede la IA aprobar un test de CI? ¿Tienen un CI los modelos de lenguaje?

¿Qué puntuación obtiene la IA en los tests de CI?

Se han reportado cifras de alrededor de 120-135 en algunos conjuntos de ítems tipo CI, y en ciertos benchmarks de patrones incluso más altas. Sin embargo, los resultados varían enormemente según la prueba, el modelo y cómo se le presentan las preguntas. Por eso cualquier afirmación del tipo 'la IA tiene un CI de N' debe tomarse con muchas reservas: no es un valor estable ni comparable al de una persona.

¿Significa eso que la IA es tan inteligente como un humano?

No. Una puntuación alta refleja que el modelo ha aprendido patrones a partir de enormes cantidades de texto, no que posea inteligencia general humana. Los LLM no tienen las mismas limitaciones de memoria de trabajo ni de velocidad de procesamiento que una persona, así que el test no mide en ellos lo mismo que en nosotros. Sobresalir en analogías o matrices no implica comprensión, sentido común ni razonamiento flexible en el mundo real.

¿Por qué las normas de CI no sirven para la IA?

Porque los tests de CI se diseñaron y se baremaron para humanos. La media de 100 y la desviación típica de 15 se calculan sobre poblaciones de personas, no de máquinas, de modo que aplicar esa escala a una IA es una analogía, no una medición válida. Además, si los ítems o pruebas similares aparecen en los datos de entrenamiento, el modelo puede 'reconocerlos' en lugar de razonarlos, lo que infla artificialmente el resultado.

¿En qué tareas falla la IA pese a sus altas puntuaciones?

Puede fallar en razonamiento espacial novedoso, en problemas que requieren coherencia lógica sostenida y en tareas que exigen sentido común o experiencia del mundo físico. Un mismo modelo puede resolver una analogía compleja y a la vez equivocarse en un problema sencillo que cualquier persona resolvería. Esa irregularidad es justo lo contrario del factor g humano, que tiende a ser consistente entre tipos de tareas.

¿Hay que creerse las proyecciones de 'CI de la IA' del futuro?

Con mucha cautela y distinguiendo siempre dato de especulación. Las cifras concretas de hoy ya son frágiles, así que proyecciones como 'la IA alcanzará un CI de 195 en tal año' son especulaciones, no hechos, y no deben presentarse como medidas reales. Lo riguroso es hablar de rendimiento en pruebas específicas, con sus caveats, y no de un 'CI' único que resuma la inteligencia de una IA.

IA y tests de CI: resultados reportados frente a lo que miden de verdad

Test / benchmarkResultado reportado de la IAQué mide realmente
Analogías verbales (ítems tipo CI)Cifras altas, ~120-135 en pruebas concretasPatrones lingüísticos del entrenamiento, no g humano
Matrices progresivas (estilo Raven)Buen rendimiento en algunas, irregular en otrasReconocimiento de patrones, no razonamiento espacial novedoso
Benchmarks de patrones abstractosA veces puntuaciones muy elevadasCapacidad de cálculo, posible filtración de datos de entrenamiento
Caveat generalVariable y poco estable entre testsNo es inteligencia general humana; normas pensadas para personas
🧠 Mide tu propio CI →
📅 Última actualización: 2026-06-18 · ✔ Revisado por el equipo editorial de All-Lifes · Acerca de · Metodología
📚 Fuentes y referencias
← Volver al test de CI