Большие языковые модели действительно могут набирать высокие баллы на отдельных наборах IQ-заданий — сообщалось о значениях порядка 120–135 на конкретных тестах, — но это отражает обучение на данных и поиск закономерностей, а не человеческий общий интеллект (g), поэтому говорить о реальном «IQ нейросети» некорректно.
На некоторых наборах IQ-подобных заданий — словесных аналогиях и части матриц — для языковых моделей сообщали о значениях примерно 120–135, а на отдельных паттерн-бенчмарках и выше. Однако результаты сильно различаются от теста к тесту и от версии модели. Любую отдельную цифру «IQ ИИ = N» стоит воспринимать с большими оговорками.
Нет, высокий балл на тесте не означает человеческого интеллекта. IQ-нормы построены для людей и предполагают человеческие ограничения — рабочую память, скорость обработки, утомляемость. У модели этих ограничений нет, и высокий результат отражает обучение на огромных данных и сопоставление образцов, а не общий интеллект (g).
Для ИИ такой тест измеряет способность распознавать и продолжать закономерности, знакомые ему по обучающим данным. Это не то же самое, что гибкое решение новых задач в незнакомом контексте у человека. Поэтому корректнее говорить о результате на конкретном бенчмарке, а не о наличии у модели «интеллекта» в человеческом смысле.
Разброс возникает из-за формата теста, способа предъявления заданий и того, встречались ли похожие задачи в обучающих данных. Текстовые задания модель часто решает лучше, чем визуальные матрицы, где нужно реально «видеть» фигуры. Из-за этого один и тот же ИИ может показать совершенно разные «баллы» на разных тестах.
Прогнозы вроде «IQ ИИ достигнет 195 к такому-то году» — это спекуляция, а не факт. Шкала IQ калибрована для людей, и её механическое перенесение на машины за пределами человеческого диапазона теряет смысл. Подобные цифры стоит чётко помечать как прогноз или допущение, а не как измеренный показатель интеллекта.
| Тест / бенчмарк | Сообщавшийся результат ИИ | Что это на самом деле измеряет |
|---|---|---|
| Словесные аналогии | Около 120–135 на отдельных тестах | Языковые шаблоны из обучающих данных |
| Прогрессивные матрицы (визуальные) | Сильно варьирует, часто ниже | Распознавание абстрактных паттернов |
| Отдельные паттерн-бенчмарки | Иногда очень высоко | Узкое сопоставление образцов, а не общий интеллект |
| Важная оговорка | Любая цифра «IQ ИИ = N» | Не человеческий g; нормы созданы для людей |