AI seperti model bahasa besar (LLM) bisa meraih skor tinggi pada sebagian rangkaian soal gaya IQ — angka sekitar 120-135 pernah dilaporkan pada tes tertentu — tetapi ini tidak berarti AI punya IQ seperti manusia. Skor itu mencerminkan data latih dan pencocokan pola, bukan kecerdasan umum (g) yang diukur tes IQ untuk manusia.
Ya, LLM bisa mengerjakan dan menjawab benar banyak soal gaya IQ, terutama analogi verbal dan sebagian matriks pola. Pada beberapa tes tertentu, skor yang dilaporkan berada di kisaran sekitar 120-135, dan pada benchmark pola tertentu bahkan lebih tinggi. Namun hasilnya sangat bervariasi antar-tes, sehingga tidak ada satu angka IQ AI yang bisa dianggap pasti.
Tidak, skor tinggi pada soal IQ tidak sama dengan kecerdasan umum manusia. Tes IQ dirancang dan dinormakan untuk manusia, sementara AI menjawab lewat pola dari data latihnya, bukan melalui penalaran umum yang fleksibel seperti manusia. AI juga tidak menghadapi keterbatasan memori kerja atau kecepatan pemrosesan manusia, sehingga perbandingan langsung menyesatkan.
Karena angka tersebut bergantung pada tes mana yang dipakai dan seberapa mirip soalnya dengan data latih AI. Tes verbal cenderung memberi AI keunggulan, sedangkan tes lain bisa memberi hasil sangat berbeda. Karena itu, setiap klaim AI IQ = N harus diperlakukan dengan banyak catatan; angka tunggal tanpa konteks tes hampir tidak berarti.
Klaim semacam itu adalah proyeksi atau spekulasi, bukan fakta. Angka seperti AI IQ 195 pada tahun tertentu adalah perkiraan ekstrapolatif yang tidak boleh disajikan sebagai kepastian. Kecerdasan AI berkembang dengan cara yang berbeda dari kecerdasan manusia, sehingga memproyeksikan IQ manusia ke masa depan AI secara linear tidak punya dasar ilmiah yang kuat.
Secara teknis tidak — LLM tidak punya IQ dalam arti psikometrik manusia. Skala IQ dibangun dari distribusi kemampuan manusia (rata-rata 100, SD 15), sedangkan AI berada di luar populasi acuan itu. Yang bisa dikatakan hanyalah bahwa AI dapat meniru performa tinggi pada jenis soal tertentu, bukan bahwa ia memiliki kecerdasan umum yang setara manusia.
| Tes / Benchmark | Hasil AI yang Dilaporkan | Apa yang Sebenarnya Diukur |
|---|---|---|
| Analogi verbal | Tinggi (sering setara skor manusia atas) | Pola bahasa dari data latih, bukan g |
| Matriks pola (gaya Raven) | Bervariasi; sebagian tinggi | Pengenalan pola, bukan penalaran umum manusia |
| Tes IQ gabungan tertentu | Sekitar 120-135 (dilaporkan) | Skor spesifik-tes, sangat bergantung soal |
| Catatan penting | Bukan g manusia | Tes dinormakan untuk manusia, bukan AI |