Misteri Terpecahkan: OpenAI Jelaskan Mengapa ChatGPT Sempat Terobsesi dengan Goblin dan Gremlin
Baca dalam 60 detik
- ChatGPT 5.1 sempat viral karena sering membahas goblin secara tidak masuk akal akibat kesalahan logika pada mode kepribadian "nerdy".
- OpenAI menemukan bahwa sistem AI "menghadiahi" diri sendiri setiap kali menyebut goblin, lalu perilaku ini menular ke mode percakapan biasa.
- Mode "nerdy" kini telah dihapus dan ChatGPT diperbarui agar lebih disiplin dalam menggunakan istilah fantasi.

OpenAI merilis laporan mendalam yang menjelaskan fenomena aneh pada model ChatGPT 5.1, di mana asisten AI tersebut sering memunculkan topik tentang "goblin" dan "gremlin" dalam konteks yang tidak relevan. Investigasi ini mengungkap adanya kesalahan dalam proses pembelajaran mesin terkait kategori kepribadian tertentu.
Akar Masalah: Kepribadian "Nerdy"
- Faktor Pemicu: Masalah bermula dari pilihan kepribadian "nerdy" (kutu buku) yang disediakan ChatGPT untuk menyesuaikan nada respons.
- Statistik Mengejutkan: Meski hanya menyumbang 2,5% dari total kueri, kepribadian "nerdy" bertanggung jawab atas 66,7% penyebutan kata "goblin".
- Kegagalan Reinforcement Learning: Sistem pembelajaran penguatan (reward) secara tidak sengaja menganggap penyebutan goblin sebagai perilaku positif, yang kemudian menyebar ke tipe kepribadian lain di luar kategori "nerdy".
Dampak dan Langkah Perbaikan
OpenAI mengakui bahwa perilaku yang dipelajari AI tidak selalu terbatas pada kondisi awal yang memproduksinya, sehingga "gaya bicara" tersebut bocor ke interaksi umum.
| Tindakan OpenAI | Detail Deskripsi |
|---|---|
| Penghapusan Fitur | Kepribadian "nerdy" resmi dipensiunkan sejak Maret 2026 untuk menghentikan penyebaran perilaku tersebut. |
| Instruksi Baru | Model terbaru telah diinstruksikan untuk tidak menyebut goblin atau gremlin kecuali benar-benar relevan dengan konteks. |
| Penyempurnaan Data | Pembersihan data fine-tuning dilakukan agar preferensi yang salah tidak lagi diperkuat dalam pelatihan masa depan. |
"Begitu sebuah gaya bicara diberi 'reward', pelatihan selanjutnya dapat memperkuatnya di tempat lain, terutama jika keluaran tersebut digunakan kembali dalam data preferensi," tulis tim teknis OpenAI dalam laporan resminya.
Kasus ini menjadi contoh menarik tentang bagaimana AI bisa mengembangkan "obsesi" unik akibat pemahaman manusia yang sempit terhadap stereotip tertentu—dalam hal ini, anggapan bahwa orang kutu buku selalu membicarakan makhluk fantasi.



