Ancaman AI di Dunia Nyata: Google Ungkap Kondisi Injeksi Prompt Tidak Langsung (IPI) di Web
Baca dalam 60 detik
- Google memindai miliaran halaman web untuk mendeteksi Indirect Prompt Injection (IPI), sebuah teknik di mana instruksi rahasia disembunyikan di situs web untuk membajak sistem AI yang membacanya.
- Analisis menemukan enam tipe IPI yang beredar, mulai dari lelucon yang tidak berbahaya, manipulasi rekomendasi bisnis (SEO), upaya memblokir crawler AI, hingga eksperimen amatir untuk merusak sistem.
- Walaupun tingkat kecanggihan serangan saat ini masih rendah, Google memperingatkan adanya lonjakan percobaan berbahaya sebesar 32% dalam beberapa bulan terakhir, menandakan bahwa ancaman manipulasi AI akan segera menjadi lebih masif dan kompleks.

Tim Threat Intelligence Google melakukan investigasi luas untuk memantau aktivitas manipulasi AI di dunia nyata, khususnya ancaman Indirect Prompt Injection (IPI). Temuan mereka mengungkap bahwa peretas mulai aktif bereksperimen dengan vektor serangan ini di internet, meskipun tingkat kecanggihannya saat ini masih tergolong rendah.
Fakta Kunci Investigasi IPI Google:
- Apa itu IPI: Terjadi ketika sistem AI memproses konten pihak ketiga (seperti teks situs web) yang disisipi instruksi berbahaya tersembunyi, membuat AI mematuhi perintah peretas alih-alih pengguna aslinya.
- Metodologi: Pemindaian dilakukan menggunakan repositori Common Crawl, dengan sistem penyaringan berlapis (Pencocokan Pola, Klasifikasi LLM via Gemini, dan Validasi Manusia) untuk mengeleminasi positif palsu.
- Tren Mengkhawatirkan: Terdapat lonjakan deteksi sebesar 32 persen pada kategori injeksi berbahaya antara November 2025 hingga Februari 2026.
Enam Kategori Injeksi Prompt di Web
Sebagian besar deteksi IPI pada awalnya adalah positif palsu (seperti materi edukasi keamanan siber). Namun, setelah disaring, Google menemukan bahwa pelaku ancaman membagi aktivitas mereka ke dalam beberapa kategori utama:
| Kategori IPI | Tujuan dan Praktik di Lapangan |
|---|---|
| Harmless Pranks & Helpful Guidance | Tindakan tidak berbahaya seperti menyisipkan teks tak terlihat agar AI mengubah nada bicaranya (lelucon), atau instruksi dari penulis web agar AI memberikan rangkuman artikel yang lebih akurat. |
| SEO (Search Engine Optimization) | Trik manipulasi agar asisten AI mempromosikan bisnis tertentu di atas pesaingnya saat memberikan rekomendasi kepada pengguna. |
| Deterring AI Agents | Membuat jebakan bagi crawler AI. Misalnya, menjebak AI ke halaman berisi teks tanpa akhir untuk membuang sumber daya komputasi atau memicu timeout. |
| Malicious (Exfiltration & Destruction) | Upaya pencurian data pengguna atau eksekusi perintah merusak (seperti menghapus file). Mayoritas masih berupa eksperimen amatir yang kemungkinannya sangat kecil untuk berhasil menembus pertahanan AI modern. |
"Sistem AI saat ini jauh lebih mumpuni, meningkatkan nilai mereka sebagai target, sementara pelaku ancaman mulai mengotomatisasi operasi mereka dengan agen AI... Sebagai hasilnya, kami memperkirakan skala dan kecanggihan upaya serangan IPI akan tumbuh dalam waktu dekat," tulis laporan tim Google.
Google menegaskan bahwa meskipun serangan saat ini lebih terlihat seperti trik SEO dan eksperimen keamanan, tren peningkatannya adalah nyata. Google terus memperkuat model AI Gemini mereka dan menggunakan operasi red-teaming untuk memitigasi manipulasi tersebut sebelum berdampak pada pengguna.



