Para peneliti NYU Tandon telah memperkenalkan EnIGMA, agen AI yang secara mandiri memecahkan tantangan keamanan siber, menyoroti potensinya untuk mengubah aplikasi dunia nyata dan meningkatkan langkah-langkah keamanan.
Para peneliti dari NYU Tandon School of Engineering, bersama dengan NYU Abu Dhabi dan institusi lain yang berkolaborasi, telah meluncurkan agen AI canggih yang dirancang untuk secara mandiri mengatasi tantangan keamanan siber yang kompleks. Dijuluki EnIGMATerobosan ini dipresentasikan pada Konferensi Internasional tentang Pembelajaran Mesin (ICML) 2025, yang menampilkan lompatan maju yang mengesankan di bidang tersebut.
"EnIGMA adalah tentang penggunaan agen Large Language Model untuk aplikasi keamanan siber," ujar salah satu penulis Meet Udeshi, mahasiswa doktoral NYU Tandon, dalam siaran pers.
EnIGMA merupakan puncak upaya kolaboratif yang dipimpin oleh Udeshi di bawah bimbingan Ramesh Karri, ketua Departemen Teknik Elektro dan Komputer (ECE) NYU Tandon dan anggota fakultas Pusat Keamanan Siber NYU dan Pusat Teknologi Canggih Telekomunikasi NYU (CATT), dan Farshad Khorrami, profesor ECE dan anggota fakultas CATT.
Penelitian ini juga mendapat kontribusi dari beragam suara akademis di NYU Abu Dhabi, Universitas Princeton, dan Universitas Stanford.
Sistem AI tradisional telah membuktikan kegunaannya dalam domain seperti pengembangan perangkat lunak dan navigasi web, tetapi keamanan siber menimbulkan tantangan unik yang membuat banyak kerangka kerja AI yang ada tidak memadai.
Namun, EnIGMA memanfaatkan kerangka kerja khusus yang dikenal sebagai “Interactive Agent Tools” untuk menerjemahkan program keamanan siber visual ke dalam format berbasis teks yang dapat dipahami oleh model AI.
"Kita harus merestrukturisasi antarmuka tersebut agar dapat memasukkannya ke dalam LLM dengan benar. Jadi, kami telah melakukannya untuk beberapa perangkat keamanan siber," tambah Udeshi.
Pendekatan inovatif ini memungkinkan AI untuk memproses teks, mengatasi keterbatasan antarmuka grafis tradisional yang umum digunakan dalam alat keamanan siber seperti debugger dan penganalisis jaringan.
Komponen penting dalam pengembangan EnIGMA adalah pembuatan set data benchmark Capture The Flag (CTF) yang dikustomisasi. Tantangan CTF ini, yang mensimulasikan kerentanan dunia nyata dan digunakan dalam kompetisi akademis, memainkan peran krusial dalam pelatihan AI.
"CTF seperti versi gamifikasi dari keamanan siber yang digunakan dalam kompetisi akademis. Ini bukan masalah keamanan siber yang sebenarnya akan Anda hadapi di dunia nyata, tetapi merupakan simulasi yang sangat bagus," tambah Udeshi.
Penelitian ini menunjukkan keunggulan EnIGMA dalam 390 tantangan CTF yang tersebar di empat tolok ukur, mencapai hasil yang mutakhir. Agen AI ini berhasil menyelesaikan tantangan tiga kali lebih banyak dibandingkan sistem sebelumnya.
Merefleksikan evolusi model AI, Udeshi mencatat, “Claude 3.5 Sonnet dari Anthropic adalah model terbaik, dan GPT-4o berada di urutan kedua saat itu.”
Dalam penelitian mereka, tim menemukan fenomena yang disebut "soliloquizing", di mana AI menghasilkan pengamatan berhalusinasi tanpa benar-benar berinteraksi dengan lingkungannya. Temuan ini mungkin memiliki implikasi signifikan bagi keamanan dan keandalan AI di masa mendatang.
Melampaui penghargaan akademis, implikasi EnIGMA meluas ke aplikasi praktis.
Menurut Udeshi, “Jika Anda membayangkan agen LLM otonom yang mampu memecahkan CTF ini, agen tersebut memiliki keterampilan keamanan siber yang substansial yang dapat Anda gunakan untuk tugas-tugas keamanan siber lainnya.”
Prospek agen semacam itu yang menerapkan kemampuannya pada penilaian kerentanan dunia nyata, secara mandiri mencoba ratusan pendekatan yang berbeda, menandakan perubahan transformatif dalam operasi keamanan siber.
Namun, sifat ganda teknologi ini menuntut kehati-hatian. Meskipun menjanjikan peningkatan pertahanan keamanan siber, terdapat pula potensi penyalahgunaan.
Mengingat hal ini, para peneliti telah memberi tahu perusahaan AI besar, termasuk Meta, Anthropic, dan OpenAI, tentang temuan mereka.
Sumber: Sekolah Teknik NYU Tandon
