Dalam sebuah studi penting, menggabungkan keahlian manusia dengan AI telah terbukti secara signifikan meningkatkan akurasi diagnostik dalam kedokteran, menawarkan jalur transformatif ke depan untuk perawatan dan keselamatan pasien.
Kolektif diagnostik hibrida yang terdiri dari pakar manusia dan sistem kecerdasan buatan secara signifikan mengungguli metode diagnosis tradisional, menurut sebuah studi internasional yang dipimpin oleh Institut Max Planck untuk Pengembangan Manusia.
Kesalahan diagnostik tetap menjadi tantangan kritis dalam praktik medis.
Sementara sistem AI, terutama model bahasa besar (LLM) seperti ChatGPT-4, Gemini, dan Claude 3, menawarkan dukungan diagnostik yang inovatif, terkadang mereka menghasilkan informasi yang salah dan mencerminkan bias yang ada.
Sebuah tim peneliti dari Institut Max Planck untuk Pengembangan Manusia, bekerja sama dengan Proyek Diagnosis Manusia di San Francisco dan Institut Ilmu dan Teknologi Kognitif dari Dewan Riset Nasional Italia, telah menyelidiki kolaborasi optimal antara manusia dan AI.
Hasil studi tersebut menjanjikan: kolektif diagnostik hibrida, yang menggabungkan masukan manusia dan AI, menghasilkan akurasi diagnostik yang jauh lebih tinggi daripada manusia atau AI saja, terutama dalam kasus yang kompleks dan terbuka.
"Hasil penelitian kami menunjukkan bahwa kerja sama antara manusia dan model AI memiliki potensi besar untuk meningkatkan keselamatan pasien," kata penulis utama Nikolas Zöller, peneliti pascadoktoral di Center for Adaptive Rationality di Max Planck Institute for Human Development, dalam rilis berita.
Simulasi Realistis dan Analisis Komprehensif
Tim peneliti memanfaatkan data dari lebih dari 2,100 gambaran klinis yang disediakan oleh Human Diagnosis Project.
Studi kasus ini, dipasangkan dengan diagnosis yang tepat, memungkinkan perbandingan antara diagnosis yang dibuat oleh profesional medis dan diagnosis yang dihasilkan oleh lima model AI terkemuka.
Para peneliti mensimulasikan berbagai skenario diagnostik — individu, kolektif manusia, model AI, dan campuran kolektif manusia–AI — yang menghasilkan analisis lebih dari 40,000 diagnosis.
Studi tersebut mengungkap bahwa meskipun beberapa model AI secara kolektif mengungguli 85% ahli diagnostik manusia, para ahli manusia masih unggul dalam banyak kasus.
Khususnya, kombinasi masukan manusia dan AI menghasilkan akurasi diagnostik tertinggi. Pendekatan ini memanfaatkan sifat saling melengkapi dari kesalahan manusia dan AI: ketika salah satu gagal, yang lain sering kali berhasil, sehingga menciptakan jaring pengaman yang kuat.
"Ini bukan tentang mengganti manusia dengan mesin. Sebaliknya, kita harus memandang kecerdasan buatan sebagai alat pelengkap yang memaksimalkan potensinya dalam pengambilan keputusan kolektif," tambah rekan penulis Stefan Herzog, seorang ilmuwan peneliti senior di Institut Max Planck untuk Pengembangan Manusia.
Tantangan dan Arah Masa Depan
Meskipun hasilnya menjanjikan, para peneliti menekankan bahwa penelitian ini terbatas pada cerita klinis berbasis teks dan tidak melibatkan situasi klinis langsung. Penelitian lebih lanjut diperlukan untuk menentukan apakah temuan ini dapat diterapkan dalam praktik di dunia nyata.
Selain itu, penelitian hanya berfokus pada diagnosis dan bukan pengobatan, dan keakuratan diagnosis tidak selalu menjamin hasil pengobatan yang optimal.
Implementasi dan penerimaan praktis sistem pendukung berbasis AI oleh staf medis dan pasien, serta potensi bias, tetap menjadi area untuk penelitian masa depan.
Aplikasi yang Lebih Luas dan Pertimbangan Etika
Studi tersebut, bagian dari proyek Kecerdasan Kolektif Buatan Manusia Hibrida dalam Pengambilan Keputusan Terbuka (HACID) yang didanai Horizon Eropa, bertujuan untuk meningkatkan sistem pendukung keputusan klinis dengan mengintegrasikan kecerdasan manusia dan mesin.
Potensi penerapannya melampaui perawatan kesehatan, termasuk sistem hukum, tanggap bencana, dan kebijakan iklim.
"Pendekatan ini juga dapat diterapkan pada area kritis lainnya — seperti sistem hukum, respons bencana, atau kebijakan iklim — di mana pun keputusan yang rumit dan berisiko tinggi dibutuhkan. Misalnya, proyek HACID juga mengembangkan perangkat untuk meningkatkan pengambilan keputusan dalam adaptasi iklim," imbuh rekan penulis Vito Trianni, koordinator proyek HACID.
Kesimpulan
Kolektif hibrida manusia–AI menunjukkan potensi yang tak tertandingi dalam meningkatkan akurasi diagnostik dan keselamatan pasien. Seiring dengan kemajuan penelitian, pendekatan inovatif ini dapat merevolusi pemberian layanan kesehatan, yang pada akhirnya mengarah pada perawatan pasien yang lebih adil dan efektif di seluruh dunia.