Metode Pembelajaran Mesin Baru Meningkatkan Deteksi Penipuan

Para peneliti di Florida Atlantic University telah mengungkap teknik pembelajaran mesin mutakhir yang secara signifikan meningkatkan deteksi penipuan. Metode baru ini mengurangi hasil positif palsu dan meminimalkan kebutuhan untuk pemeriksaan lebih lanjut, sehingga menawarkan solusi yang menjanjikan bagi sektor-sektor yang sangat membutuhkan pemrosesan data dalam jumlah besar secara cepat.

Dalam sebuah kemajuan yang luar biasa, para peneliti dari Fakultas Teknik dan Ilmu Komputer Universitas Florida Atlantic telah mengembangkan metode pembelajaran mesin baru yang menjanjikan untuk merevolusi deteksi penipuan di sektor-sektor seperti perawatan kesehatan dan keuangan. Pendekatan inovatif ini secara signifikan mengurangi positif palsu dan meminimalkan kasus-kasus yang memerlukan pemeriksaan lebih lanjut, keduanya penting untuk mencegah kerugian finansial dan meningkatkan efisiensi operasional.

Penipuan merupakan masalah yang meluas di Amerika Serikat, yang semakin didorong oleh teknologi. Hebatnya, 93% penipuan kartu kredit kini melibatkan akses akun jarak jauh, bukan pencurian fisik. Pada tahun 2023, untuk pertama kalinya, kerugian akibat penipuan melampaui $10 miliar. Penipuan Medicare saja merugikan $60 miliar setiap tahunnya, sementara pencurian identitas mengakibatkan kerugian $16.4 miliar pada tahun 2021. Secara keseluruhan, kerugian pemerintah akibat pembayaran yang tidak tepat telah melampaui $2.7 triliun sejak tahun 2003.

Mengingat angka-angka yang mengejutkan ini, penerapan pembelajaran mesin untuk mendeteksi penipuan menjadi sangat penting. Metode tradisional sering kali gagal karena data yang berantakan atau tidak berlabel, dan jarangnya kasus penipuan dibandingkan dengan kasus normal menghadirkan tantangan tambahan.

Untuk mengatasi masalah ini, tim peneliti FAU telah merancang metode untuk menghasilkan label kelas biner dalam kumpulan data yang sangat tidak seimbang tanpa bergantung pada data berlabel. Hal ini menandai keuntungan signifikan dalam industri di mana masalah privasi dan tingginya biaya pelabelan menjadi kendala substansial.

Metode baru ini diuji pada dua kumpulan data dunia nyata berskala besar dengan ketidakseimbangan kelas yang parah: transaksi kartu kredit Eropa dan klaim Medicare Bagian D. Kedua kumpulan data, yang mencakup ratusan ribu hingga jutaan entri, menimbulkan tantangan dunia nyata yang sempurna untuk mengevaluasi teknik deteksi penipuan.

Penelitian tersebut, diterbitkan dalam Journal of Big Data, menunjukkan bahwa metode pelabelan mereka secara efektif mengatasi kesulitan pelabelan data yang sangat tidak seimbang dalam kerangka kerja tanpa pengawasan. Tidak seperti metode tradisional, pendekatan mereka mengevaluasi label penipuan dan non-penipuan yang baru dibuat secara langsung tanpa bergantung pada pengklasifikasi yang diawasi.

“Pemanfaatan pembelajaran mesin dalam pendeteksian penipuan membawa banyak keuntungan,” kata penulis senior Taghi Khoshgoftaar, Profesor Motorola di Departemen Teknik Elektro dan Ilmu Komputer di FAU, dalam rilis berita. “Algoritma pembelajaran mesin dapat memberi label data jauh lebih cepat daripada anotasi manusia, sehingga meningkatkan efisiensi secara signifikan. Metode kami merupakan kemajuan besar dalam pendeteksian penipuan, terutama dalam kumpulan data yang sangat tidak seimbang. Metode ini mengurangi beban kerja dengan meminimalkan kasus yang memerlukan pemeriksaan lebih lanjut, yang sangat penting dalam sektor seperti Medicare dan penipuan kartu kredit, di mana pemrosesan data yang cepat sangat penting untuk mencegah kerugian finansial dan meningkatkan efisiensi operasional.”

Yang penting, penelitian ini menemukan bahwa metode baru ini mengungguli algoritma Isolation Forest yang banyak digunakan, menawarkan cara yang lebih efisien untuk mengidentifikasi penipuan sekaligus meminimalkan kebutuhan investigasi lebih lanjut. Hal ini memvalidasi keandalan metode dalam menghasilkan label kelas biner untuk deteksi penipuan, bahkan dalam kumpulan data yang menantang.

Solusinya dapat diskalakan, tidak bergantung pada data berlabel yang mahal dan memakan waktu, serta memerlukan campur tangan manusia yang minimal.

“Metode kami menghasilkan label untuk penipuan atau kejadian positif dan non-penipuan atau kejadian negatif, yang kemudian disempurnakan untuk meminimalkan jumlah label penipuan,” imbuh penulis pertama Mary Anne Walauskis, kandidat doktor di Departemen Teknik Elektro dan Ilmu Komputer di FAU. “Dengan menerapkan metode kami, kami meminimalkan positif palsu, atau dengan kata lain, kejadian asli yang ditandai sebagai penipuan, yang merupakan kunci untuk meningkatkan deteksi penipuan. Pendekatan ini memastikan bahwa hanya kasus penipuan yang diidentifikasi dengan paling meyakinkan yang disimpan, meningkatkan akurasi dan mengurangi alarm yang tidak perlu, sehingga membuat deteksi penipuan lebih efisien.”

Teknik inovatif ini menggabungkan tiga metode pembelajaran tanpa pengawasan menggunakan pustaka SciKit-learn dan pendekatan persentil-gradien. Dengan menyempurnakan label, metode ini memastikan bahwa hanya kasus penipuan yang diidentifikasi dengan paling meyakinkan yang ditandai, sehingga mengurangi hasil positif palsu dan investigasi yang tidak perlu.

Stella Batalama, dekan Fakultas Teknik dan Ilmu Komputer, mengomentari implikasi yang lebih luas.

"Pendekatan inovatif ini sangat menjanjikan bagi industri yang dilanda penipuan, menawarkan cara yang lebih mudah diakses dan efektif untuk mengidentifikasi aktivitas penipuan dan melindungi sistem keuangan dan perawatan kesehatan. Menangani penipuan adalah kunci untuk mengurangi dampak sosialnya yang luas," katanya.

Saat tim peneliti terus menyempurnakan metode mereka, termasuk mengotomatiskan penentuan jumlah optimal kejadian positif, potensi penerapan skala besar dalam deteksi penipuan tampak menjanjikan.

sumber: Florida Atlantic University