ANALISIS EXPLAINABILITY MODEL CNN UNTUK KLASIFIKASI LUKA: STUDI KOMPARASI RESNET50V2, DENSENET201, DAN MOBILENETV2 DENGAN GRAD-CAM
Keywords:
Klasifikasi Luka, Convolutional Neural Network (CNN), ResNet50V2, DenseNet201, MobileNetV2, Explainable AI (XAI), Grad-CAM, Transfer Learning.Abstract
Luka kulit merupakan masalah kesehatan umum yang jika tidak ditangani dengan benar dapat menyebabkan infeksi serius. Teknologi kecerdasan buatan (AI), khususnya Convolutional Neural Network (CNN), telah banyak dimanfaatkan untuk analisis citra medis, termasuk klasifikasi luka. Penelitian ini bertujuan untuk menganalisis dan membandingkan performa model CNN pre-trained ResNet50V2, DenseNet201, dan MobileNetV2 dalam klasifikasi enam jenis luka (abrasi, bakar, laserasi, lebam, sayat, tusuk) serta mengevaluasi kualitas explainability masing-masing model menggunakan Grad-CAM. Data citra luka diperoleh dari Kaggle, dengan total 400 gambar asli yang kemudian diproses melalui resize menjadi 224x224 piksel dan di-oversampling menggunakan SMOTE hingga setiap kelas memiliki 122 gambar, sehingga total menjadi 732 gambar. Dataset dibagi menjadi 70% data latih (510 gambar), 15% data validasi (108 gambar), dan 15% data uji (114 gambar), di mana data latih kemudian diaugmentasi menjadi 2550 gambar. Hasil evaluasi kuantitatif menunjukkan bahwa ResNet50V2 unggul dalam performa metrik dengan akurasi 0,93, sensitivitas (recall) 0,80, spesifisitas 0,96, PPV (presisi) 0,82, NPV 0,96, dan F1-score 0,79. Durasi pelatihan MobileNetV2 adalah yang paling efisien (35 menit 21 detik) dibandingkan ResNet50V2 (3 jam 4 menit 7 detik) dan DenseNet201 (4 jam 49 menit 7 detik). Analisis explainability menggunakan Grad-CAM menunjukkan bahwa ResNet50V2 juga paling efektif dalam memfokuskan perhatian pada area luka yang relevan (33 dari 48 gambar uji fokus pada area luka), mengungguli DenseNet201 dan MobileNetV2 yang cenderung lebih sering terdistraksi. Kelas "Sayat" menunjukkan performa terbaik di ResNet50V2, sementara kelas "Lebam" dan "Abrasi" memiliki tingkat kesalahan prediksi tertinggi, dengan "Lebam" sering tertukar dengan "Abrasi", dan "Bakar" sering tertukar dengan "Sayat", "Abrasi", atau "Laserasi" yang berisiko fatal. Penelitian ini menyimpulkan bahwa ResNet50V2 merupakan model terbaik karena tidak hanya akurat tetapi juga memiliki explainability yang superior, memungkinkannya untuk memusatkan perhatian pada fitur-fitur visual luka yang relevan. Disarankan untuk melakukan fine-tuning model, menambah diversitas data, serta melakukan validasi heatmap Grad-CAM dengan ahli medis untuk penelitian selanjutnya.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Angga Permana Ellion, Rudy Dwi Nyoto , Khairul Hafidh

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.




