PENERAPAN CNN UNTUK KLASIFIKASI TINGKAT TUTUR TEKS BAHASA JAWA
Keywords:
CNN, Klasifikasi Teks, Bahasa Jawa, SMOTEAbstract
Penelitian ini menerapkan model Convolutional Neural Network (CNN) untuk mengklasifikasikan tingkat tutur dalam teks bahasa Jawa, yaitu ngoko, madya, dan krama. Tujuan penelitian adalah untuk mengetahui penerapan model Convolutional Neural Network (CNN) dalam mengklasifikasikan tingkat tutur teks bahasa Jawa dan mengevaluasi performa model melalui metrik akurasi, presisi, recall, dan F1-score. Dengan menggunakan dataset berisi 1200 teks yang dilabeli sesuai tingkat tutur, yang diproses melalui tahap preprocessing (cleaning, case folding, tokenisasi, padding, label encoding) dan tiga skenario eksperimen: Skenario 1 (data asli), Skenario 2 (data dengan Synthetic Minority Over-sampling Technique/SMOTE), dan Skenario 3 (gabungan data asli dan data sintetis madya). Model CNN dengan arsitektur sederhana (embedding, konvolusi, pooling, dan dense layer), optimizer Adam, dan pelatihan selama 100 epochs dievaluasi menggunakan 10-fold cross-validation. Selain itu, teknik oversampling SMOTE digunakan untuk mengatasi ketidakseimbangan kelas dalam dataset. Tiga skenario eksperimen diuji: data asli, data dengan SMOTE, dan gabungan tambahan data sintetis SMOTE dengan data asli. Evaluasi dilakukan dengan 10-fold cross-validation, menghasilkan rata-rata akurasi, presisi, recall, dan F1-score sebesar 0,96 pada skenario 1 (data asli), namun kesulitan mengklasifikasikan kelas madya karena ketidakseimbangan data. Skenario 2 menghasilkan rata-rata metrik 0,92 dengan peningkatan signifikan pada klasifikasi kelas madya. Skenario 3 mencapai rata-rata metrik 0,89, dengan penurunan performa akibat variasi karakteristik data tambahan madya. Kesimpulan penelitian ini adalah model CNN efektif untuk mengklasifikasikan tingkat tutur teks bahasa Jawa
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Dina Kamelia, Herry Sujaini , Rina Septiriana

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.




