PENERAPAN CNN UNTUK KLASIFIKASI TINGKAT TUTUR TEKS BAHASA JAWA

Authors

  • Dina Kamelia Universitas Tanjungpura
  • Herry Sujaini Universitas Tanjungpura
  • Rina Septiriana Universitas Tanjungpura

Keywords:

CNN, Klasifikasi Teks, Bahasa Jawa, SMOTE

Abstract

Penelitian ini menerapkan model Convolutional Neural Network (CNN) untuk mengklasifikasikan tingkat tutur dalam teks bahasa Jawa, yaitu ngoko, madya, dan krama. Tujuan penelitian adalah untuk mengetahui penerapan model Convolutional Neural Network (CNN) dalam mengklasifikasikan tingkat tutur teks bahasa Jawa dan mengevaluasi performa model melalui metrik akurasi, presisi, recall, dan F1-score. Dengan menggunakan dataset berisi 1200 teks yang dilabeli sesuai tingkat tutur, yang diproses melalui tahap preprocessing (cleaning, case folding, tokenisasi, padding, label encoding) dan tiga skenario eksperimen: Skenario 1 (data asli), Skenario 2 (data dengan Synthetic Minority Over-sampling Technique/SMOTE), dan Skenario 3 (gabungan data asli dan data sintetis madya). Model CNN dengan arsitektur sederhana (embedding, konvolusi, pooling, dan dense layer), optimizer Adam, dan pelatihan selama 100 epochs dievaluasi menggunakan 10-fold cross-validation. Selain itu, teknik oversampling SMOTE digunakan untuk mengatasi ketidakseimbangan kelas dalam dataset. Tiga skenario eksperimen diuji: data asli, data dengan SMOTE, dan gabungan tambahan data sintetis SMOTE dengan data asli. Evaluasi dilakukan dengan 10-fold cross-validation, menghasilkan rata-rata akurasi, presisi, recall, dan F1-score sebesar 0,96 pada skenario 1 (data asli), namun kesulitan mengklasifikasikan kelas madya karena ketidakseimbangan data. Skenario 2 menghasilkan rata-rata metrik 0,92 dengan peningkatan signifikan pada klasifikasi kelas madya. Skenario 3 mencapai rata-rata metrik 0,89, dengan penurunan performa akibat variasi karakteristik data tambahan madya. Kesimpulan penelitian ini adalah model CNN efektif untuk mengklasifikasikan tingkat tutur teks bahasa Jawa

Downloads

Published

2026-04-25

How to Cite

Kamelia, D., Sujaini , H., & Septiriana , R. (2026). PENERAPAN CNN UNTUK KLASIFIKASI TINGKAT TUTUR TEKS BAHASA JAWA. Scientica: Jurnal Ilmiah Sains Dan Teknologi, 4(2), 300–321. Retrieved from https://jurnal.kolibi.id/index.php/scientica/article/view/425