Perbandingan Klasifikasi Bahasa Menggunakan Metode Naïve Bayes Classifier (NBC) Dan Support Vector Machine (SVM)

Deglorians Tuhenay

Abstract


Bahasa adalah salah satu aspek penting dalam kehidupan manusia karena melalui bahasa, manusia dapat berkomunikasi dan berinteraksi satu dengan lainnya. Beragam macam suku, budaya, ras, dan agama di Indonesia seringkali menyebabkan kesulitan dalam berkomunikasi karena dialek dan bahasa dari tiap daerah di Indonesia sangatlah banyak dan beragam. Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan bahasa menurut bahasa dari tiap daerah di Indonesia dan dalam penelitian ini menggunakan bahasa Indonesia sebagai bahasa Ibu dan bahasa daerah yang dipakai adalah dari daerah Ambon dan Jawa. Proses identifikasi dan klasifikasi bahasa menggunakan Machine Learning dengan memakai metode Naïve Bayes Classifier dan Support Vector Machine agar dapat mengetahui nilai probabilitas bahasa dan untuk mengklasifikasi bahasa sesuai data yang sudah dimasukan di Ms.Excel. Penelitian ini juga melakukan perbandingan dari kedua metode tersebut agar dapat mengetahui metode apa yang lebih efektif dipakai untuk mengidentifikasi bahasa. Hasil yang didaptkan dengan memakai metode NBC dan SVM adalah keduanya bagus dalam melakukan identifikasi bahasa karena memperoleh nilai accuracy di atas 0,90  hanya saja melalui perhitungan counfusion matrix, metode SVM lebih efektif dengan nilai accuracy 0,9634 dibandingkan dengan nilai NBC 0,9378.

References


Rina Devianty, “Bahasa Sebagai Cermin Kebudayaan,†J. Tarb., vol. 24, no. 2, pp. 226–245, 2017.

L. Wicaksono, “Bahasa Dalam Komunikasi Pembelajaran,†J. Pembelajaran Prospektif, vol. 1, no. 2, pp. 9–19, 2016, [Online]. Available: http://jurnal.untan.ac.id/index.php/lp3m/article/download/19211/16053.

R. P. Suminar, “Pengaruh Bahasa Gaul terhadap Penggunaan Bahasa Indonesia Mahasiswa Unswagati,†Logika, vol. 18, no. 3, pp. 114–119, 2016, [Online]. Available: www.jurnal.unswagati.ac.id.

T. Berlianty, “Penguatan Eksistensi Bahasa Tana dalam Upaya Perlindungan Hukum Bahasa Daerah sebagai Warisan Budaya Bangsa,†Kertha Patrika, vol. 40, no. 2, p. 99, 2018, doi: 10.24843/kp.2018.v40.i02.p04.

A. A. Budiman, “Pendeteksi Bahasa Daerah Pada Twitter Dengan Machine Learning,†p. 11523262, 2018.

L. Flek, “Returning the N to NLP: Towards Contextually Personalized Classification Models,†pp. 7828–7838, 2020, doi: 10.18653/v1/2020.acl-main.700.

T. Lalwani, S. Bhalotia, A. Pal, S. Bisen, and V. Rathod, “Implementation of a Chat Bot System using AI and NLP,†Int. J. Innov. Res. Comput. Sci. Technol., vol. 6, no. 3, pp. 26–30, 2018, doi: 10.21276/ijircst.2018.6.3.2.

P. H. Saputro, M. Aristin, and Dy. L. Tyas, “Berdasarkan Lirik Menggunakan Metode Tf-,†J. Teknoloi Inform. dan Terap., vol. 4, no. 1, pp. 45–50, 2017.

F. Fathurrahman et al., “PENERAPAN ARTIFICIAL NEURAL NETWORK UNTUK KLASIFIKASI CITRA TEKS DALAM PENERJEMAHAN BAHASA,†pp. 585–594, 2020.

N. Munasatya and S. Novianto, “Natural Language Processing untuk Sentimen Analisis Presiden Jokowi Menggunakan Multi Layer Perceptron,†Techno.Com, vol. 19, no. 3, pp. 237–244, 2020, doi: 10.33633/tc.v19i3.3630.

X. Feng, S. Li, C. Yuan, P. Zeng, and Y. Sun, “Prediction of Slope Stability using Naive Bayes Classifier,†KSCE J. Civ. Eng., vol. 22, no. 3, pp. 941–950, 2018, doi: 10.1007/s12205-018-1337-3.

W. Muslehatin, M. Ibnu, and Mustakim, “Penerapan Naïve Bayes Classification untuk Klasifikasi Tingkat Kemungkinan Obesitas Mahasiswa Sistem Informasi UIN Suska Riau,†Semin. Nas. Teknol. Informasi, Komun. dan Ind., p. 7, 2017.

et al., “Klasifikasi Kabupaten Tertinggal di Kawasan Timur Indonesia dengan Support Vector Machine,†JIKO (Jurnal Inform. dan Komputer), vol. 3, no. 3, pp. 188–195, 2020, doi: 10.33387/jiko.v3i3.2364.

Y. Wang, Z. Zhou, S. Jin, D. Liu, and M. Lu, “Comparisons and Selections of Features and Classifiers for Short Text Classification,†IOP Conf. Ser. Mater. Sci. Eng., vol. 261, no. 1, 2017, doi: 10.1088/1757-899X/261/1/012018.

M. L. Laia and Y. Setyawan, “Perbandingan Hasil Klasifikasi Curah Hujan Menggunakan Metode SVM dan NBC,†vol. 05, no. 2, pp. 51–61, 2020.




DOI: https://doi.org/10.33387/jiko.v4i2.2958

Refbacks

  • There are currently no refbacks.