ANALISIS CLUSTERING UNTUK PENGELOMPOKAN JUDUL SKRIPSI MAHASISWA MENGGUNAKAN METODE TF-IDF DAN ALGORITMA K-MEANS (STUDI KASUS : STT WASTUKANCANA)
Abstract
Pada STT. Wastukancana mahasiswa yang telah lulus pasti telah mendaftarkan judul skripsinya ke dalam sistem yang bernama e-research, pada sistem tersebut judul skripsi di kelompokkan menurut tahun ajaran judul tersebut diajukan oleh mahasiswa. Hal itu membuat mahasiswa yang akan mengajukan judul skripsi kesulitan dalam menentukan judul baru yang sebelumnya belum pernah diajukan. Masalah ini dapat diatasi dengan menerapkan metode pengelompokkan clustering terhadap judul skripsi yang ada.Tujuan dari penelitian ini yaitu melakukan analisis clusteringjudul skripsi mahasiswa dengan membandingkan kemiripan kata yang terdapat dalam judul skripsi tersebut menggunakan metode TF-IDF dan algoritma K-Means.Metode analisis yang digunakan yaitu pengumpulan data, text preprocessing, feature Selection, TF-IDF, dan text mining.Algoritma clustering yang digunakan yaitu algoritma K-Means dimana clustering ini bertujuan untuk mengelompokkan judul skripsi ke dalam cluster berdasarkan kemiripan kata yang terdapat pada judul skripsi tersebut.Hasil dari penelitian ini adalah pengelompokkan judul skripsi mahasiswa yang didapat berdasarkan cluster yang terbentuk. Hasil dari cluster ini dapat menjadi acuan sebagai rekomendasi dalam penyimpanan skripsi yang sudah dibuat dan penentuan judul skripsi yang akan datang.
References
H. Yu, L. Y. Chen, J. T. Yao, and X. N. Wang, “A three-way clustering method based on an improved DBSCAN algorithm,” Phys. A Stat. Mech. its Appl., vol. 535, p. 122289, 2019, doi: 10.1016/j.physa.2019.122289.
M. R. L. Iin Parlina, Agus Perdana Windarto, Anjar Wanto, “Memanfaatkan Algoritma K-Means Dalam Menentukan Pegawai Yang Layak Mengikuti Asessment Center,” Memanfaatkan Algoritm. K-Means Dalam Menentukan Pegawai Yang Layak Mengikuti Asessment Cent. Untuk Clust. Progr. Sdp, vol. 3, no. 1, pp. 87–93, 2018.
R. R. A. Siregar, F. A. Sinaga, and R. Arianto, “Aplikasi Penentuan Dosen Penguji Skripsi Menggunakan Metode TF-IDF dan Vector Space Model,” Comput. J. Comput. Sci. Inf. Syst., vol. 1, no. 2, p. 171, 2017, doi: 10.24912/computatio.v1i2.1014.
N. Alamsyah, “Perbandingan Algoritma Winnowing Dengan Algoritma Rabin Karp Untuk Mendeteksi Plagiarisme Pada Kemiripan Teks Judul Skripsi,” Technol. J. Ilm., vol. 8, no. 3, p. 124, 2017, doi: 10.31602/tji.v8i3.1116.
V. Amrizal, “Penerapan Metode Term Frequency Inverse Document Frequency (Tf-Idf) Dan Cosine Similarity Pada Sistem Temu Kembali Informasi Untuk Mengetahui Syarah Hadits Berbasis Web (Studi Kasus: Hadits Shahih Bukhari-Muslim),” J. Tek. Inform., vol. 11, no. 2, pp. 149–164, 2018, doi: 10.15408/jti.v11i2.8623.
P. H. Saputro, M. Aristin, and Dy. L. Tyas, “Berdasarkan Lirik Menggunakan Metode Tf-,” J. Teknoloi Inform. dan Terap., vol. 4, no. 1, pp. 45–50, 2017.
F. S. Sholihuda, B. Yuwono, and H. C. Rustamadji, “Pemanfaatan Text Mining Pada Sistem Pengolahan Skripsi Menggunakan Algoritma Naïve Bayes Classifier Dan Simple Additive Weighting,” Telematika, vol. 17, no. 2, p. 120, 2020, doi: 10.31315/telematika.v1i1.3379.
R. T. Wahyuni, D. Prastiyanto, and E. Supraptono, “Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi,” J. Tek. Elektro, vol. 9, no. 1, pp. 18–23, 2017, doi: 10.15294/jte.v9i1.10955.
C. S. Journal, “Implementasi Text Mining Pada Twitter Dengan Algoritma K-Means Clustering Sebagai Dasar,” vol. 9, no. 2, pp. 138–147, 2020.
A. Priyanto and M. R. Ma’arif, “Implementasi Web Scrapping dan Text Mining untuk Akuisisi dan Kategorisasi Informasi dari Internet (Studi Kasus: Tutorial Hidroponik),” Indones. J. Inf. Syst., vol. 1, no. 1, pp. 25–33, 2018, doi: 10.24002/ijis.v1i1.1664.
S. Budi, “Text Mining Untuk Analisis Sentimen Review Film Menggunakan Algoritma K-Means,” Techno.Com, vol. 16, no. 1, pp. 1–8, 2017, doi: 10.33633/tc.v16i1.1263.
Copyright (c) 2021 RABIT:Jurnal Teknologi dan Sistem Informasi Univrab

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
1. Copyright of all journal manuscripts is held by the RABIT: Jurnal Teknologi dan Sistem Informasi Univrab
2. Formal legal provisions to access digital articles of electronic journal are subject to the provision of the Creative Commons Attribution-ShareAlike license (CC BY-NC-SA), which means that RABIT: Jurnal Teknologi dan Sistem Informasi Univrab is rightful to keep, transfer media/format, manage in the form of databases, maintain, and publish articles.
3. Published manuscripts both printed and electronic are open access for educational, research, and library purposes. Additionally, the editorial board is not responsible for any violations of copyright law.
licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
