ANALISIS CLUSTERING UNTUK PENGELOMPOKAN JUDUL SKRIPSI MAHASISWA MENGGUNAKAN METODE TF-IDF DAN ALGORITMA K-MEANS (STUDI KASUS : STT WASTUKANCANA)
DOI:
https://doi.org/10.36341/rabit.v6i1.1617Kata Kunci:
Analisis, Clustering, TF-IDF, K-MeansAbstrak
Pada STT. Wastukancana mahasiswa yang telah lulus pasti telah mendaftarkan judul skripsinya ke dalam sistem yang bernama e-research, pada sistem tersebut judul skripsi di kelompokkan menurut tahun ajaran judul tersebut diajukan oleh mahasiswa. Hal itu membuat mahasiswa yang akan mengajukan judul skripsi kesulitan dalam menentukan judul baru yang sebelumnya belum pernah diajukan. Masalah ini dapat diatasi dengan menerapkan metode pengelompokkan clustering terhadap judul skripsi yang ada.Tujuan dari penelitian ini yaitu melakukan analisis clusteringjudul skripsi mahasiswa dengan membandingkan kemiripan kata yang terdapat dalam judul skripsi tersebut menggunakan metode TF-IDF dan algoritma K-Means.Metode analisis yang digunakan yaitu pengumpulan data, text preprocessing, feature Selection, TF-IDF, dan text mining.Algoritma clustering yang digunakan yaitu algoritma K-Means dimana clustering ini bertujuan untuk mengelompokkan judul skripsi ke dalam cluster berdasarkan kemiripan kata yang terdapat pada judul skripsi tersebut.Hasil dari penelitian ini adalah pengelompokkan judul skripsi mahasiswa yang didapat berdasarkan cluster yang terbentuk. Hasil dari cluster ini dapat menjadi acuan sebagai rekomendasi dalam penyimpanan skripsi yang sudah dibuat dan penentuan judul skripsi yang akan datang.
Unduhan
Referensi
H. Yu, L. Y. Chen, J. T. Yao, and X. N. Wang, “A three-way clustering method based on an improved DBSCAN algorithm,†Phys. A Stat. Mech. its Appl., vol. 535, p. 122289, 2019, doi: 10.1016/j.physa.2019.122289.
M. R. L. Iin Parlina, Agus Perdana Windarto, Anjar Wanto, “Memanfaatkan Algoritma K-Means Dalam Menentukan Pegawai Yang Layak Mengikuti Asessment Center,†Memanfaatkan Algoritm. K-Means Dalam Menentukan Pegawai Yang Layak Mengikuti Asessment Cent. Untuk Clust. Progr. Sdp, vol. 3, no. 1, pp. 87–93, 2018.
R. R. A. Siregar, F. A. Sinaga, and R. Arianto, “Aplikasi Penentuan Dosen Penguji Skripsi Menggunakan Metode TF-IDF dan Vector Space Model,†Comput. J. Comput. Sci. Inf. Syst., vol. 1, no. 2, p. 171, 2017, doi: 10.24912/computatio.v1i2.1014.
N. Alamsyah, “Perbandingan Algoritma Winnowing Dengan Algoritma Rabin Karp Untuk Mendeteksi Plagiarisme Pada Kemiripan Teks Judul Skripsi,†Technol. J. Ilm., vol. 8, no. 3, p. 124, 2017, doi: 10.31602/tji.v8i3.1116.
V. Amrizal, “Penerapan Metode Term Frequency Inverse Document Frequency (Tf-Idf) Dan Cosine Similarity Pada Sistem Temu Kembali Informasi Untuk Mengetahui Syarah Hadits Berbasis Web (Studi Kasus: Hadits Shahih Bukhari-Muslim),†J. Tek. Inform., vol. 11, no. 2, pp. 149–164, 2018, doi: 10.15408/jti.v11i2.8623.
P. H. Saputro, M. Aristin, and Dy. L. Tyas, “Berdasarkan Lirik Menggunakan Metode Tf-,†J. Teknoloi Inform. dan Terap., vol. 4, no. 1, pp. 45–50, 2017.
F. S. Sholihuda, B. Yuwono, and H. C. Rustamadji, “Pemanfaatan Text Mining Pada Sistem Pengolahan Skripsi Menggunakan Algoritma Naïve Bayes Classifier Dan Simple Additive Weighting,†Telematika, vol. 17, no. 2, p. 120, 2020, doi: 10.31315/telematika.v1i1.3379.
R. T. Wahyuni, D. Prastiyanto, and E. Supraptono, “Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi,†J. Tek. Elektro, vol. 9, no. 1, pp. 18–23, 2017, doi: 10.15294/jte.v9i1.10955.
C. S. Journal, “Implementasi Text Mining Pada Twitter Dengan Algoritma K-Means Clustering Sebagai Dasar,†vol. 9, no. 2, pp. 138–147, 2020.
A. Priyanto and M. R. Ma’arif, “Implementasi Web Scrapping dan Text Mining untuk Akuisisi dan Kategorisasi Informasi dari Internet (Studi Kasus: Tutorial Hidroponik),†Indones. J. Inf. Syst., vol. 1, no. 1, pp. 25–33, 2018, doi: 10.24002/ijis.v1i1.1664.
S. Budi, “Text Mining Untuk Analisis Sentimen Review Film Menggunakan Algoritma K-Means,†Techno.Com, vol. 16, no. 1, pp. 1–8, 2017, doi: 10.33633/tc.v16i1.1263.
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
1. Hak cipta dari semua manuskrip jurnal dipegang oleh RABIT: Jurnal Teknologi dan Sistem Informasi Univrab.
2. Ketentuan hukum formal untuk mengakses artikel digital jurnal elektronik tunduk pada ketentuan lisensi Creative Commons Attribution-ShareAlike (CC BY-NC-SA), yang berarti bahwa RABIT: Jurnal Teknologi dan Sistem Informasi Univrab berhak untuk menyimpan, mentransfer media / format, mengelola dalam bentuk basis data, memelihara, dan menerbitkan artikel.
3. Naskah yang diterbitkan baik cetak maupun elektronik adalah akses terbuka untuk tujuan pendidikan, penelitian, dan perpustakaan. Selain itu, dewan editorial tidak bertanggung jawab atas pelanggaran hukum hak cipta.