MENGIDENTIFIKASI HOAX PADA HASIL PENCARIAN BERITA ONLINE DENGAN TEKNIK WEB SCRAPING DAN ALGORITMA C4.5

  • Diki Arisandi Program Studi Teknik Informatika, Fakultas Teknik, Universitas Abdurrab
  • Zul Indra Program Studi Teknik Informatika, Fakultas Teknik, Universitas Abdurrab
  • Kartini Kartini Program Studi Teknik Informatika, Fakultas Teknik, Universitas Abdurrab

Abstrak

Berita online merupakan salah satu produk jurnalistik yang melaporkan fakta atau peristiwa yang diproduksi dan didistribusikan melalui internet. Namun tidak seluruh informasi yang disebarkan melalui media online berupa fakta atau sering disebut hoax. Banyaknya terjadi pemalsuan berita tentunya sangat berdampak pada masyarakat yang mengkonsumsi berita tersebut, sehingga bisa menimbulkan kesalahan persepsi maupun tindakanyang tidak semestinya. Pada penelitian ini peneliti menggunakan teknik web scraping untuk mengekstraksi konten dari hasil pencarian pada search engine, dan dilanjutkan dengan penggunaan algoritma C4.5 untuk proses klasifikasi. Ada tiga parameter yang menjadi acuan yaitu ajakan untuk menyebarkan berita, kredibilitas sumber, dan judul yang memprovokasi. Hasil dari penelitian ini berupa pohon keputusan yang dapat mengklasifikasikan suatu konten  berita tergolong hoax atau bukan. Dari hasil percobaan yang dilakukan pada penelitian ini, hasil akurasi dari klasifikasi hoax dengan teknik web scraping dan algoritma C4.5 mencapai angka keberhasilan sebesar 80%.

Kata Kunci: berita online, hoax, web scraping, algoritma C4.5, pohon keputusan

Referensi

Z. Indra, N. Zamin, and J. Jaafar, “A clustering technique using single pass clustering algorithm for search engine,” in 2014 4th World Congress on Information and Communication Technologies, WICT 2014, 2014, pp. 182–187.

R. Mustika, “Etika Berkomunikasi Di Media Online Dalam Menangkal Hoax,” Diakom J. Media dan Komun., vol. 1, no. 2, pp. 43–50, 2018.

A. N. Desga, “Upaya Media Massa Online dalam Menghadapi Berita Hoax,” J. Kaji. Media, vol. 2, no. 2, pp. 97–101, 2018.

kominfo, “Kominfo Temukan 3.356 Hoaks, Terbanyak saat Pemilu 2019,” kominfo.go.id, 2019. [Online]. Available: https://kominfo.go.id/content/detail/21876/kominfo-temukan-3356-hoaks-terbanyak-saat-pemilu-2019/0/berita_satker. [Accessed: 14-Apr-2021].

A. Yuliani, “Ada 800.000 Situs Penyebar Hoax di Indonesia,” kominfo.go.id, 2017. [Online]. Available: https://kominfo.go.id/content/detail/12008/ada-800000-situs-penyebar-hoax-di-indonesia/0/sorotan_media. [Accessed: 14-Apr-2021].

A. Budiman, “Berita Bohong (Hoax) Di Media Sosial Dan Pembentukan Opini Publik,” Pusat Penelitian Badan Keahlian DPR RI, vol. IX, no. 01, pp. 2009–2012, 2017.

M. Iqbal, “Efektifitas Hukum dan Upaya Menangkal Hoax Sebagai Konsekuensi Negatif Perkembangan Interaksi Manusia,” Literasi Huk., vol. 3, no. 2, pp. 1–9, 2019.

Z. Indra, J. Jaafar, N. Zamin, and Z. A. Bakar, “A language identifier for Indonesian and Malay text document,” in 2015 International Symposium on Mathematical Sciences and Computing Research, iSMSC 2015 - Proceedings, 2016, vol. 2015, pp. 127–131.

J. Jaafar, Z. Indra, and N. Zamin, “A category classification algorithm for Indonesian and Malay news documents,” J. Teknol., vol. 78, no. 8–2, pp. 121–132, 2016.

Z. Indra and L. Trisnawati, “PENGEMBANGAN INTELLIGENT DATA COLLECTOR UNTUK ANALISIS BIG DATA ARTIKEL BERITA ONLINE,” RABIT J. Teknol. dan Sist. Inf. Univrab, vol. 3, no. 1, pp. 47–57, 2018.

S. Munzert, C. Rubba, P. Meißner, and D. Nyhuis, Automated data collection with R: A practical guide to web scraping and text mining. John Wiley & Sons, 2014.

A. V Saurkar and S. A. Gode, “An Overview On Web Scraping Techniques And Tools,” Int. J. Futur. Revolut. Comput. Sci. Commun. Eng., vol. 4, no. 4, pp. 363–367, 2018.

A. Cherfi, K. Nouira, and A. Ferchichi, “Very fast C4. 5 decision tree algorithm,” Appl. Artif. Intell., vol. 32, no. 2, pp. 119–137, 2018.

I. S. Damanik, A. P. Windarto, A. Wanto, Poningsih, S. R. Andani, and W. Saputra, “Decision Tree Optimization in C4.5 Algorithm Using Genetic Algorithm,” J. Phys. Conf. Ser., vol. 1255, no. 1, 2019.

dev0928, “Getting started with web scraping in Python,” 2020. [Online]. Available: https://dev.to/dev0928/getting-started-with-web-scraping-in-python-1joi. [Accessed: 14-Apr-2021].

C. A. Sugianto, “Analisis Komparasi Algoritma Klasifikasi Untuk Menangani Data Tidak Seimbang Pada Data Kebakaran Hutan,” Techno.Com, vol. 14, no. 4, pp. 336–342, 2015.

Sunaryono, “Penelitian Komparasi Algoritma Klasifikasi dalam Menentukan Website Palsu,” Teknikom, vol. 1, no. 1, pp. 1–12, 2017.

N. Frastian, S. Hendrian, and V. H. Valentino, “Komparasi Algoritma Klasifikasi Menentukan Kelulusan Mata Kuliah Pada Universitas,” Fakt. Exacta, vol. 11, no. 1, p. 66, 2018.

Diterbitkan
2021-07-08
Bagian
Articles
PDF
Abstrak views: 687
downloads: 667