Analisis Sentimen Untuk Aktifitas Cyberbullying Pada Remaja di Social Media Selama Pandemi COVID-19

Daftar Isi

Merlindawibowo.com – Cyberbullying. Ketetapan resmi Coronavirus Disease 2019 (COVID-19) sebagai pandemi yaitu pada tanggal 11 Maret 2020 oleh World Health Organization (WHO). Hal ini sangat memberikan pengaruh besar terhadap pola hidup banyak orang, dimana salah satu bukti nyatanya yaitu kegiatan pembelajaran di sekolah atau kampus, bekerja, kegiatan di fasilitas pelayanan umum, kegiatan di rumah-rumah ibadah, dan kegiatan sosial budaya lainnya dialihkan dari forum offline menjadi forum online sejak diberlakukannya lockdown hingga PSBB (Pembatasan Sosial Berskala Besar). Forum online merupakan wadah yang nyaman bagi banyak orang terutama untuk berbagi profil, kehidupan sehari-hari dan berinteraksi dengan teman atau kerabat tanpa perlu mematuhi aturan social distancing di dunia maya. Namun, hal tersebut mengakibatkan aktivitas di sosial media meningkat drastis salah satunya penggunaan Instagram. 

Instagram merupakan salah satu platform media sosial yang banyak sekali digemari oleh netizen milenial, bahkan menurut Hootsuite, Data Tren Internet dan Media Sosial Tahun 2020 secara mengglobal, terkhusus di Indonesia jumlah pengguna Instagram pada awal januari adalah sebanyak 63 juta jiwa. Laporan lainnya adalah dari platform pemasaran Klear menunjukkan bahwa postingan pengguna di Instagram Story per harinya meningkat 15% dalam sepekan dan jumlah pengguna yang melihat Story pengguna lainnya pun meningkat 21% (Burhan, 2020). Instagram banyak digunakan  karena dianggap memiliki banyak fitur yang lebih menarik dibandingkan dengan sosial media lainnya. Fitur-fitur tersebut adalah filter selfie, Instagram Story, IGTV, berbagi foto dan video, komentar, like, explore, emoji slider, GIF, dan polling (Sendari, 2019). 

Mengingat semua orang hanya berada di rumah maka secara tidak langsung membuat orang-orang terpaksa untuk selalu melakukan kegiatan yang sama dan timbul kebosanan. Akibat kebosanan timbullah keisengam untuk mendapatkan kesenangan sendiri atau kelompok dengan melakukan cyberbullying di sosial media.

Pengertian Cyberbullying

Menurut Willard (2005) cyberbullying merupakan kegiatan mengirim atau mengunggah materi yang berbahaya atau melakukan agresi sosial dengan menggunakan internet dan teknologi lainnya. Ada 8 bentuk perilaku yang dapat menjadi indikator cyberbullying antara lain : 1) Flamming, 2) Harassment, 3) Denigration, 4) Impersonation, 5) Outing, 6) Trickery, 7)Exclution, 8) Cyberstalking.

Perhatian khusus dalam penelitian ini adalah generasi milenial pengguna sosial media Instagram dengan rentang usia 15-19 tahun karena menurut Sekjen Asosiasi Penyelenggara Jasa Internet Indonesia (APJII) Henri Kasyfi Soemartono, pengguna internet pada tahun 2018 didominasi oleh segmen usia 15-19 tahun yang mencapai 91%. Ada beberapa hal yang dapat mengarakteristikkan generasi milenial, seperti dikutip Noveliati Sabani dalam jurnal yang berjudul Generasi Milenial dan Absurditas Debat Kusir Virtual mengatakan bahwa generasi milenial adalah generasi yang hampir selalu menyediakan waktu untuk menggunakan media sosial. Sayangnya, kemampuan generasi milenial untuk menyaring informasi yang mereka dapatkan dari media sosial sangat rendah. Mereka seringkali langsung mempercayai setiap konten yang tersebar.

Baca Juga :   Analisis Sentimen dengan Algoritma Linear Model

Sehingga, diperlukan teknologi untuk mengkaji adanya tingkat cyberbullying ini. Hal ini digunakan untuk memberikan rekomendasi nantinya dalam proses pencegahan tindakan cyberbulling ini. Oleh karena itu, tingkat cyberbulying dapat menurun.

Baca juga : Smart Drone Untuk Memberikan Peringatan Pelanggaran Physical Distancing dan Penggunaan Masker Saat Pandemi COVID-19 Dengan Teknologi Artificial Intelligent

Baca juga : Wonderful Indonesia

Analisis Sentimen

Analisis Sentimen ini dapat dilakukan dengan menggunakan algoritma machine learning. Analisis sentimen akan digunakan untuk mengelompokkan jenis tulisan pada suatu kalimat untuk mengetahui opini yang diekspresikan tersebut termasuk opini positif atau negatif. Dalam hal ini, konten yang dibuat tidak memiliki struktur formal. Sehingga proses analisis sentimen dengan menggunakan data dari situs yang dirujuk akan menjadi lebih sulit. Diperlukan proses pre-processing data untuk pembersihan data agar lebih mudah dipahami. Analisis sentimen merupakan proses dalam melakukan analisis pendapat, penilaian, sentimen, sikap dan emosi manusia terhadap suatu produk, jasa, topik dan atribut lainnya.  Banyaknya penelitian tentang analisis sentimen dikarenakan memberi manfaat yang cukup besar. Selain itu, Analisis Sentimen adalah proses mencerna atau memahami suatu data, serta mengekstrak data yang berbentuk teks guna memperoleh informasi yang berupa sikap ataupun pendapat seseorang terhadap suatu topik. Hasil dari analisis yaitu berupa kategori positif dan negatif.  Hal tersebut dilakukan untuk  menganalisis opini atau pendapat seseorang, mengekstrak informasi terhadap suatu entitas seperti layanan, produk, serta topik tertentu.

Tahapan Analisis Sentimen

1. Preprocessing

Data yang digunakan penelitian ini yaitu opini masyarakat yang diambil dari review pada situs Female Daily dan Sociollamengenai produk Lacoco yang memiliki gaya penulisan yang tidak terstruktur. Maka dari itu perlu dilakukan proses preprocessing supaya data dapat diolah menjadi lebih terstruktur pada saat diklasifikasi. Pada penelitian ini preprocessing terdiri dari 5 tahapan, yaitu Case folding, Tokenizing, Normalization, Stopword Removal, dan Stemming.

Case Folding   

Case Folding merupakan proses yang dapat dilakukan dengan mengubah huruf besar menjadi huruf kecil. Tujuan digunakan case folding selain merubah huruf besar menjadi huruf kecil juga menghilangkan tanda baca atau delimiter seperti titik(.), koma(,) emoticon dan karakter lainnya dihilangkan.

Tokenizing

            Tokenizing merupakan proses memecah kalimat menjadi beberapa bagian. Tokenizing dapat memudahkan dalam proses perhitungan kata atau menghitung frekuensi munculnya kata dalam corpus.

Normalization

            Pada tahap ini proses Normalization dilakukan untuk melakukan perbaikan kata-kata yang disingkat atau salah eja dengan bentuk tertentu tetapi memiliki arti yang sama. Hal ini dilakukan agar mendapatkan kualitas dokumen yang baik.

Stopword Removal 

            Stopword Removal merupakan proses yang digunakan untuk menghilangkan kata-kata yang tidak berpengaruh seperti kata penghubung, kata ganti orang dan lain-lain dalam suatu dokumen.

Stemming 

            Stemming merupakan proses mengambil kata dasar dengan menghilangkan imbuhan pada suatu kata. Sehingga sesuai dengan aturan Bahasa Indonesa yang baik dan benar.

2. Labeling

Pada tahap ini dilakukan labeling data yaitu proses melabeli data ke dalam 2 kelas positif dan negatif. Setelah proses pelabelan dilakukan proses penghapusan data netral karena data tersebut dikhawatirkan akan mempengaruhi tigkat akurasi yang dihasilkan oleh model yang digunakan.  Dalam penelitian ini dilakukan secara otomatis menggunakan pendekatan lexicon. Pendekatan dengan Lexicon-based bekerja dengan menggunakan kamus lexicon yang dilengkapi dengan bobot pada setiap katanya sebagai sumber leksikal. Dalam kategori positif kalimat yang ditulis berupa ungkapan kepuasan, terimakasih, pujian dan lain-lain. Sedangkan untuk kategori negatif kalimat yang ditulis berupa ungkapan kecewa, ketidakpuasaan dan lain-lain. 

Kamus Inset ini digunakan karena sudah cukup teruji dengan baik untuk analisis sentimen data berbahasa Indonesia. Tujuan dari labeling yaitu supaya sistem dapat memahami makna dari kalimat yang akan diuji. Lexicon Inset terdiri dari 2 kamus yaitu, Lexicon positif yang berisi 3.609 kata positif dan Lexicon negatif yang berisi 6.609 kata negatif. Masing-masing kata memiliki bobot nilai atau polarity score dengan kisaran bobot tantara -5 sampai +5.

Baca Juga :   Data Definition Language (DDL) Pada MySQL

3. Pembobotan Term TF-IDF

Pada tahap ini dilakukan pemecahan kalimat menjadi beberapa kata serta memberikan bobot pada setiap kata dengan menggunakan metode TF-IDF (Term Frequency Inverse Document Frequency). Dimana tahap ini merupakan Statistic Numeric yang digunakan untuk mengungkapkan tingkat kepentingan sebuah kata dalam setiap dokumen.

4. Pembobotan Vektor Word2Vec

Pada contoh ini digunakan kalimat “ sesenang itu sama sleeping masknya” Kalimat tersebut direpresentasikan terlebih dahulu dalam bentuk one-hot encoding. Kata diubah menjadi bentuk kumpulan angka dalam matriks. 

5. Modelling

Support vector machine dan Naïve Bayes dapat digunakan untuk melakukan klasifikasi suatu dataset sebagai salah satu proses analisis sentimen. Proses ini menggunakan Bahasa pemrograman Python dengan pembagian data menjadi dua kategori yaitu, training dan testing. Proses pada pembagian data, digunakan beberapa rasio perbandingan training dan testing yaitu 8:2, 7:3, 9:1. Hal tersebut dilakukan untuk menentukan rasio yang tepat dalam mendapatkan akurasi terbaik dari model yang digunakan.

6. Evaluasi Model

Evaluasi model dilakukan untuk mengetahui kinerja model. Proses evaluasi model dilakukan dengan melihat tingkat akurasi metode melalui Confusion Matrix dan tabel akurasi serta presisi untuk tiap model. Setelah data test diujikan terhadap data training[AP1] , akan menghasilkan klasifikasi nilai akurasi yang didapatkan dan dapat ditarik kesimpulan dari penelitian yang telah dilakukan.