Kamis, 10 Mei 2018

Analysis Sentiment




Apa itu Sentiment Analysis ?

Sentiment Analysis adalah penambangan kontekstual teks yang mengidentifikasi dan mengekstrak informasi subjektif dalam sumber, dan membantu para pembisnis untuk memahami sentimen sosial dari merek, produk atau layanan mereka saat memantau percakapan online. Namun, analisis aliran media sosial biasanya terbatas pada analisis sentimen dasar dan menghitung berdasarkan metrik. Ini sama saja dengan menggaruk permukaan dan kehilangan suatu informasi penting yang menunggu untuk ditemukan. Jadi apa yang harus dilakukan mereka untuk menangkap buah yang telah matang tersebut ?

Dengan kemajuan terbaru dalam pembelajaran mendalam, kemampuan algoritma untuk menganalisis teks telah meningkat pesat. Penggunaan kreatif teknik kecerdasan buatan canggih dapat menjadi alat yang efektif untuk melakukan penelitian mendalam. Kami percaya bahwa penting untuk mengklasifikasikan percakapan pelanggan yang masuk tentang merek berdasarkan pada baris berikut:

1. Aspek kunci dari produk dan layanan merek yang diperhatikan pelanggan.
2. Niat dan reaksi yang mendasari pengguna terkait aspek-aspek tersebut.
Konsep dasar ini ketika digunakan dalam kombinasi, menjadi alat yang sangat penting untuk menganalisis jutaan percakapan merek dengan tingkat akurasi manusia.

Apa saja metode pendekatan Sentiment Analysis?

Secara umum, terdapat 2 pendekatan untuk melakukan Sentiment Analysis, yaitu pendekatan menggunakan Machine Learning dan dan pendenkatan menggunakan Knowledge-Based. Pendekatan-pendekatan tersebut memiliki kelebihan dan kekurangannya masing-masing.

1. Machine Learning Approach

Machine Learning memerlukan dataset untuk digunakan sebagai data training. Data training adalah proses pembelajaran yang dilakukan oleh mesin menggunakan data / dataset yang tersedia. Akurasi dari pendekatan klasifikasi machine learning sangat baik, akan tetapi performa klasifikasinya tergantung dataset yang digunakan. Metode-metode yang masuk ke dalam kategori ini adalah sebagai berikut:

  • Naïve Bayes
  • Maximum Entropy
  • SVM
  • Neural Network


2. Knowledge-Based Method Approach

Knowledge-Based adalah pendekatan Sentiment Analysis pada word level, dimana entitas yang diproses adalah kata. Metode-metode yang masuk di dalam pendekatan ini adalah sebagai berikut:


  • Lexicon-Based
  • PMI (Pointwise Mutual Information)


3. Hybrid Approach

Pendekatan ini menggabungkan knowledge-based approach dan machine learning approach. Beberapa penelitian sukses mengaplikasikan keduanya secara bersamaan.


4. Contoh Penggunaan Sentimen Analisis Menngunakan Twitter

Analisis sentimen pada twitter menggunakan bahasa R. Sentiment analysis merupakan salah satu bidang dari ilmu komputer yang mempelajari komputasi linguistik, pengolahan bahasa alami. Tema yang diangkat pada post ini adalah Black Campaign.

Pertama adalah masuk ke apps.twitter.com. Lalu pilih create an application.


Setelah terbuat maka akan terlihat kode untuk tokennya. Kode inilah yang akan digunakan untuk mendaftarkan API twitter pada bahasa R.


Langkah selanjutnya adalah pengkodean pada program R. Terlebih dahulu kita menginstall package untuk mencari kata kunci yaitu twitteR dan RCurl. Package ini kemudian juga diaktifkan.


Token token yang telah didapat dimasukkan kedalam sintaks bahasa R untuk mendaftarkan API twitter.
> consumer_key <- 'diisikan consumer key'
> consumer_secret <- 'diisikan consumer secret'
> access_token <- 'diisikan access token'
> access_secret <- 'diisikan access secret'

Jika tidak terdapat error maka koneksi API twitter dengan bahasa R berhasil. Kemudian kita  melakukan mining tweets dengan memasukkan kata kuncinya. Dalam contoh ini kata kunci yang digunakan adalah "antek pki".


Langkah selanjutnya adalah menginstall package corpus dan tm. Package ini digunakan untuk menampilkan semua tweet hasil mining.


Lalu kita menampilkan hasil tweet yang dilakukan mining. Cara menampilkannya dengan memanggil Corpus yang baru saja diinstall.
> kampanye_corpus <- Corpus(VectorSource(miningtweets_text))
> kampanye_corpus
> inspect(kampanye_corpus)


Kemudian dilakukan filter kata untuk menyaring agar hanya kata kunci yang dibutuhkan saja yang akan digunakan.


Setelah itu dilakukan wordcloud untuk menampilkan kata-kata kunci dalam bentuk gambar susunan seperti awan. Dilakukan install packagenya terlebih dahulu.


Jika sudah maka lakukan wordcloud untuk menampilkan kata kunci yang telah disaring.
> wordcloud(black_clear, random.order=F, col=rainbow(50))