Naive Bayes Based NER Information Extraction NER Naive
Naive Bayes Based NER Information Extraction & NER
Naive Bayes Based NER • D 1 : Santika akan pergi ke Bali bersama Supriadi • D 2 : Hotel Santika berada di Jalan Merapi • D 3 : Supriadi menginap di Hotel Santika sebelum berangkat untuk mendaki Merapi • D 4 : Jalan Merapi macet sampai Jalan Supriadi 2
Naive Bayes Based NER • D 1 : Santika akan pergi ke Bali bersama Supriadi • D 2 : Hotel Santika berada di Jalan Merapi • D 3 : Supriadi menginap di Hotel Santika sebelum berangkat ke Merapi Center • D 4 : Jalan Merapi macet sampai Jalan Supriadi 3
Naive Bayes Based NER • Nama Person : Santika, Supriadi • Nama Organisasi : Santika, Merapi • Nama Lokasi : Merapi, Bali, Supriadi 4
Naive Bayes Based NER • D 5 : Supriadi akan menginap di Hotel Santika 5
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika 6
Multinomial Naive Bayes • • • W adalah kata C adalah kategori P(c I w) : Peluang kategori c dengan syarat muncul kata w P(c) : Peluang munculnya kategori c P(w) : Peluang munculnya kata w 7
Multinomial Naive Bayes • Karena nilai P(w) selalu sama, bisa juga dituliskan menjadi cukup : P(w | c)* P(c) 8
Multinomial Naive Bayes • P(w|c) : Peluang munculnya kata w dengan syarat muncul kategori c • P(c) : Peluang kemunculan kategori c • Count(w, c) : jumlah kata w pada kategori c • Count (c) : jumlah seluruh kata pada kategori c • |V| : jumlah kata-kata yang unik dalam seluruh dokumen 9
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika • • P(P)=1/3, P(O)=1/3, P(L) = 1/3 P(Supriadi | P) = (2)/(3+4) = 2/7 P(Supriadi | O) = (0)/(3+4) = 0/7 P(Supriadi | L) = (1)/(4+4) = 1/8 10
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika • P(P)=1/3, P(O)=1/3, P(L) = 1/3 11
Multinomial Naive Bayes Terbukti bahwa P(Supriadi) tidak perlu dihitung untuk mencari kelas yang memiliki peluang terbesar. Sehingga cukup memakai rumus 12
Multinomial Naive Bayes Karena kelas P memiliki peluang terbesar, maka Supriadi masuk ke Entitas Nama Person (P) 13
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika • P(akan | P) = (0)/(3+4) = 0 • P(akan | O) = (0)/(3+4) = 0 • P(akan | L) = (0)/(4+4) = 0 14
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika • • P(P | akan) = P(akan | P) * P(P) = 0 *1/3 = 0 P(O | akan) = P(akan | O) * P(O) = 0 *1/3 = 0 P(L | akan) = P(akan | L) * P(L) = 0 *1/3 = 0 Maka kata akan tidak masuk ke Entitas manapun, begitu juga dengan kata menginap, di, dan Hotel 15
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika • P(Santika | P) = (1)/(3+4) = 1/7 • P(Santika | O) = (2)/(3+4) = 2/7 • P(Santika | L) = (0)/(4+4) = 0/8 16
Multinomial Naive Bayes • • Nama Person (P) : Santika, Supriadi Nama Organisasi (O) : Santika, Merapi Nama Lokasi (L) : Merapi, Bali, Supriadi D 5 : Supriadi akan menginap di Hotel Santika • • P(P | Santika) = P(Santika | P)*P(P) = 1/7 * 1/3 = 1/21 P(O | Santika) = P(Santika | O)*P(O) = 2/7 * 1/3 = 2/21 P(L | Santika) = P(Santika | L)*P(L) = 0/8 * 1/3 = 0 Maka Santika masuk ke Entitas Nama Organisasi (O) 17
- Slides: 17