ALGORITMA LATENT SEMENTIC INDEXING KELOMPOK AGUNG NURIZAL NUGRAHANING

  • Slides: 13
Download presentation
ALGORITMA LATENT SEMENTIC INDEXING

ALGORITMA LATENT SEMENTIC INDEXING

KELOMPOK • AGUNG NURIZAL • NUGRAHANING WIDI 15. 11. 0140 15. 11. 0138 •

KELOMPOK • AGUNG NURIZAL • NUGRAHANING WIDI 15. 11. 0140 15. 11. 0138 • IMAM SEFUDIN 15. 11. 0244 • MUJIBUROHMAN 15. 11. 0085 • YANWAR DWI 15. 11. 0173

PENGERTIAN Latent Semantic Analysis( LSA ) metode yang dipatenkan pada tahun 1988 (US Patent

PENGERTIAN Latent Semantic Analysis( LSA ) metode yang dipatenkan pada tahun 1988 (US Patent 4, 839, 853) oleh Scott Deerwester, Susan Dumais, George Furnas, Richard Harshman, Thomas Landauer, Karen Lochbaum dan Lynn Streeter

 • LSA dapat ditafsirkan sebagai cara yang cepat dan praktis untuk mendapatkan perkiraan

• LSA dapat ditafsirkan sebagai cara yang cepat dan praktis untuk mendapatkan perkiraan substitutability kontekstual penggunaan kata-kata dalam segmen teks yang besar yang belum ditentukan makna kesamaan antara kata dan segmen teks yang mungkin mencerminkan suatu hubungan tertentu • Contoh penggunaan LSA adalah dalam penilaian esai, sumarisasi, dan klasifikasi dokumen secara otomatis

KONSEP • Cara kerja LSA ialah dengan menghasilkan sebuah model yang didapat dengan mencatat

KONSEP • Cara kerja LSA ialah dengan menghasilkan sebuah model yang didapat dengan mencatat kemunculan-kemunculan kata dari tiap dokumen yang direpresentasikan dalam sebuah matriks yang dinamakan term-document matrix, setelah itu dilakukan proses Singular Value Decomposition (SVD) yang akan digunakan untuk mendapatkan Cosine Similarity (nilai kemiripan) antara satu dokumen dengan dokumen yang lain (Landauer, Foltz, & Laham, 1998).

Document Conection Query. Text Operations Text Operation Query Vector Operation Matrix Operation Query Vector

Document Conection Query. Text Operations Text Operation Query Vector Operation Matrix Operation Query Vector Mapping SVD Decomposition Ranking • Dokumen 1 • Dokumen 2 • Dokumen 3 Conection indek

 • Pada Gambar diatas kita dapat melihat alur proses dari metode latent semantic

• Pada Gambar diatas kita dapat melihat alur proses dari metode latent semantic indexing dibagi 2 (dua) kolom, yaitu kolom sebelah kiri yaitu query dan kolom sebelah kanan yaitu koleksi dokumen. Pada proses sebelah kiri, query diproses melalui operasi teks, kemudian vektor query dibentuk. Vektor query yang dibentuk dipetakan menjadi vektor query terpeta (mapped query vector). Dalam membentuk query terpeta, diperlukan hasil dekomposisi nilai singular dari koleksi dokumen. Pada koleksi dokumen dilakukan operasi teks, kemudian matriks kata-dokumen (termsdocuments matrix) dibentuk, selanjutnya dilakukan dekomposisi nilai singular (singular value decomposition) pada matriks kata-dokumen. Hasil dekomposisi disimpan dalam collection index. Proses ranking dilakukan dengan menghitung relevansi antara vektor query terpeta dan collection index. Selanjutnya, hasil perhitungan relevansi ditampilkan ke pengguna (Bunyamin, 2005).

ALGORITMA YANG SERING DIIMPLEMENTASIKAN DENGAN LSI : a) Algoritma Singular Value Decompositiion (SVD) merupakan

ALGORITMA YANG SERING DIIMPLEMENTASIKAN DENGAN LSI : a) Algoritma Singular Value Decompositiion (SVD) merupakan metode matematis untuk menguraikan matriks tunggal, dengan mengkompres menjadi tiga matriks yang lebih kecil dengan ukuran yang sama. Cara kerjanya mengurangi data pada kolom dan baris.

b) Vector Space Model (VSM) adalah cara model algoritma konvensional yang biasa digunakan dalam

b) Vector Space Model (VSM) adalah cara model algoritma konvensional yang biasa digunakan dalam proses temu kembali informasi. Prosesnya dengan menghitung kemiripan dua buah vektor, yaitu antara vektor dari corpus dan vektor dari query (Kontostathis 2007). Untuk melakukan perhitungan terhadap kemiripan antar vektor digunakan rumus Cosine Similarity pada persamaan (5) (Parsons 2009): Cos. Sim (di, q) =. q|||| (5) dimana di adalah dokumen vector ke i yang diambil dari nilai matriks V, q adalah kata kunci/query vector hasil perhitungan LSI.

c) K-Nearest Neighbor (KNN) Adalah algoritma pendekatan untuk mencari kasus dengan menghitung kedekatan antara

c) K-Nearest Neighbor (KNN) Adalah algoritma pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama, yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada. [10] Menurut Olivas [11], k-Nearest Neighbor Imputation termasuk dalam Machine Learning

d) Algoritma CDS (Campbell, Dudek, Smith) Algoritma CDS merupakan salah satu algoritma umum yang

d) Algoritma CDS (Campbell, Dudek, Smith) Algoritma CDS merupakan salah satu algoritma umum yang digunakan untuk menjadwalkan urutan job pada permasalahan flowshop dengan lebih dari 2 mesin guna mendapatkan sebuah waktu penyelesaian atau makespan yang mendekati minimum. Algoritma ini merupakan pengembangan dari algoritma Johnson.

IMPLEMENTASI • Sistem temu kembali informasi dalam dokumen menggunakan metode LSI dikembangkan berbasis desktop

IMPLEMENTASI • Sistem temu kembali informasi dalam dokumen menggunakan metode LSI dikembangkan berbasis desktop menggunakan bahasa java. Proses yang berjalan di dalam sistem ini dibagi menjadi proses pengindexan dan proses pencarian. Proses pengindeksan merupakan proses untuk membuat indeks dan representasi dokumen di dalam komputer menjadi bentuk vektor dokumen. Indeks merupakan kumpulan kata-kata atau konsep yang telah dipilih dan digunakan sebagai petunjuk menuju informasi atau dokumen terkait. • Contoh penerapan LSA dalam jurnal Ria Hari Gusmita dan Ruli Manurung yang berjudul “Penerapan Latent Sementic Analysis(LSA Untuk Menentukan Kesamaan Makna antara Kata dalam Bahasa Inggris dan kata dalam Bahasa Indonesia)”.

TERIMA KASIH

TERIMA KASIH