Knajblii sused algoritam drutvenim mreama Kandidat Danijela Stepanovi
K-najbliži sused algoritam društvenim mrežama Kandidat: Danijela Stepanović Mentor: Profesor dr Veljko Milutinović u
Uvod ● k. NN algoritam ○ ○ Instance-based learning Klasifikacija i regresija Supervised learning Velika količina podataka ● Društvene mreže ○ Povezivanje ljudi ○ Način komunikacije u 21. veku 1/17
Problem Preporuka tagova u Folksonomiji! ● Tag Ø Način da se opišu resursi. ● Folksonomy (Collaborative Tagging System) Ø Omogućava Internet korisniku da deli, obeležava i pretražuje online resurse kroz personalizovane labele. 2/17
3/17
Prednosti ● Smanjuje posao korisnika. ● Ohrabruje korisnika da češće koristi tagove, stavlja više tagova, ponovo koristi tagove i koristi tagove kojih se ne bi sam setio. ● Sprečava pravopisne greške. ● Sprečava korišćenje tagova sa istim značenjem i tagova koji imaju više značenja. ● Jednostavna implementacija. 4/17
Pregled postojećih rešenja ● You. Tube – zasnovan na resursima o audiovizuelni sadržaj ● Instagram - zasnovan na tagovima o najčešće korišćeni tagovi od strane korisnika ● Twitter – zasnovan na tagovima o najčešće korišćeni tagovi drugih korisnika ● Flickr – zasnovan na kolektivnom znanju o tagovi kao opis resursa 5/17
Predloženo rešenje ● Trodimenzionalnu strukturu podataka je potrebno zameniti dvodimenzionalnim projekcijama. ● Redukovati skup podataka pomoću P-core processing metode. 6/17
Predloženo rešenje ● Naći skup najsličnijih korisnika korisniku za kojeg tražimo preporuke tagova. ● Za svaki tag, koji je sličan korisnik upotrebio za označavanje resursa, izračunati težinu. ● Sortirati težine tagova i izdvojiti prvih k tagova koji predstavljaju preporučene tagove. 7/17
Formalna analiza • 8/17
Formalna analiza o Relaciju između resursa i tag-a računamo kao broj korisnika koji su postavili određeni tag na resurs. Ø Redukujemo dimenzionalnost i žrtvujemo podatke. Ø Rezultat je dvodimenzionalna matrica koja može da se primeni u k. NN algoritmu. 9/17
Formalna analiza P-core processing ● Garantuje da se svaki korisnik, resurs i tag pojavio u najmanje p postova. ● Značajno se smanjuje skup podataka jer se uklanjaju neproduktivni korisnici i nepopulani tagovi i resursi. 10/17
Formalna analiza User model • 11/17
Formalna analiza K-najbliži sused algoritam pseudokod • 12/17
13/17
Moguće modifikacije Boosting tags • 14/17
15/17
Zaključak ü Tag zavisi od korisničkog profila i resursa. ü Veća preciznost. ü Smanjuje broj potrebnih računanja i memorije tako što uklanja redudantne podatke. ü Velika primena kada je resurs slika, video ili muzika. ü Sve veća primena u društvenim mrežama. 16/17
Q/A Hvala na pažnji!
- Slides: 18