Sisteme de recomandare Lupule Corneliu Neculciu Filip Velicu

  • Slides: 24
Download presentation
Sisteme de recomandare Lupuleţ Corneliu Neculciu Filip Velişcu Ovidiu Ţambrea Constantin Tăbărana Cristian

Sisteme de recomandare Lupuleţ Corneliu Neculciu Filip Velişcu Ovidiu Ţambrea Constantin Tăbărana Cristian

Sisteme de recomandare Un sistem de recomandare este un instrument care încearcă să prezinte

Sisteme de recomandare Un sistem de recomandare este un instrument care încearcă să prezinte utilizatorilor, obiecte şi noţiuni de interes pentru aceştia (filme, muzică, ştiri, imagini, persoane). Recomandarea se face pe baza cunoaşterii (explicită sau implicită) a profilului utilizatorului (modelul de preferinţe)

Descriere formală a. U mulţimea utilizatorilor b. A mulţimea articolelor cunoscute de sistem (şi

Descriere formală a. U mulţimea utilizatorilor b. A mulţimea articolelor cunoscute de sistem (şi care pot fi recomandate) c. funcţie care măsoară interesul unui utilizator pentru un anumit articol Scopul De a estima cât mai bine această funcţie în punctele în care nu este definită, adică de a prezice ce anume este posibil să-i placă (şi cât de mult) unui utilizator ale cărui “gusturi” apreciem că sistemul le cunoaşte.

Clasificare Construirea profilului utilizatorului se poate face în mod: explicit - sistemul cere informaţii

Clasificare Construirea profilului utilizatorului se poate face în mod: explicit - sistemul cere informaţii de la utilizatori (ex: note acordate filmelor) a. implicit - prin analiza articolelor sau paginilor web vizitate a. În funcţie de tehnica de estimare folosită, există a. recomandări bazate pe conţinut b. recomandări colaborative Filtrare colaborativă: a. utilizator o articol o atribut

Probleme La sistemele bazate pe filtrare colaborativă centrată pe utilizatori există două probleme bine-cunoscute:

Probleme La sistemele bazate pe filtrare colaborativă centrată pe utilizatori există două probleme bine-cunoscute: a. First-Rater Problem - Problema articolelor nou introduse în baza de date; a. Cold-Start Problem - Problema utilizatorilor nou veniţi în sistem

Item-based filtering a. Filtrare user-based - probleme de scalabilitate • Item-based - avantaj -

Item-based filtering a. Filtrare user-based - probleme de scalabilitate • Item-based - avantaj - procesul de determinare a similarităţii între articole poate fi independent de cel de prezicere (recomandare) şi poate fi realizat offline. • Poate fi îmbunătăţit cu informaţii semantice provenite din alte surse (ex: ontologii specifice domeniului) • Se poate folosi tehnica "Latent Semantic Indexing" (LSI) pentru reducerea dimensiunii matricii iniţiale (item, item) la un grup restrâns de atribute strâns corelate.

Exemple de Sisteme - Google News - Amazon - Yahoo Movies! - i. Tunes

Exemple de Sisteme - Google News - Amazon - Yahoo Movies! - i. Tunes - Youtube - Stumble. Upon - Photoree - Book. Lamp

Crearea unui profil Probleme: a. sistemul are nevoie de multe informații pentru a funcționa

Crearea unui profil Probleme: a. sistemul are nevoie de multe informații pentru a funcționa cu o precizie acceptabilă a. utilizatorul nu are: o timpul o dorința o cunoștințele o să dea explicit toate informațiile de care sistemul are nevoie

Solutia Google: Web History este o facilitate introdusă de Google pentru a reţine ce

Solutia Google: Web History este o facilitate introdusă de Google pentru a reţine ce pagini a vizitat utilizatorul.

Avantaje/Dezavantaje Avantaje: a. adună date foarte repede b. odată format, sistemul este foarte stabil

Avantaje/Dezavantaje Avantaje: a. adună date foarte repede b. odată format, sistemul este foarte stabil - anomaliile de comportament cauzate de curiozitate, greșeli, etc. au efect neglijabil Dezavantaje: a. cold-start - sunt prezentate subiectele cele mai populare, nu neapărat cele mai interesante pentru utilizatorul curent • funcționează doar dacă utilizatorul e logat pe contul de google și a activat Web History • poate fi lent in detectarea schimbărilor de preferințe

Stumble. Upon a. comunitate Web b. facilitează descoperirea de site-uri c. sistem de recomandare

Stumble. Upon a. comunitate Web b. facilitează descoperirea de site-uri c. sistem de recomandare bazat pe utilizator d. peers (utilizatori cu "gusturi" similare) e. friends (aleşi de utilizator) f. filtrare colaborativă (eng. "colaborative filtering") g. automatizează "word of mouth"

Principiile sistemului

Principiile sistemului

Filtrare colaborativă bazată pe utilizator

Filtrare colaborativă bazată pe utilizator

Avantaje / dezavantaje Avantaje: a. viteza b. practic pentru număr uriaş de site-uri comparativ

Avantaje / dezavantaje Avantaje: a. viteza b. practic pentru număr uriaş de site-uri comparativ cu analiza de conţinut Dezavantaje: a. "First-Rater" problem • "Cold-Start" problem • rating-uri subiective

Exemplu de utilizare

Exemplu de utilizare

Yahoo Movies! Industria filmelor este foarte vastă. Din acest motiv, a fost necesar un

Yahoo Movies! Industria filmelor este foarte vastă. Din acest motiv, a fost necesar un algoritm de recomandare diferit, optimizat şi pentru filme vizionate de către puţini utilizatori. Sistemul folosit de Yahoo Movies! se bazează pe motorul de recomandare făcut de Choice Stream: Modelarea bayesiană a preferinţelor pe baza atributelor (eng. Attributed Bayesian Choice Modelling).

Attributed Bayesian Choice Modelling

Attributed Bayesian Choice Modelling

Avantaje/dezavantaje a. Avantaje: b. a. "First-Rater" Problem dispare b. "Cold-Start" Problem este atenuată c.

Avantaje/dezavantaje a. Avantaje: b. a. "First-Rater" Problem dispare b. "Cold-Start" Problem este atenuată c. Eficienta recomandărilor c. d. Dezavantaje: e. a. Alegerea valorilor atributelor este subiectivă

Exemple de utilizare - Yahoo Movies!

Exemple de utilizare - Yahoo Movies!

Genius a. Genius este un feature introdus în aplicaţia i. Tunes începând cu versiunea

Genius a. Genius este un feature introdus în aplicaţia i. Tunes începând cu versiunea 8 b. generează automat o listă de melodii similare cu melodia curentă c. pentru utilizare este nevoie de cont i. Tunes d. Genius va colecta periodic informaţiile legate de utilizator şi bibliotecile personale de melodii şi le va trimite în mod anonim la baza de date Apple e. Genius analizează metadatele melodiilor(ritmul, ratingurile, poziţia în playlisturi) f. se presupune ca Genius creează amprenta acustică a melodiilor g. strategie comercială

Mod de Utilizare

Mod de Utilizare

Avantaje/Dezavantaje Avantaje: a. Genius este un feature util userilor care vor să asculte melodii

Avantaje/Dezavantaje Avantaje: a. Genius este un feature util userilor care vor să asculte melodii "înrudite" sau chiar să le cumpere Dezavantaje: a. trimiterea datelor în anonimat reduce Genius doar la un sistem bazat pe itemi • înclinatie spre comercial şi nu spre utilizator

Bibliografie Semantically Enhanced Collaborative Filtering on the Web: http: //maya. cs. depaul. edu/~mobasher/papers/ewmf 04

Bibliografie Semantically Enhanced Collaborative Filtering on the Web: http: //maya. cs. depaul. edu/~mobasher/papers/ewmf 04 -web/ewmf 04. html Item based collaborative filtering recommendation algorithms: http: //www. cs. tau. ac. il/~fiat/dmsem 03/Item. Based. Collaborative. Filtering. Recommendation. Algorithms. ppt Stumble. Upon's recommendation technology: http: //www. stumbleupon. com/technology/ Google News http: //www. searchenginejournal. com/google-news-adds-most-popular-recommended-sections/2809/ Collaborative Filtering vs Attributed Bayesian Choice Modelling http: //behavioraltargeting. info/downloadattachment. php? a. Id=cf 74 d 490 a 8 b 97 edd 535 b 4 ccdbfd 0 df 55&article. Id=31

 Vă Mulţumim! Întrebări ?

Vă Mulţumim! Întrebări ?