Universitatea Politehnica Bucureti Facultatea de Automatica si Calculatoare
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Sisteme de recomandare Neagu Bianca IA 08. 11. 2010 SAC 1
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Sisteme de recomandare • Recomanda articole de care utilizatorul este probabil interesat • Au aparut din cauza cresterii cantitatii de informatie • Analizeaza profilul utilizatorului – Din punctul de vedere al caracteristicilor articolului (abordare orientata pe continut) – Din punctul de vedere al retelei sociale (filtrare colaborativa) • Incearca sa estimeze ratingul pe care utilizatorul l-ar da unui articol nou 30. 11. 2020 SAC 2
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Tipuri de sisteme de recomandare • Bazate pe continut – Analizeaza informatia textuala – Sunt necesare mai multe date despre produs • Filtrate colaborativa (CF) – Se cauta utilizatori cu preferinte similare – Se recomanda produsele noi preferate de acestia – Nu necesita cunostinte despre produs • Filtrate hibrida – Combina cele 2 tehnici (algoritmul content-boosted CF, Personality Diagnosis) 08. 11. 2010 SAC 3
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Obtinerea datelor • Explicit – i se cere utilizatorului sa: – Dea o nota unui produs – Faca o lista cu articole care ii plac/displac – Sa puna in ordinea preferintei o lista de produs • Implicit – Sunt observate articolele pe care utilizatorul le vizualizeaza intr-un magazin online – Mentinerea evidentei produselor cumparate online 30. 11. 2020 SAC 4
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Reprezentarea datelor – CF (1) Airplane Rij Room with a View . . . Hidalgo Joe 9 7 2 . . . 7 Carol 8 ? 9 . . . ? . . . . 9 3 ? . . . 6 Kumar 30. 11. 2020 Matrix SAC 5
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Reprezentarea datelor – CF (2) 30. 11. 2020 SAC 6
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Echivalenta structurala • Indexul Jacard: SE(x, y) = J(N(x), N(y)) = |N(x) ∩ N(y)| / |N(x) U N(y)| • Pentru exemplul anterior: |N(You. Tube) ∩ N(Video)| / |N(You. Tube) U N(Video)| = |{A, B, C, F} ∩ {A, B, C, D, E, F}| / |{A, B, C, F} U {A, B, C, D, E, F}| = |{A, B, C, F}| / |{A, B, C, D, E, F}| =4/6 = 2/3 30. 11. 2020 SAC 7
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare CF : Provocari (1) • Datele rare – Tehnica de reducere: SVD – Metode hibride – Adaugarea de date: media, regresia liniara • Scalabilitatea – Reducere: SVD – Pearson CF: calculeaza doar asemanarea dintre perechile de produse evaluate de aceeasi utlizatori – Clustere 30. 11. 2020 8
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare CF: Provocari (2) • Sinonimia – SVD (solutie partiala pentru polisemie) • matrice mare de asocieri termen-document • Realizeaza o aranjare astfel incat sa evidentieze tiparele importante de asociere intre date si sa e ignore pe cele mai putin importante • Gray Sheep – Metoda hibrida: medie ponderata intre predictia bazata pe filtrare bazata pe continut si cea bazata pe CF 30. 11. 2020 9
Universitatea Politehnica Bucureşti - Facultatea de Automatica si Calculatoare Bibliografie • Collaborative Filtering: A Tutorial, William W. Cohen, Center for Automated Learning and Discovery Carnegie Mellon University • A Survey of Collaborative Filtering Techniques, Xiaoyuan Su and Taghi M. Khoshgoftaar, Department of Computer Science and Engineering, Florida Atlantic University • http: //webwhompers. com/collaborative-filtering. html • http: //en. wikipedia. org/wiki/Recommender_system 30. 11. 2020 SAC 10
- Slides: 10