Decentralizovan modelovanie pouvatea a personalizcia Mrius ajgalk Vedci

  • Slides: 28
Download presentation
Decentralizované modelovanie používateľa a personalizácia Márius Šajgalík Vedúci: Dr. Michal Barla

Decentralizované modelovanie používateľa a personalizácia Márius Šajgalík Vedúci: Dr. Michal Barla

Od servera k človeku • Centrum aktivity je webový prehliadač • Decentralizované modelovanie používateľa

Od servera k človeku • Centrum aktivity je webový prehliadač • Decentralizované modelovanie používateľa – Všetky svoje dáta má používateľ – Model používateľa sa vytvára priamo u neho • Decentralizovaná personalizácia – Personalizácia prebieha na koncovom zariadení používateľa – Pomocou komunikácie sa využívajú skúsenosti ostatných používateľov

Súčasný výskum • Adaptívny proxy server na fakulte – T. Kramár: Odporúčanie navigácie s

Súčasný výskum • Adaptívny proxy server na fakulte – T. Kramár: Odporúčanie navigácie s využitím kontextu sociálnych sietí • Personalizácia vyhľadávania na webe s využitím dlhodobej histórie prehliadania 1 N. Matthijs, F. Radlinski: Personalizing web search using long term browsing history, [Online]. http: //doi. acm. org/10. 1145/1935826. 1935840 1

Model používateľa Hi stó ria po y jm už ív u Zá ate ľ

Model používateľa Hi stó ria po y jm už ív u Zá ate ľ a Používateľ Webové stránky Kľúčové výrazy Tagy

Modelovanie používateľa Načítaj históriu prehliadania Otaguj všetky stránky Vytvor indexovanú databázu

Modelovanie používateľa Načítaj históriu prehliadania Otaguj všetky stránky Vytvor indexovanú databázu

Tagovanie • Lokálne • Všeobecný tagovač – Readability -> Metadata, TF-IDF, Text. Rank •

Tagovanie • Lokálne • Všeobecný tagovač – Readability -> Metadata, TF-IDF, Text. Rank • Frekvenčný slovník z Google n-gramov – 10*945 MB -> 874 KB • Vlastné tagovače

Indexovaná databáza • Efektívne vyhľadávanie v otagovanej histórií • Obmedzenie pamäťovej kapacity úložiska •

Indexovaná databáza • Efektívne vyhľadávanie v otagovanej histórií • Obmedzenie pamäťovej kapacity úložiska • Bleskové spracovanie dopytov – Najrelevantnejšie tagy pre danú URL/doménu/subdoménu – Prvých 10 najrelevantnejších URL pre dané kľúčové slová –. . .

Indexovanie modelu používateľa •

Indexovanie modelu používateľa •

Modifikovaný koreňový strom PE 5 RO 2 RINA SE 5 4 BE W E

Modifikovaný koreňový strom PE 5 RO 2 RINA SE 5 4 BE W E 5 3 PERINA, PERO, PEWE, SEBE, SENO 4 NO 0

Doménový strom záujmov • Globálne záujmy používateľa • Lokálne záujmy používateľa • Tagy pre

Doménový strom záujmov • Globálne záujmy používateľa • Lokálne záujmy používateľa • Tagy pre danú URL adresu • URL adresy pre daný tag

Analýza časovej zložitosti Our indexer Hash table Red-black tree Insertion Deletion Retrieval by term

Analýza časovej zložitosti Our indexer Hash table Red-black tree Insertion Deletion Retrieval by term Retrieval of k topmost items by relevancy

Analýza časovej zložitosti Browser Data structure Insertion Retrieval by Retrieval of 10 Retrieval of

Analýza časovej zložitosti Browser Data structure Insertion Retrieval by Retrieval of 10 Retrieval of 50 term topmost items by relevancy Chrome 17 Our indexer 1. 77 µs 0. 53 µs 200 µs 560 µs Chrome 17 0. 57 µs 0. 04 µs 8650 µs 4. 42 µs 2. 37 µs 9. 33 µs 1. 7 µs 3. 54 µs 1. 4 µs 8. 06 µs 0. 56 µs 750 µs 34610 µs 1090 µs 13840 µs 1540 µs 34610 µs 3410 µs 14480 µs JS object IE 9 Our indexer IE 9 JS object Firefox 11 Our indexer Firefox 11 JS object

Personalizačné rozšírenia • Kusy JS kódu • Ďalšie možnosti: – – – j. Query

Personalizačné rozšírenia • Kusy JS kódu • Ďalšie možnosti: – – – j. Query a externé JS súbory História prehliadača, IDF slova, prekladač Databázové API Personalizačné API Komunikačné API • Vlastný (personalizovaný) tagovač

Komunikácia • Kanálový multicast – Web. Socket

Komunikácia • Kanálový multicast – Web. Socket

Architektúra content. js Kanál X Web page 1 Kanál Y background. html Server content.

Architektúra content. js Kanál X Web page 1 Kanál Y background. html Server content. js Web page 2

Vyhľadávanie na webe Vyhľadaj na webe Extrahuj tagy Zobraz výsledky Obohať výsledky Zisti relevantné

Vyhľadávanie na webe Vyhľadaj na webe Extrahuj tagy Zobraz výsledky Obohať výsledky Zisti relevantné stránky Podobní používatelia Agreguj výsledky Podľa tagov hľadaj URL Pošli odpoveď

Výsledky experimentu Celkový počet vyhľadávaní Počet obohatených vyhľadávaní Priemerný čas odpovede 4531 708 1,

Výsledky experimentu Celkový počet vyhľadávaní Počet obohatených vyhľadávaní Priemerný čas odpovede 4531 708 1, 44 sekúnd

Najvyhľadávanejšie slová

Najvyhľadávanejšie slová

Zhodnotenie • Multi-agentová personalizačná platforma – Jednoducho rozšíriteľná pomocou personalizačných rozšírení – Modelovanie záujmov

Zhodnotenie • Multi-agentová personalizačná platforma – Jednoducho rozšíriteľná pomocou personalizačných rozšírení – Modelovanie záujmov používateľa – globálnych i lokálnych – Lokálny tagovač – Komunikácia medzi agentmi

Budúcnosť • Distribuovaný adaptívny proxy server • Kolaboratívne vylepšenie lokálneho tagovania • Secure multi-party

Budúcnosť • Distribuovaný adaptívny proxy server • Kolaboratívne vylepšenie lokálneho tagovania • Secure multi-party computation („nič vám nepoviem“) • Distribuované výpočty na spôsob Map. Reduce