Zdieanie vsledkov vskumu v portli zaloenom na webe
Zdieľanie výsledkov výskumu v portáli založenom na webe so sémantikou Ladislav Rado
Cieľ • Navrhnúť softvérový nástroj, ktorý umožní využitie metadát na vytvorenie skupín výskumníkov s podobnými záujmami a zdieľanie ich výsledkov
Identifikácia spoločných záujmov • Sieť vzájomných citácií • Využitie klasifikácie publikácií
Sieť vzájomných citácií • Intelektuálne (odkazujúce) • Sociokognitívne
Sieť vzájomných citácií • Odkazujúce [MT 05] – Ľudia – Výskumá práca – Spoločnosť • Žurnál • Konferencia – Reprezentácia grafmi
Sieť vzájomných citácií • Sociokognitívne [MT 05] – Spolupracovník – Vzdelávací vzťah – Organizátor - účastník – Súkromná známosť • kde sa dajú nájsť? – v poďakovaniach – web stránky autorov, konferencií
Uzol grafu • Autor príspevku [NM 01 b] – Počet spolupracovníkov autora (stupeň uzla) – Počet publikovaných príspevkov – Pravdepodobnosť spolupráce – Vzájomná vzdialenosť v grafe L – Sila relácie “medzi” vzhľadom na iné dvojice • výpočet stredných hodnôt • váhované siete [NM 01 a]
Metriky grafov - statické hľadisko [NM 01 a] – Lievik (Funneling) – rozhodujúce spojenia – Obrovský komponent – 80 až 90% – Priemerný stupeň odlúčenia (počet vzťahov) • priame • cez jeden medzičlánok • cez viacero m.
Metriky grafov - statické hľadisko – Zoskupovanie [NM 01 b] – koeficient zoskupovania – C = – Siete výskumníkov • krátke spojenia s ostatnými • existencia obrovského komponentu – sieť malého sveta [PJ 02] L ≥ L_rand. Graph, C >> C_rand. Graph – použiť lokálne výpočty v grafe?
Ohodnotenie uzlov v grafe • Algoritmy na grafe [KJ 99] • Hľadajú rovnovážny stav - Iteratívne metódy – Garfield 1972 – priemerný počet citácií na príspevok počas posledných 2 rokov – Problém: cyklus v grafe • Lepšie ak je hodnotenie získané od autorít – HITS – Page. Rank (náhodný chodec) – Object. Rank [GS 05] (ontológie, kontext portálu a používateľa) – Node. Rank [PJ 02] (lokálne hodnotenie)
Metriky grafov - dynamické hľadisko • Z pohľadu vývoja v oblasti [HO 04] – Kumulatívne • prerušenie spolupráce, “spiace” spojenia – Časové okno (5 – 8 rokov) • skupinová analýza • profesionálna kariéra ≈40 rokov
Využitie klasifikácie publikácií • Primárna klasifikácia – zaradenie podľa hlavnej témy, kľúčové slová • Dodatočná klasifikácia • ACM Digital Library (portal. acm. org) • Primary Classification: K. Computing Milieux K. 4 COMPUTERS AND SOCIETY K. 4. 3 Organizational Impacts • Additional Classification: K. Computing Milieux K. 6 MANAGEMENT OF COMPUTING AND INFORMATION SYSTEMS K. 6. 1 Project and People Management K. 7 THE COMPUTING PROFESSION K. 7. 1 Occupations
Proces vytvorenia SW nástroja [AM 06] • Získanie údajov – Kvalita, viacero zdrojov • Príprava údajov – obaľovače • Rozlíšenie entít • Reprezentácia metadát a ontológie – RDF(S), OWL, FOAF • Odvodzovanie, dopytovanie • Prezentácia • Vyhodnotenie
Rozlíšenie entít • Horné a dolné ohraničenie [HO 04, NM 01 a, NM 01 b] – Prvé iniciálky – Všetky iniciálky • Príklad: – M. Priezvisko – M. I. Priezvisko – Meno I. Priezvisko. • Pridať toľko ďalších informácií k menu autora, aby ho bolo možné jednoznačne určiť [MY 06] • ďalší problém: – diakritika Ľ vs. L’ vs. L
Model domény • Ontológia – koncepty a inštancie – Odvodzovanie • Dynamickosť ontológie – emergentná sémantika [MP 05] (chýba abstraktný model) – Zjednotiť ontológie a zodpovedajúce údaje – Zobrazenie zhody medzi dvoma ontológiami (do veľkej miery závisí od použitej porovnávacej metódy) • Porovnávanie – Rôzne úrovne (reťazce, koncepty)
Používateľ • Používateľ – asociatívny prvok [MP 05] • Personalizácia • Cold-start problem – explicitné vs. implicitné získavanie hodnotenia [PJ 02] – aktivita používateľa - prieskum, vyhľadávanie • Zoskupenie používateľov – – Profil, hodnotenia Výmena hodnotení (vzájomné ovplyvňovanie) [GS 05] Skryté odkazy (neformálne stretnutia, “hidden web”) Porovnanie profilov – kolaboratívne filtrovanie
Literatúra • [AM 06] Aleman-Meza, B. , Nagarajan, M. , Ramakrishnan, C. , Ding, L. , Kolari, P. , Sheth, A. , Arpinar, I. , Joshi, A. , Finin, T. : Semantic analytics on social networks: experiences in addressing the problem of conflict of interest detection. Proceedings of the 15 th internationalconference on World Wide Web, (2006), pp. 407– 416 – Detekcia konfliktu záujmov (autori publikácií a recenzenti, aby sa nenastala zaujatosť posudzovateľa voči článku, rôzne úrovne podľa váhy) – Integrácia sociálnych sietí z FOAF a DBLP biblografických záznamov – Dve množiny owl: same. As, ambiguous, dôvody nejednoznačnosti priradenia • [BJ 05] Breslin, J. , Harth, A. , Bojars, U. , Decker, S. : Towards Semantically. Interlinked Online Communities. The 2 nd European Semantic Web Conference (ESWC’ 05), Heraklion, Greece, Proceedings, LNCS, (2005), vol. 3532, pp. 500– 514 – Návrh ontológie pre spojenie komunít na webe (forum, weblog, mailing list) – ako zobraziť FOAF, RSS, (X)HTML, … do ontológie reprezentovanej RDF, OWL – Využitie ontológie prehliadanie, dopytovanie, využitie metadát vzťah related_to
Literatúra • [DJ 02 a] Davies, J. , Duke, A. , Stonkus, A. : Onto. Share: Using Ontologies for Knowledge Sharing. Proceedings of the 11 th International WWW Conference WWW 2002 , (2002) – – • Nástroj pre poloautomatické vytváranie RDF Evolúcia ontológie používaním systému Diskusia o skrytých odkazoch -- ‘weak ties’ Využili sub. Class. Of (hierarchie) plánujú is. Related. To [GS 05] Ghita, S. , Nejdl, W. , Paiu, R. : Semantically Rich Recommendations in Social Networksfor Sharing, Exchanging and Ranking Semantic Context. Proceedings of ISWC, Galway, Ireland, November, (2005) – Výmena článkov a metadát (kontext a hodnotenie) cez e-mail – Prepojenie FOAF, a kontextov prehliadača (desktop) a portálu – pre výpočet hodnotenia modifikovanli Page. Rank
Literatúra • [HO 04] Horn, D. , Finholt, T. , Birnholtz, J. , Motwani, D. , Jayaraman, S. : Six degrees of jonathan grudin: a social network analysis of the evolution and impact of CSCW research. Proceedings of the 2004 ACM conference on Computer supported cooperative work, (2004), pp. 582– 591 – Sieťa spoluautorov (coauthorship) – Vlastnosti grafov (rôzne merania), časový rozmer, vývoj komunity – Metóda rozlíšenia mien • [KJ 99] Kleinberg, J. : Hubs, authorities, and communities. ACM Computing Surveys (CSUR), (1999), vol. 31, no. 4 es – Metódy hodnotenia uzlov v grafe – HITS, Pagerank, Katz a Hubbel, Pinski • [MY 06] Matsuo, Y. , Mori, J. , Hamasaki, M. , Takeda, H. : POLYPHONET: An advanced social network extraction system. World Wide Web Conference (WWW), (2006) – Metóda extrakcie sociálnej siete s využitím vyhľadávača pre rozlíšenie entít – podľa počtu vrátených výsledkov sa určuje sémantická podobnosť – Využitie vyhľadávača pre doplnenie metadát
Literatúra • [MP 05] Mika, P. : Ontologies are us: A unified model of social networks and semantics. Proc. ISWC 2005 , (2005) – vychádza z princípu social tagging (prípadová štúdia del. icio. us) – Začlenenie sociálneho kontextu do ontológie pre štúdium (emergent semantics) – Matica prepojení ľudí, konceptov a inštancií, metóda riešenia (tri bipartitné grafy) • [MT 05] Miki, T. , Nomura, S. , Ishida, T. : Semantic Web Link Analysis to Discover Social Relationships in Academic Communities. Proceedings of the 2005 Symposium on Applications and the Internet (SAINT’ 05)-Volume 00 , (2005), pp. 38– 45 – Analýza siete vzájomných citácií oddeľuje sociálne siete, – Nielen spoluautorstvo pre hľadanie sociálnych spojení – Zoskupenie autorov podľa oblastí výskumu • [NM 01 a] Newman, M. : Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality. Physical Review E, (2001), vol. 64, no. 1, p. 16132 – Prepojenie na základe spoluautorstva, Priradenie váhy podľa počtu článkov – Metriky pre grafy – betweenness, funneling, giant component – Algoritmus hľadania najkratšej cesty
Literatúra • [NM 01 b] Newman, M. : The structure of scientific collaboration networks. Proceedings of the National Academy of Sciences, (2001), vol. 98, no. 2, pp. 404– 409 – Rozlíšenie mien podľa – Metriky: počet spolupracovníkov, koeficient zoskupovania, stupeň odlúčenia – Komunity tvoria siete “malého sveta” • [PJ 02] Pujol, J. , Sangüesa, R. , Delgado, J. : Extracting reputation in multi agent systems by means of social network topology. Proceedings of the first international joint conference on Autonomous agents and multiagent systems: part 1 , (2002), pp. 467– 474 – Algoritmus pre hodnotenie autoritatívnosti, nepotrebuje poznať celý graf ale len jeho časť – Návrh priradenia váh odkazom, citáciám podľa mena – Prispôsobenie sa grafom s rôznymi topológiami.
- Slides: 22