Web Science Tmeka zintne Uldis Bojrs uldis bojarsgmail
Web Science (Tīmekļa zinātne) Uldis Bojārs uldis. bojars@gmail. com Datorzinātņu dienas Ratnieki, Latvija – 2012. 08. 06
Uldis Bojārs • LU Matemātikas un informātikas institūts • Latvijas Nacionālā bibliotēka • Doktorantūra: – tēma: Social Semantic Web – 2009: Digital Enterprise Research Institute • http: //www. deri. ie/ http: //twitter. com/Capt. Solo http: //www. slideshare. net/Capt. Solo
“Despite the web's great success as a technology and the significant amount of computing infrastructure on which it is built, it remains, as an entity, surprisingly unstudied. ” James Hendler, Nigel Shadbolt, Wendy Hall, Tim Berners-Lee, Daniel Weitzner Web Science: An Interdisciplinary Approach to Understanding the Web. Communications of the ACM, Vol. 51, No. 7, 2008.
Tim Berners-Lee @ Olimpiskās spēles 2012
World Wide Web • Sākumā: – Protokoli (un aparatūra) – Rīki (pirmais tīmekļa serveris un pārlūks) – Read-only tīmeklis • Mūsdienās: – Sarežģīts, bāgāts un daudzpusīgs fenomens – Dinamiski dati – Sociālais tīmeklis
Web Science
• Web Science – nozīmīgs pētniecības virziens – integrēts, starpdisciplinārs skats uz tīmekļa tēmu mācīšanu un izpēti • Sociālā tīmekļa izpēte – Web Science apakšvirziens – ietver datorzinātnes, sociālās zinātnes, u. c. – bagātīgi datu avoti: Wikipedia, Twitter, Flickr, …
WEB SCIENCE: STUDIJAS
Tīmekļa zinātnes studijas • Web Science Trust iniciatīva: – http: //wiki. websciencetrust. org/w/Curriculum_topics • • • History of the Web Building the Web The Web in Society Operationalising Web Science Analysing the Web – http: //wiki. websciencetrust. org/w/Curriculum • Web Science programmu apskats (2010. g. )
• Southampton University Ph. D program – http: //dtc. webscience. ecs. soton. ac. uk/people-andpartners/list-of-students/student-research-interests/ – skat. tēmu sarakstu • Rensselaer Polytechnic Institute (RPI) – http: //tw. rpi. edu/course/2009/websci/Websci 2009 Main. P age – Twitter, Open Data, … – projekti, komandas darbs
WEB SCIENCE: PĒTNIECĪBA
Starptautiskās konferences • ACM Web Science Conference (2010 - …) – http: //www. websci 12. org/ • International Conference on Weblogs and Social Media (ICWSM, 2008 - …) – http: //www. icwsm. org/2012/index. php • Internet Research Conference – http: //ir 12. aoir. org/schedule • WWW 2012 Conference, Web Science track – http: //www 2012. wwwconference. org/program/acceptedpapers/webscience/
ICWSM 2012 (1) • Narcotweets: Social Media in Wartime – Andrés Monroy-Hernández, Emre Kiciman, Danah Boyd, Scott Counts – “ … describes how people living in armed-conflict environments use social media as a participatory news platform in lieu of damaged state and media apparatuses. We investigate this by analyzing the microblogging practices of Mexican citizens whose everyday life is affected by the Drug War. – We provide a descriptive analysis of the phenomenon, combining content and quantitative Twitter data analyses. We focus on three interrelated phenomena: general participation patterns of ordinary citizens, the emergence and role of information curators, and the tension between governmental regulation and drug cartel intimidation. – This study reveals the complex tensions among citizens, media actors, and the government in light of large-scale organized crime.
ICWSM 2012 (2) • Modeling Spread of Disease from Social Interactions – Adam Sadilek, Henry Kautz, Vincent Silenzio – “… focuses on fine-grained modeling of the spread of infectious diseases throughout a large real-world social network. – We focus on public Twitter data, where we find that for every healthrelated message there are more than 1, 000 unrelated ones. This class imbalance makes classification particularly challenging. Nonetheless, we present a framework that accurately identifies sick individuals from the content of online communication. – Evaluation on a sample of 2. 5 million geo-tagged Twitter messages shows that social ties to infected, symptomatic people, as well as the intensity of recent co-location, sharply increase one's likelihood of contracting the illness in the near future. ”
Pētījumi Latvijā • Piemēri: – Vēlēšanu komunikācija Twitter vidē – Kolektīvās atcerēšanās efekti Twitter vidē – Ziņu portālu komentētāju noskaņojuma analīze • Potenciāls jauniem pētījumiem – Starpdisciplināri pētījumi – Aktivitātes, kur piedalās dažādu nozaru studenti un pētnieki • LU Doktorantūras skola
WEB SCIENCE: LU SEMINĀRS (2011. G. RUDENS)
Web Science seminārs • LU Datorzinātņu bakalaura programma • Specseminārs (izvēles priekšmets) – Uldis Bojārs, Normunds Grūzītis, Renārs Liepiņš – 2011. gada rudens • 17 dalībnieki (pēc semināra nobeiguma aptaujas) http: //www. captsolo. net/webscience_lv/
Praktiskā daļa • Kopīgs projekts • apspriešana klātienē un Facebook grupā • Darbs komandās • Tēmas apskata projekta kontekstā • Vieslekcijas (par aktuālām tēmām) • Ernests Štāls, http: //reach. ly • Twitter datu kopa • Artis Āre
TwitĒdiens - http: //twitediens. tk
Piemērs: TwitĒdiens
Projektu tēmas • Populārākās Rīgas atpūtas vietas Tviterī – http: //websci. tk/grupa 6/ • Datorspēļu popularitāte – http: //websci. tk/grupa 4/ • Zīmolu tops – http: //websci. tk/grupa 2/ • Twattle – Battle of the brands – http: //websci. tk/grupa 1/web/
Lekciju tēmas • Ievads Web Science – Tīmekļa attīstība un tehnoloģijas, sociālais tīmeklis • Sociālā tīmekļa dati – Twitter datu vākšana un analīze • Dabīgās valodas apstrāde – Mašīnmācīšanās, valodas noteikšana, noskaņas noteikšana, … • Datu vizualizācija • Rakstu analīze, diskusijas, projektu prezentācijas Facebook grupa: https: //www. facebook. com/groups/195549767180346/
Kas studentiem bija interesanti • “Twitter API, maši nma ci šana s pamatu apgu šana, nozares celmlaužu pieredzes uzklausi šana“ • “… noderi ga kais un interesanta kais bija Twitter datu va kšana un u. Classify izmantošana. Interesanti ta da zin a , ka li dz šim nekad nebiju saska ries ar nevienu API izmantošanu. . . ” • “Projekta izstra da šana grupa ; prezenta cijas par 'semantic web'; paskati t uz citu grupu projektiem. ”
“. . . priekš specsemina ra noslodze, manupra t, ir pa ra k liela (katru nede l u ma jas darbs + parale li ja veido lielais praktiskais darbs un ve l visam pa virsu rakstiska dokumenta ra dal a). Bet ta tieša m l oti noderi gs semina rs, kura apguvu daudz jauna un interesanta. Katra zin a nenože loju, ka izve le jos tieši Web. Science. ”
“. . . gandri z katra nodarbi ba grupa m bija ja sta par padari to. Tas veseli gi motive ja kuste ties un kautko dari t. Ta pat l oti labi, ka Facebook regula ri tika ievietota informa cija, kas nel a va atsla bt. Ierosina jums - turpina t aicina t cilve kus no malas, jo tas ir baigi forši, kad par sev tuvu te mu aizrauti gi sta ka ds cilve ks. ”
„Interesanta te ma na košajiem semina riem vare tu bu t te ma, kas tika piemine ta ka da no pe de jiem semina riem, par publiski pieejamiem datiem, kas nav pieejami strukture ti un veidi, ka tos me g ina t pa rveidot par strukture tiem. ”
Kopsavilkums • Web Science – tīmeklis = nozīmīgs fenomens – līdz šim nav plaši un vispusīgi pētīts – potenciāls mācībām un pētniecībai • Sociālā tīmekļa izpēte – lieli datu apjomi, pieejami API • LU Web Science specseminārs – interesants un noderīgs gan studentiem, gan pasniedzējiem
- Slides: 27