Wizualizacja Wikipedii Julian Szymaski Wydzia Elektroniki Telekomunikacji i

  • Slides: 16
Download presentation
Wizualizacja Wikipedii Julian Szymański Wydział Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej Włodzisław Duch Katedra

Wizualizacja Wikipedii Julian Szymański Wydział Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika Nanyang Technological University, Singapore Google: Duch W Wizualizacja Wiedzy, Warszawa 11/12/2010

Strona naukowa Jak mózgi, używając masowo równoległych procesów, reprezentują wiedzę i umożliwiają wnioskowanie? L.

Strona naukowa Jak mózgi, używając masowo równoległych procesów, reprezentują wiedzę i umożliwiają wnioskowanie? L. Boltzmann (1899): “Wszystkie idee i pojęcia to tylko wewnętrzne obrazy wyrażające się w mowie przez kombinację dźwięków. ” „Zadaniem teorii jest skonstruować obraz zewnętrznego świata, który istnieje tylko w naszej głowie…”. • L. Wittgenstein (Tractatus 1922): myśli to obrazy tego, w jaki sposób rzeczy istnieją w świecie, propozycje wskazują na te obrazy. • Kenneth Craik (1943): umysł konstruuje „w małej skali" modele rzeczywistości by antycypować zdarzenia, rozumować i wyjaśniać. • P. Johnson-Laird (1983): modele mentalne to psychologiczne reprezentacje rzeczywistych , hipotetycznych lub wyobrażonych sytuacji. • J. Piaget: dzieci tworzą sobie schematy rozumowania zgodne z logiką FOL. Duch W (2002) Geometryczny model umysłu. Kognitywistyka i Media w Edukacji Duch W (2010) Reprezentacje umysłowe jako aproksymacje stanów mózgu •

Strona praktyczna • Szukanie oparte na słowach kluczowych jest ograniczone ze względu na •

Strona praktyczna • Szukanie oparte na słowach kluczowych jest ograniczone ze względu na • • wieloznaczność i niejednoznaczność (synsety) pojęć. Ludzie mają oczekiwania i skojarzenia, ale jeśli nie znają specyficznego słownictwa trudno znaleźć informację w nowych obszarach wiedzy. Eksploracja artykułów encyklopedii: zbyt wiele linków w ogólnych artykułach, brak spojrzenia na całą domenę przefiltrowanego przez zainteresowania użytkownika: co ciekawego ma „neuroscience” do powiedzenia na temat „attention” i „neural synchronization”? Statyczne linki nie wystarczą: procesy prymowania (priming) w mózgu tworzą sieci funkcjonalne aktywizując wybrane połączenia grup neuronów, zwracamy uwagę i interpretujemy tylko to co pasuje do oczekiwań w określonym kontekście. Semantyczne prymowanie: przygotowuje drogę dla aktywacji sieci neuronów pobudzając rozległe obszary mózgu, przygotowując je do przyjęcia informacji, ujednoznaczniając sens pojęć, prowadząc do jednoznacznej interpretacji informacji (mowy i tekstów).

Czy słowa opisują pojęcia? 329 ras psów w 10 kategoriach: Sheepdogs & Cattle Dogs;

Czy słowa opisują pojęcia? 329 ras psów w 10 kategoriach: Sheepdogs & Cattle Dogs; Pinscher & Schnauzer; Spitz & Primitive; Scenthounds; Pointing Dogs; Retrievers, Flushing Dogs & Water Dogs; Companion & Toy Dogs; Sighthounds Własności z licznych ontologii, częściowo ręcznie poprawiane, służyły do zgadywania za pomocą gry w 20 pytań jaka to rasa => marna dokładność! Kategorie oparte na podobieństwie wizualnym są całkiem odmienne niż kategorie stosowane przez związki kynologiczne oparte na zachowaniu psów lub kategorie biologiczne. • Słowa wskazują to, co już wiemy => ale nie wszystkim stanom mózgu odpowiadają symbole. Komunikacja ogranicza się do tego, co już przynajmniej częściowo wiemy Widzisz to co wiesz i wiesz to co widzisz.

Imitacja zaprowadzi nas daleko …

Imitacja zaprowadzi nas daleko …

Mapy mózgu: spróbuj przedstawić organizację informacji podobnie jak w mózgu eksperta. • Wiele książek

Mapy mózgu: spróbuj przedstawić organizację informacji podobnie jak w mózgu eksperta. • Wiele książek (T. Buzan i inni). • Wiele programów do rysowania. • The. Brain (www. thebrain. com) interfejs oparty na hierarchicznych mapach linków internetowych. • Liczne programy do graficznej reprezentacji infromacji. • Nasza implementacja (Szymanski): Wordnet, Wikipedia i inne: grafy powiązań linków i semantycznych podobieństw dokumentów.

Atlas semantyczny http: //dico. isc. cnrs. fr/en/index. html spirit: 79 słów 69 klik, czyli

Atlas semantyczny http: //dico. isc. cnrs. fr/en/index. html spirit: 79 słów 69 klik, czyli minimalnych jednostek znaczenia. Synset = zbiór synonimów

Sieć semantyczna Automatycznie tworzenie sieci semantycznych na podstawie analizy tekstów, w których znajdujemy własności

Sieć semantyczna Automatycznie tworzenie sieci semantycznych na podstawie analizy tekstów, w których znajdujemy własności pojęć, sprawdzamy za pomocą gry w 20 pytań czy to wystarczy. Sieci semantyczne pokazują wiedzę ogólną, ale my widzieć tylko podsieci interesujące z punktu widzenia aktualnie wyszukiwanej informacji. Wikipedia: zamiast sieci pojęć mamy sieć artykułów.

Nasze podejście Analiza struktury Wikipedii Wybór programu do wizualizacji Przygotowanie danych do wizualizacji Wygenerowanie

Nasze podejście Analiza struktury Wikipedii Wybór programu do wizualizacji Przygotowanie danych do wizualizacji Wygenerowanie wizualizacji http: //gossamer. eti. pg. gda. pl/index. html

Wizualizacja Wiki Problem: szukanie zbioru artykułów na specyficzne tematy. Artykuły ogólne, np. o neuroscience,

Wizualizacja Wiki Problem: szukanie zbioru artykułów na specyficzne tematy. Artykuły ogólne, np. o neuroscience, mają zbyt wiele linków prowadzących do dokumentów nieistotnych dla konkretnego pytania. • Wizualizacja powiązań pomiędzy artykułami w oparciu o istniejące linki. • Wizualizacja podobieństwa semantycznego. • Zmiana konta widzenia przez podawanie słów kluczowych lub dokumentów referencyjnych – filtrowanie wizualizowanej informacji pod określonym kontem. Tylko część zaimplementowana, serwer: http: //gossamer. eti. pg. gda. pl/index. html Wizualizacja Wordnetu, Wikipedii. Simple Ontology Editor, projekt realizuje Bartosz Kuczkowski, używając Gossamera. Jego zadanie: wspierać poprzez interaktywny graficzny interfejs prace zespołowe nad edycją ontologiiuser.

Narzędzia http: //gossamer. eti. pg. gda. pl/index. html Przykłady: 3 filmiki

Narzędzia http: //gossamer. eti. pg. gda. pl/index. html Przykłady: 3 filmiki

Wizualizacja struktury powiązań pomiędzy artykułami z użyciem interaktywnego grafu

Wizualizacja struktury powiązań pomiędzy artykułami z użyciem interaktywnego grafu

Drzewo kategorii Wiki wykorzystywane do wyszukiwania zbliżonych tematycznie artykułów.

Drzewo kategorii Wiki wykorzystywane do wyszukiwania zbliżonych tematycznie artykułów.

Graficzne przedstawienie artykułu Graficzne przedstawienie reprezentacji artykułu wykorzystujące informacje kategorialne.

Graficzne przedstawienie artykułu Graficzne przedstawienie reprezentacji artykułu wykorzystujące informacje kategorialne.

Konkluzje Tylko mózgi potrafią interpretować i tworzyć informację w języku naturalnym, statystyczne i gramatyczne

Konkluzje Tylko mózgi potrafią interpretować i tworzyć informację w języku naturalnym, statystyczne i gramatyczne algorytmy analizy nie wystarczą, potrzebne są inspiracje kognitywne. Sieci neuronowe to dziedzina wykorzystująca modele neuronów lub proste analogie do działania neuronów biologicznych. Neurokognitywne podejście do języka pozwala na tworzenie interesujących algorytmów korzystając z inspiracji na wyższym poziomie organizacji, np. grafów obrazujących funkcjonalne dynamiczne połączenia obszarów kodujących własności semantyczne pojęć, pozwalając na elastyczną organizację i odkrywanie nowej wiedzy. Zastosowania obejmują wizualizację encyklopedii, np. Wikipedii: http: //semanticspaces. eti. pg. gda. pl: 8888/wikiparser Jak wyższe czynności poznawcze powstajaw wyniku aktywności mózgu? Kreatywność = przestrzeń neuronalna (wiedza, torowanie) + fluktuacje aktywności (wyobraźnia)+ filtrowanie rezultatów (skojarzenia i emocje). Informatyka neurokognitywna = abstrakcje tego procesu.

Dziękuję za użyczenie ucha Google: Duch W => P 3=Prezentacje, Prace, Projekty

Dziękuję za użyczenie ucha Google: Duch W => P 3=Prezentacje, Prace, Projekty