W 3 Skadnia Semantyka Inynieria Jzyka Nina Suszczaska

  • Slides: 52
Download presentation
W 3: Składnia, Semantyka Inżynieria Języka Nina Suszczańska, Politechnika Śląska, 2006

W 3: Składnia, Semantyka Inżynieria Języka Nina Suszczańska, Politechnika Śląska, 2006

INŻYNIERIA JĘZYKA 20. 05. 2006 Plan l. W 1: Lingwistyka l. W 2: Gramatyki

INŻYNIERIA JĘZYKA 20. 05. 2006 Plan l. W 1: Lingwistyka l. W 2: Gramatyki l. W 3: Składnia, Semantyka l. W 4: Statystyka, Zastosowania 2 z 52

INŻYNIERIA JĘZYKA Ciąg przekształceń NLP Rozpoznawanie (mowy, gestów itp. ) Tekst w języku naturalnym

INŻYNIERIA JĘZYKA Ciąg przekształceń NLP Rozpoznawanie (mowy, gestów itp. ) Tekst w języku naturalnym 20. 05. 2006 Synteza (mowy, gestów itp. ) Analiza (poziom pragmatyczna morfologiczna semantyczna składniowa tekstu odpowiedni wymogom) Reprezentacja formalna (poziom odpowiedni) Reakcja (wykonanie operacji, sformułowanie odpowiedzi, tłumaczenie itp. ) 3 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Wybrane aspekty informatyczne l Modele formalne l Modele dedukcyjne

INŻYNIERIA JĘZYKA 20. 05. 2006 Wybrane aspekty informatyczne l Modele formalne l Modele dedukcyjne l Algorytmy genetyczne l Algorytmy miękkich obliczeń l Algorytmy statystyczne l Złożone struktury danych i algorytmy ich przetwarzania l Bazy danych i bazy wiedzy l Ontologie 4 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki formalne a metody statystyczne l klasyczne opisy teoretyczne

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki formalne a metody statystyczne l klasyczne opisy teoretyczne poszczególnych poziomów języka, przekształcanie na zapis formalny ( np. rozbiór syntaktyczny zgodny z jakąś teorią, formuła logiczna) – zalety: metody pewne, ścisłe, – wada: pokrywają niewielki podzbiór wypowiedzi w języku naturalnym l metody statystyczne – wnioskowanie o zależnościach występujących w języku naturalnym na podstawie dużych zbiorów danych – metody przybliżone, ale praktycznie użyteczne l metody statystyczne wspomagane metodami teoretycznymi l metody formalne wspomagane metodami statystycznymi 5 z 52

INŻYNIERIA JĘZYKA Formalny opis języka l Alfabet - dowolny zbiór symboli (V). l Słowo

INŻYNIERIA JĘZYKA Formalny opis języka l Alfabet - dowolny zbiór symboli (V). l Słowo - skończony (także pusty- ) ciąg symboli należących do alfabetu l Słownik – zbiór wszystkich słów nad alfabetem V, (V*). l Język L to dowolny podzbiór zbioru słów V* nad alfabetem V l Język to zbiór słów generowanych przez gramatykę l Gramatyka <V, T, S, P > 20. 05. 2006 – – V- alfabet, T- podzbiór V, symbole terminalne, S - element V-T, P - zbiór produkcji, reguły przepisywania 6 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki formalne c. d. l Wykorzystanie do opisu różnych

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki formalne c. d. l Wykorzystanie do opisu różnych poziomów JN – Fonologiczny • Jak buduje się morfy z fonem – Morfologiczny • Jaka jest struktura wyrazów (w jaki sposób morfy składają się na leksemy) – Syntaktyczny • Jaka jest struktura zdania (jak wyrazy składają się na zdanie) – Semantyczny • Jak znaczenia słów składają się na znaczenie zdania • Jak struktura semantyczna zdania określa treść 7 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki formalne c. d. l Uogólniając: gramatyka jest algorytmem

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki formalne c. d. l Uogólniając: gramatyka jest algorytmem „określającym” język l Trzy podejścia do modelowania l Podejście zwykle używane: jak skonstruować zdanie zawierające pewną treść – Model generuje nie zdania z zadanym sensem, a wszystkie możliwe „prawidłowe” zdania, pojęcie sensu tu nie istnieje, ale: – Pozwala zrozumieć, jak sens przekształca się w tekst (tym samym tekst – w sens) 8 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Składnia (syntaktyka) (1) l Analiza składniowa: określenie struktury zdania

INŻYNIERIA JĘZYKA 20. 05. 2006 Składnia (syntaktyka) (1) l Analiza składniowa: określenie struktury zdania i jego części składowych l Teoretyczne zasady składni języka – dla każdego języka z osobna – Topologia zdania – Problemy klasyfikacji wyrazów • W gramatyce tradycyjnej • W lingwistyce komputerowej – Funkcje gramatyczne • Tradycyjne • Nietradycyjne 9 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Składnia (syntaktyka) (2) l Wiedza o sposobie łączenia słów

INŻYNIERIA JĘZYKA 20. 05. 2006 Składnia (syntaktyka) (2) l Wiedza o sposobie łączenia słów we frazy, a fraz w zdania l Potrzeba informacji składniowych: – – – analiza i korekta gramatyczna analiza pytań do baz danych wyszukiwanie informacji generowanie wypowiedzi w języku naturalnym tłumaczenie l Opisy formalne języka polskiego: – S. Szpakowicz, Formalny opis składniowy zdań polskich, Wyd. UW, 1986 – M. Świdziński, Formalna gramatyka języka polskiego, Wyd. UW, 1992 10 z 52

INŻYNIERIA JĘZYKA Zdanie (wypowiedzenie) l Ponad 200 różnych definicji zdania – Uproszczona: „Najmniejszy odcinek

INŻYNIERIA JĘZYKA Zdanie (wypowiedzenie) l Ponad 200 różnych definicji zdania – Uproszczona: „Najmniejszy odcinek tekstu będący samodzielnym komunikatem” – Psychologiczne: w rodzaju „skończona myśl” – Logiczne: „sąd logiczny” – Formalne: np. „Tekst zaczynający się dużą literą i kończący kropką lub innym określonym znakiem przestankowym” – … – „grzecznościowa”, żartobliwa definicja Klemensiewicza: „Tekst, po którym można przerwać rozmówcy bez obawy niegrzeczności” l Istota komunikatu językowego: predykacja 20. 05. 2006 – Komunikat służy do przekazywania informacji – Trzonem informacji jest • Osobowa forma czasownika w zdaniu • Inny składnik w równoważniku zdania 11 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki składni, kryterium l Kryterium główne: adekwatność i algorytmizacja

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki składni, kryterium l Kryterium główne: adekwatność i algorytmizacja podejścia, co jest ważne dla implementacji l W jakim celu jest opracowywana analiza (jaka faza analizy tekstu jest następna, np. semantyka, transfer itp. ) l Jak formalizm radzi sobie z opisem gramatycznych zjawisk – – Dopełnienia dalsze i bliższe Szyk zdania Anafory Elipsy itp. l Ścisła zależność między strukturami składniowymi i strukturami morfologicznymi – Szczególnie ważne – dla języków fleksyjnych 12 z 52

INŻYNIERIA JĘZYKA Gramatyki składni (1) l Niech x – niepusty łańcuch (słowo) w słowniku

INŻYNIERIA JĘZYKA Gramatyki składni (1) l Niech x – niepusty łańcuch (słowo) w słowniku V, i niech π jest zbiorem wszystkich symboli x. Binarna relacja na π, dla której graf <π, > jest drzewem, będziemy nazywać relacją zależności składniowej dla x. Samo drzewo <π, > nazywa się drzewem zależności dla x. l Niech π – niepusty łańcuch (słowo) w słowniku V. Zbiór C odcinków łańcucha π nazywa się systemem składników bezpośrednich (drzewem struktury frazowej), jeżeli: – Do C należy odcinek składający się ze wszystkich elementów π, w tym do C należą wszystkie pojedyncze elementy π – Dowolne dwa odcinki C lub nie mają wspólnych elementów, lub jeden z nich zawiera inny l Zalety i wady l Realnie używane gramatyki – uzupełnione, rozszerzone l Uogólnienie – System Grup Składniowych, gramatyka SGGP (Syntactical Grammar Groups for Polish) 20. 05. 2006 13 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki składni (2) l Gramatyki logiczne – Początek- gramatyki

INŻYNIERIA JĘZYKA 20. 05. 2006 Gramatyki składni (2) l Gramatyki logiczne – Początek- gramatyki metamorficzne – Reguły przepisywania, w których symbole terminalne i nieterminalne mogą zawierać parametry – Parametrami mogą być złożone wyrażenia (np. termy jakiegoś języka formalnego) – Parametry mogą zawierać zmienne l Typy gramatyk logicznych – DCG (Definite Clause Grammars), problemy: • Swobodny szyk wyrazów – problem • Nieciągłość konstrukcji – FROG (FRee Order Grammar) – gramatyki szyku swobodnego – nowe wyzwanie 14 z 52

INŻYNIERIA JĘZYKA Gramatyki składni (3) l Gramatyki unifikacyjne (UG): zapis własności języka naturalnego w

INŻYNIERIA JĘZYKA Gramatyki składni (3) l Gramatyki unifikacyjne (UG): zapis własności języka naturalnego w gramatykach unifikacyjnych l Przykład formalizmu – HPSG – Jeżeli jest uogólnionym ciągiem symboli terminalnych i nieterminalnych gramatyki, a B 0 -> B 1 B 2. . . Bk jest regułą, to zastosowanie reguły do polega na: – Dopasowaniu symbolu po lewej stronie reguły do jednego z elementów mającego tę samą kategorię • równość kategorii • spójność opisów atrybutów – Zastąpienie wybranego elementu prawą stroną reguły • unifikacja opisów atrybutów l Literatura: 20. 05. 2006 – Shieber, S. M. An Introduction to Unification-Based Approaches to Grammar, CSLI Stanford, 1986 – Pollard, C. , I. Sag, Head-Driven Phrase Structure Grammar, The University of Chicago Press, 1994. 15 z 52

INŻYNIERIA JĘZYKA Gramatyki składni (4) l Gramatyki unifikacyjne mają większą moc niż gramatyki bezkontekstowe

INŻYNIERIA JĘZYKA Gramatyki składni (4) l Gramatyki unifikacyjne mają większą moc niż gramatyki bezkontekstowe – Gramatyki unifikacyjne są typu 0 - to znaczy moc ich równoważna jest mocy maszyny Turinga (generują języki rekurencyjnie przeliczalne) – Oznacza to, że nie istnieje procedura, która dla dowolnej gramatyki unifikacyjnej G i ciągu w określi, czy ciąg ten należy do języka generowanego przez G l Formalizmy unifikacyjne 20. 05. 2006 – – – FUG Functional Unification Grammar LFG Lexical-Functional Grammar GPSG Generalized Phrase Structure Grammar CUG Categorial Unification Grammar HPSG Head-driven Phrase Structure Grammar. . . 16 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy l Frazy (phrases) to ciągi słów/fraz l proste

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy l Frazy (phrases) to ciągi słów/fraz l proste / zdaniowe (zdania, składające się z fraz, także są frazami) l podział w zależności od typu elementu głównego (podkreślony): – – – rzeczownikowe : ciekawa książka o malarstwie przymiotnikowe: zupełnie nowa przysłówkowe: bardzo dobrze przyimkowe: w piątym rzędzie czasownikowe: złapać zająca liczebnikowe: drugi raz 17 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy rzeczownikowe, NP l dom l najstarszy dom w

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy rzeczownikowe, NP l dom l najstarszy dom w okolicy l dom, którego dach pomalowany był na niebiesko l największa ulewa od czasu, kiedy jego dziadek, zmuszony przez rodzinę żony, przeprowadził się do tego miasteczka l kobieta, dziecko i pies l ani wznoszenie błagalnych okrzyków ani bicie głową w mur 18 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy przyimkowe, PP l w domu l z szybkim

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy przyimkowe, PP l w domu l z szybkim napastnikiem należącym do drużyny przeciwnej l do punktu, z którego już nie mógł się wycofać l do smutku i żalu lub do czarnej rozpaczy l w góry lub nad morze 19 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy liczebnikowe, Num. P l trzynaście l dwadzieścia tysięcy

INŻYNIERIA JĘZYKA 20. 05. 2006 Frazy liczebnikowe, Num. P l trzynaście l dwadzieścia tysięcy czterysta trzy i pół godziny l pierwsi dwaj chłopcy l albo pięciu albo tylko dwóch l liczebniki porządkowe (pierwszy, trzysta trzeci ) są zwykle traktowane jako przymiotniki 20 z 52

INŻYNIERIA JĘZYKA Frazy przymiotnikowe, Adj. P l biały l najbardziej zmęczony z całej drużyny

INŻYNIERIA JĘZYKA Frazy przymiotnikowe, Adj. P l biały l najbardziej zmęczony z całej drużyny l większy i bielszy niż przed rokiem l zarówno pewny i głęboko przeświadczony o swej racji i w istocie najbardziej zacięty z nas wszystkich, jak też zaciekle walczący o swoje prawa 20. 05. 2006 21 z 52

INŻYNIERIA JĘZYKA Frazy przysłówkowe, Adv. P l szybko l szybciej niż ktokolwiek mógł przypuszczać

INŻYNIERIA JĘZYKA Frazy przysłówkowe, Adv. P l szybko l szybciej niż ktokolwiek mógł przypuszczać l wczoraj lub jeszcze dawniej l zarówno niewygodnie, jak też z całą pewnością ładniej, a także bardziej elegancko 20. 05. 2006 22 z 52

INŻYNIERIA JĘZYKA Frazy czasownikowe, VP l kupił obraz l wierzę, że o tym nie

INŻYNIERIA JĘZYKA Frazy czasownikowe, VP l kupił obraz l wierzę, że o tym nie zapomnisz l wczoraj bez żadnego namawiania przewiózł fotel samochodem z mieszkania ciotki do pracowni za 200 zł l kupił używany samochód, naprawił go i sprzedał za dwukrotnie wyższą cenę 20. 05. 2006 23 z 52

INŻYNIERIA JĘZYKA Grupy składniowe l Co najmniej trzy, a może nawet cztery rozumienia pojęcia

INŻYNIERIA JĘZYKA Grupy składniowe l Co najmniej trzy, a może nawet cztery rozumienia pojęcia grupy składniowej – Abstrakcyjny człon składniowy, część struktury zdania – Niepredykatywne połączenie składników, ogranicza to pojęcie do konstrukcji co najmniej dwuelementowych • Zarówno podrzędne, jak i współrzędne (brat kolegi, kolega i brat) • Tylko podrzędne (piłka czerwona, piłka Jana, piłka do siatkówki) – Zdanie jest szczególnym przypadkiem grupy (brak przeciwstawienia grupy – zdaniu) l Gramatyka SGGP – kolejne rozumienie, uogólnienie 20. 05. 2006 – Dopuszcza się konstrukcje jednoelementowe – Podział na poziomy abstrakcji – Rozumienie zgodne z poziomami abstrakcji 24 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Podstawowe problemy składniowe l Uzgodnienia (~równość cech) l Podmiot

INŻYNIERIA JĘZYKA 20. 05. 2006 Podstawowe problemy składniowe l Uzgodnienia (~równość cech) l Podmiot – orzeczenie: (rodzaj, liczba, osoba) – Piotr idzie *idą ale: – Piotr i Maria idą. Idzie / idą Piotr i Maria. – Pięciu chłopców przyszło. Dwaj chłopcy przyszli. l Rzeczownik – przymiotnik: (przypadek, rodzaj, liczba) – białym krukiem (*kruka) l itd. 25 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Problemy składniowe, cd. l Negacja – – Jan chciał

INŻYNIERIA JĘZYKA 20. 05. 2006 Problemy składniowe, cd. l Negacja – – Jan chciał kupić książkę. Jan nie chciał kupić książki / *książkę. Jan nikogo nie oszukał. *Jan nikogo oszukał. l Koordynacja (struktury współrzędne) – frazy tego samego typu: koń i osioł; mały i zadziorny – frazy różnego typu: ufnie i bez strachu l Frazy „niepełne”: – złapał i ze złością odrzucił piłkę 26 z 52

INŻYNIERIA JĘZYKA Kolejne problemy l Szyk (ew. „przesunięcia”) – Do niego Jan szedł po

INŻYNIERIA JĘZYKA Kolejne problemy l Szyk (ew. „przesunięcia”) – Do niego Jan szedł po raz drugi. – I looked up his grade. I looked his grade up. l Zależności odległe – Kogo chciałabyś, aby Piotr zaprosił? – To ten, którego musiałbyś poprosić o zgodę l Nieciągłość fraz – Smutny czekał go koniec. l Elipsy (brak wymaganych słów bądź fraz) 20. 05. 2006 – dialogi: Kogo widzisz? - Piotra [widzę]. – koordynacja różnego typu składników czy elipsa? – Pittsburgh prowadzi 4: 0 ale Detroit [prowadzi] tylko 3: 1. – pro-drop (pominięcie zaimkowego podmiotu) (to dość proste do analizy) – [Ja] zdałam egzamin. 27 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Komputerowa analiza języka (1) l Składnia, semantyka, pragmatyka –

INŻYNIERIA JĘZYKA 20. 05. 2006 Komputerowa analiza języka (1) l Składnia, semantyka, pragmatyka – W wielu badaniach – ograniczenie zainteresowania do przypadku analizy składniowej w rozumieniu wąskim • Reguły tworzenia wyrażeń bardziej złożonych z prostszych • Brak odwoływania się do znaczenia konstrukcji • Pomijanie powiązania analizy formalno-składniowej z innymi poziomami analizy: semantyką i pragmatyką – W niewielu badaniach celem jest rozumienie tekstu l Wymagania: model rozumienia tekstu ma być weryfikowalny empirycznie 28 z 52

INŻYNIERIA JĘZYKA Komputerowa analiza języka (2) l Stosunek pomiędzy poziomami – Formalno-składniowym – Semantycznym

INŻYNIERIA JĘZYKA Komputerowa analiza języka (2) l Stosunek pomiędzy poziomami – Formalno-składniowym – Semantycznym – Pragmatycznym l Składnia formalna jest podporządkowana semantyce l Założenia kompozycyjności 20. 05. 2006 – Znaczenia komponentów wyznacza sposób rozumienia zbudowanej z nich całości – Zadaniem analizy formalno-składniowej jest dostarczanie odpowiedniej segmentacji – Owo „wyznaczanie” powinno być obliczalne i praktycznie realizowalne komputerowo 29 z 52

INŻYNIERIA JĘZYKA Komputerowa analiza języka (3) l Poprawność formalno-składniowa – Nie oznacza poprawności znaczeniowej

INŻYNIERIA JĘZYKA Komputerowa analiza języka (3) l Poprawność formalno-składniowa – Nie oznacza poprawności znaczeniowej (algorytm wyznaczający znaczenie musi skończyć się sukcesem) – Odwołuje się do pewnej jawnej normy l Poprawność semantyczna 20. 05. 2006 – Zdanie poprawne składniowo, ale nie zawsze – Algorytm wyznaczający znaczenie pracuje w rzeczywistości (aktualnej lub potencjalnej, np. modelu w sensie matematycznym) – Algorytm wyznaczający znaczenie kończy się sukcesem – Reguły semantyczne (semantyczno-składniowe) 30 z 52

INŻYNIERIA JĘZYKA Komputerowa analiza języka (4) l Poprawność pragmatyczna 20. 05. 2006 – Sytuacja

INŻYNIERIA JĘZYKA Komputerowa analiza języka (4) l Poprawność pragmatyczna 20. 05. 2006 – Sytuacja (akcja mowy) – Związek bodziec – reakcja – Związek między zdaniami (wypowiedziami) a spodziewanymi skutkami wypowiedzeń – Zasięg szerszy niż poprawność składniowa lub semantyczna – Odnosi się do wszystkich wypowiedzeń, nie tylko do zdań 31 z 52

INŻYNIERIA JĘZYKA Semantyka (1) l ustalenie co jest znaczeniem konkretnego wyrażenia w języku naturalnym

INŻYNIERIA JĘZYKA Semantyka (1) l ustalenie co jest znaczeniem konkretnego wyrażenia w języku naturalnym – nazwy obiektów, relacji między nimi, . . . – sieci semantyczne wskazujące na hierarchię i pokrewieństwo terminów l ustalenie sposobu reprezentowania znaczenia l określenie niezbędnego zakresu wiedzy pragmatycznej l określenie zasad wnioskowania 20. 05. 2006 32 z 52

INŻYNIERIA JĘZYKA Semantyka (2) l Reprezentacja znaczenia 20. 05. 2006 – W jaki sposób

INŻYNIERIA JĘZYKA Semantyka (2) l Reprezentacja znaczenia 20. 05. 2006 – W jaki sposób można reprezentować semantykę języka naturalnego, czyli jakie mechanizmy formalne można w tym celu wykorzystać (zdefiniować)? – W praktyce może to być „cokolwiek”, co odpowiada praktycznym potrzebom programu dokonującego interpretacji semantycznej – Kiedy potrzebna jest semantyka: • • odpowiedzi na pytania ustalenie, czy dane zdanie jest prawdziwe wnioskowanie itd. 33 z 52

INŻYNIERIA JĘZYKA Semantyka (3) l Niejednoznaczności 20. 05. 2006 – Struktura składniowa (i znaczenie)

INŻYNIERIA JĘZYKA Semantyka (3) l Niejednoznaczności 20. 05. 2006 – Struktura składniowa (i znaczenie) • Pacjent opuścił salę operacyjną w dobrym stanie – „nawiasowanie” negacji • Nie zrobisz tego? Nie (nie zrobię albo właśnie, że zrobię) – kwantyfikacja • Każdy chce mieć piękny samochód. (każdy inny) • Każdy chce wygrać szczęśliwy los. (ten jedyny) – wiązane zaimków • Jan kazał Piotrowi wyczyścić swoje buty. 34 z 52

INŻYNIERIA JĘZYKA Semantyka (4) l Rachunek predykatów I rzędu 20. 05. 2006 – „Naturalną”

INŻYNIERIA JĘZYKA Semantyka (4) l Rachunek predykatów I rzędu 20. 05. 2006 – „Naturalną” metodą reprezentowania semantyki jest rachunek predykatów I rzędu – Nie jest to idealny sposób zapisu, nie pozwala na wyrażenie wszystkich znaczeń, ale ma wiele właściwych cech: • pozwala zapisać czy jakiś fakt jest prawdziwy czy fałszywy • pozwala zapisywać pytania (użycie zmiennych) • są metody wnioskowania – Wybór rachunku pred. I rzędu nie jest całkowicie arbitralny czy sterowany konkretnymi aplikacjami. Można zauważyć pewne analogie między językiem naturalnym a językiem rachunku predykatów. – Cechy rachunku pred. I rzędu: wprowadzenie zmiennych, użycie kwantyfikatorów, częściowo kompozycyjna semantyka 35 z 52

INŻYNIERIA JĘZYKA Semantyka (5) l Predykatywno-argumentowy model zdania 20. 05. 2006 – Nawet dość

INŻYNIERIA JĘZYKA Semantyka (5) l Predykatywno-argumentowy model zdania 20. 05. 2006 – Nawet dość pobieżna analiza wykazuje, że struktura predykatywno-argumentowa dobrze oddaje znaczenie wielu elementów języka naturalnego. – W szczególności niektóre typy słów w łatwy sposób można przetłumaczyć na predykaty, podczas gdy inne pełnią funkcje ich argumentów: – słowa kojarzone z predykatami: • czasowniki (frazy czasownikowe), przyimki, przymiotniki, niektóre czasowniki – słowa kojarzone z argumentami: • rzeczowniki (frazy rzeczownikowe) 36 z 52

INŻYNIERIA JĘZYKA Semantyka (6) l Tematyczno-rematyczny model zdania – Funkcjonalna perspektywa wypowiedzi l inaczej:

INŻYNIERIA JĘZYKA Semantyka (6) l Tematyczno-rematyczny model zdania – Funkcjonalna perspektywa wypowiedzi l inaczej: Aktualne rozczłonkowanie wypowiedzi 20. 05. 2006 – Temat: punkt wyjścia jako informacja znana – Remat: cel wypowiedzi, wprowadzenie nowej informacji 37 z 52

INŻYNIERIA JĘZYKA Przykład zapisu znaczenia l Przykład: Jan dał Marii książkę. Tłumaczenie „bezpośrednie”: Dać(Jan,

INŻYNIERIA JĘZYKA Przykład zapisu znaczenia l Przykład: Jan dał Marii książkę. Tłumaczenie „bezpośrednie”: Dać(Jan, Maria, książka) „Lepsze” (dokładniejsze) tłumaczenie (należy stosować ten sposób) : czasownik decyduje o nazwie predykatu, liczbie i roli jego argumentów, ‘dać’ oznacza więc: w, x, y, z Giving(x) Giver(w, x) Givee(y, x) Given(z, x) x, y Giving(x) Giver(Jan, x) Givee(Maria, x) Given(y, x) Isa(y, książka) Różnica między zapisem rzeczowników ‘Jan’ i ‘książka’ to różnica interpretacji rzeczowników własnych i pospolitych 20. 05. 2006 38 z 52

INŻYNIERIA JĘZYKA Analiza semantyczna (1) l Analiza semantyczna to proces przekształcenia wyrażenia lingwistycznego w

INŻYNIERIA JĘZYKA Analiza semantyczna (1) l Analiza semantyczna to proces przekształcenia wyrażenia lingwistycznego w zapis jego znaczenia l Są miliony sposobów dokonania takiego przekształcenia, od rozwiązań całkowicie ad hoc, opracowanych na potrzeby konkretnych aplikacji do wyrafinowanych metod teoretycznych o często wątpliwym znaczeniu praktycznym l Większość metod analizy semantycznej opiera się na wynikach analizy syntaktycznej (albo jest dokonywana równolegle z nią) 20. 05. 2006 39 z 52

INŻYNIERIA JĘZYKA Analiza semantyczna (2) l Funkcyjne rozszerzenia reguł gramatyki. l Dwie strategie budowy

INŻYNIERIA JĘZYKA Analiza semantyczna (2) l Funkcyjne rozszerzenia reguł gramatyki. l Dwie strategie budowy interpretacji semantycznej: 20. 05. 2006 – Tak jak w przypadku unifikacji - rozszerzenie algorytmu parsowania (np. Earley’a) tak, by dla całkowicie rozpoznanych składników (kropka na końcu reguły) tworzyła się interpretacja semantyczna, – Przypisanie interpretacji po zbudowaniu całego drzewa rozbioru 40 z 52

INŻYNIERIA JĘZYKA DRT - Discourse Representation Theory l metoda reprezentacji znaczenia wypowiedzi polegająca na

INŻYNIERIA JĘZYKA DRT - Discourse Representation Theory l metoda reprezentacji znaczenia wypowiedzi polegająca na konstruowaniu specjalnej struktury, nazwanej DRS (Discourse Representation Structure); Kamp i Reyle (1991); l Struktura ta składa się z dwóch części: – zbioru obiektów (discourse referents), zwanych uniwersum, – zbioru warunków opisujących zależności między obiektami. l Przykładowo, zdanie Jones owns Ulysses (Jones posiada Ulissesa) można przedstawić w postaci następującej struktury DRS: x y Jones (x) Ulysses(y) [x owns y] 20. 05. 2006 41 z 52

INŻYNIERIA JĘZYKA Relacja między DRT a logiką I rzędu l Można dokonać tłumaczenia DRS

INŻYNIERIA JĘZYKA Relacja między DRT a logiką I rzędu l Można dokonać tłumaczenia DRS na formuły logiki l Warunki prawdziwości określone dla DRT są podobne jak dla logiki I rzędu l DRT – dodaje strukturę wewnętrzną – wykorzystuje tę strukturę do określania powiązań anafor l inne rozwiązanie: Montague Grammar 20. 05. 2006 42 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Role i Reference Grammar l Gramatyki przypadków Fillmora (1968)

INŻYNIERIA JĘZYKA 20. 05. 2006 Role i Reference Grammar l Gramatyki przypadków Fillmora (1968) – – – Czynność Subiekt Obiekt Adresat Miejsce Czas itd. l Role i Reference Grammar (RRG) – Van Valin (1993) – Źródło – gramatyki przypadków Role składniowe – nie są uniwersalne – Ukierunkowana na dyskurs – Role semantyczne – uniwersalne – Szczególna uwaga – operatorom predykatu: aspekt, modalność itp. 43 z 52

INŻYNIERIA JĘZYKA Gramatyki kognitywne (1) l Lingwistyka kognitywna - paradygmat językoznawstwa zakładający, że język

INŻYNIERIA JĘZYKA Gramatyki kognitywne (1) l Lingwistyka kognitywna - paradygmat językoznawstwa zakładający, że język jest ściśle powiązany z umysłowymi procesami dotyczącymi postrzegania świata 20. 05. 2006 44 z 52

INŻYNIERIA JĘZYKA Gramatyki kognitywne (2) Niektórzy przedstawiciele dziedziny l W Polsce: – – –

INŻYNIERIA JĘZYKA Gramatyki kognitywne (2) Niektórzy przedstawiciele dziedziny l W Polsce: – – – Tomasz Krzeszowski Aleksander Szwedek Elżbieta Tabakowska, Jolanta Antas, Henryk Kardela, Roman Kalisz l Na świecie 20. 05. 2006 – – – – Ronald Langacker George Lakoff Mark Johnson Paul Kay Mark Turner Georges Kleiber John R. Taylor 45 z 52

INŻYNIERIA JĘZYKA Gramatyki kognitywne (3) l Literatura 20. 05. 2006 – – – –

INŻYNIERIA JĘZYKA Gramatyki kognitywne (3) l Literatura 20. 05. 2006 – – – – George Lakoff i Mark Johnson Metafory w naszym życiu Georges Kleiber Semantyka prototypu John R. Taylora Kategoryzacja w języku Ronald Langacker Wykłady z gramatyki kognitywnej George Lakoff Women, Fire and Dangerous Things Mark Johnson The Body in the Mind Ronald Langacker Foundations of Cognitive Grammar Podręcznik: "Kognitywne podstawy języka i językoznawstwa" red. Elżbieta Tabakowska, Universitas, Kraków 2001 46 z 52

INŻYNIERIA JĘZYKA Ontologia Pojęcie modelu ontologii można zdefiniować jako uporządkowaną trójkę O = <X,

INŻYNIERIA JĘZYKA Ontologia Pojęcie modelu ontologii można zdefiniować jako uporządkowaną trójkę O = <X, R, F>, gdzie l X jest skończony niepusty zbiór konceptów (pojęć, terminów) dziedziny problemu, którą reprezentuje ontologia O l R jest skończony zbiór relacji między konceptami (pojęciami, terminami) l F jest skończony zbiór funkcji (operacji) zdefiniowanych na X i/lub R 20. 05. 2006 47 z 52

INŻYNIERIA JĘZYKA Ontologia c. d. l Gramatyka opisów poszczególnych bytów l Nazwy i znaczenia

INŻYNIERIA JĘZYKA Ontologia c. d. l Gramatyka opisów poszczególnych bytów l Nazwy i znaczenia nazw obowiązujących w ramach danej dziedziny (np. co oznaczają słowa „drukarka", „sprzęt", itd. ) l Ograniczenia związanych z opisywanymi bytami l Metadane związanych z bytami l Dopuszczalne operacji na bytach 20. 05. 2006 W tym zakresie zapis ontologii jest pewną metabazą danych, w które ustala się zarówno strukturę samej bazy danych, jak i pewne dodatkowe informacje (meta-atrybuty) będące podstawą przetwarzania bazy danych 48 z 52

INŻYNIERIA JĘZYKA Ontologia c. d. — metaontologia Wyniki analizy tekstu 20. 05. 2006 ontologia

INŻYNIERIA JĘZYKA Ontologia c. d. — metaontologia Wyniki analizy tekstu 20. 05. 2006 ontologia zadań — ontologia dziedziny Powiązanie systemów ontologicznych 49 z 52

INŻYNIERIA JĘZYKA Ontologia c. d. Opracowanie ontologii: l Wybór bazy danych l Wybór relacji

INŻYNIERIA JĘZYKA Ontologia c. d. Opracowanie ontologii: l Wybór bazy danych l Wybór relacji l Opracowanie sieci pojęć l Opracowanie maszyny wyszukiwania 20. 05. 2006 50 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 Ontologia c. d. Przykładowa lista relacji: l part of,

INŻYNIERIA JĘZYKA 20. 05. 2006 Ontologia c. d. Przykładowa lista relacji: l part of, l kind of, l contained in, l member of, l see also 51 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 52 z 52

INŻYNIERIA JĘZYKA 20. 05. 2006 52 z 52