Linguistische Grundlagen Reprsentationsformen u Dependenz u Konstituenz u

  • Slides: 34
Download presentation
Linguistische Grundlagen ¨ Repräsentationsformen u. Dependenz u. Konstituenz u. Merkmalstrukturen ¨ Modelle u. Dependenzgrammatik

Linguistische Grundlagen ¨ Repräsentationsformen u. Dependenz u. Konstituenz u. Merkmalstrukturen ¨ Modelle u. Dependenzgrammatik u. Kategorialgrammatik u. Phrasenstrukturgrammatik – Transformationen u. Unifikationsgrammatiken

Dependenz Eine Dependenzgrammatik (DG) ist eine Grammatik, in der die syntaktische Struktur primär in

Dependenz Eine Dependenzgrammatik (DG) ist eine Grammatik, in der die syntaktische Struktur primär in Form von Dependenzrelationen (Abhängigkeitsbeziehungen) zwischen den Basiselementen (den Wörtern) ausgedrückt wird. ¨ Eine Dependenzrelation ist eine zweistellige gerichtete Relation zwischen zwei Elementen der gleichen Strukturebene in einem Satz. Eines der Elemente (das Dependens) hängt morphologisch, syntaktisch oder semantisch von dem anderen (dem Regens) ab. ¨

Dependenzgrammatik ¨ ¨ ¨ Der Begriff der Abhängigkeit findet sich bereits in den Arbeiten

Dependenzgrammatik ¨ ¨ ¨ Der Begriff der Abhängigkeit findet sich bereits in den Arbeiten der frühesten bekannten Grammatiker, z. B. der griechischen Gelehrten Thrax und Apollonius und danach Römischer Gelehrter wie Priscian. Der Dependenzbegriff findet sich auch in den Schriften Europäischer Gelehrter des Mittelalters, insbesondere bei den Modisten und Vertretern der spekulativen Grammatik, so z. B. bei Thomas von Erfurt. Die wichtigste Rolle in der Entwicklung der DG spielte jedoch Lucien Tesnière, der als erster Sprachwissenschaftler einen Formalismus zur Darstellung von Dependenzstrukturen herausgearbeitet hat. Seine Ideen wurden in dem 1959 posthum erschienenen Werk Eléments de syntaxe structurale dargelegt. Viele Arbeiten zur Dependenzgrammatik in den USA in den sechziger Jahren zielten darauf ab, Probleme der maschinellen Übersetzung zu lösen. Nach einer Pause von 20 Jahren, in der nur in wenigen MÜ-Projekten DG verwendet wurde, lebte das Interesse in den 1980 Jahren wieder auf. Es entstanden mehrere größere Projekte, die DG verwendeten, darunter EUROTRA und DLT.

Dependenz A very tall professor with grey hair wrote this boring book professor wrote

Dependenz A very tall professor with grey hair wrote this boring book professor wrote book professor a tall wrote with very book hair grey this boring

Dependenz A very tall professor with grey hair wrote this boring book N(professor) D(a)

Dependenz A very tall professor with grey hair wrote this boring book N(professor) D(a) A(tall) V(wrote) P(with) Adv(very) N(book) N(hair) A(grey) D(this) A(boring)

Dependenz N D A V P N Adv N D A A A very

Dependenz N D A V P N Adv N D A A A very tall professor with grey hair wrote this boring book

Dependenz Fin N D A V P N Adv N D A A A

Dependenz Fin N D A V P N Adv N D A A A very tall professor with grey hair wrote this boring book

Dependenzregeln 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Fin N V

Dependenzregeln 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Fin N V P A D N V A P N*V D (A) * (P) * (N) (P) *N Adv * {a, this} {professor, hair, book …} {wrote, … } {tall, boring, …} {with, … }

Dependenz Fin Satz N NP D Eine regierende Kategorie X zusammen mit allen abhängigen

Dependenz Fin Satz N NP D Eine regierende Kategorie X zusammen mit allen abhängigen konstituiert eine X-Phrase (XP), wobei X = N, V, A, P AP Adv A V P PP NP N VP NP D N AP A A A very tall professor with grey hair wrote this boring book

Konstituentenregeln (Phrasenstrukturregeln) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. S NP

Konstituentenregeln (Phrasenstrukturregeln) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. S NP VP PP AP D N V A P NP VP D (AP) N (PP) V (NP)(PP) P NP Adv A {a, this} {professor, hair, book …} {wrote, … } {tall, boring, …} {with, … }

Phrasenstruktur- und Transformationsgrammatik PSG und TG sind beides Grammatikformalismen, die im wesentlichen aus dem

Phrasenstruktur- und Transformationsgrammatik PSG und TG sind beides Grammatikformalismen, die im wesentlichen aus dem Forschungsrahmen der generativen Grammatik (im engeren Sinne) entstammen (Chomsky). ¨ Entwicklung: ¨ u Die bis in die 50 er Jahre zurückreichende generative Grammatik hat über die Zeit verschiedene Entwicklungsstufen durchlaufen. u Die mit diesem Ansatz assoziierten Grammatikmodelle haben entsprechend unterschiedliche Bezeichnungen: ± Standardtheorie (60 er Jahre) ± Rektions- und Bindungstheorie (80 er Jahre) ± Minimalist Program (90 er Jahre bis heute). u Obwohl steter und z. T. drastischer Modifikation unterzogen, haben sich doch bestimmte grammatiktheoretische Annahmen konstant gehalten.

Generative Transformationsgrammatik Die Konstrukte 'Oberflächen-' und 'Tiefenstruktur', die bereits in den Anfängen der generativen

Generative Transformationsgrammatik Die Konstrukte 'Oberflächen-' und 'Tiefenstruktur', die bereits in den Anfängen der generativen Grammatik Verwendung fanden, finden sich - in modifizierter Form, z. B. mit leicht unterschiedlicher Funktion - auch in modernen Theorievarianten wieder. ¨ Das verbindende Element zwischen der Oberflächen- und der Tiefenstruktur sind die Transformationen, die eine gegebene TS in eine OS überführen. ¨

GTG – Standardtheorie ¨ In der Standardtheorie ist man davon ausgegangen, daß jeder Satz

GTG – Standardtheorie ¨ In der Standardtheorie ist man davon ausgegangen, daß jeder Satz über zwei Strukturebenen verfügt: die Ebene der Tiefenstruktur und die Ebene der Oberflächenstruktur. Grund für diese Annahme waren ua. sprachliche Phänomene wie die Beziehung Aktiv/Passiv: hier wird derselbe außersprachliche Sachverhalt in zwei verschiedenen Formen wiedergegeben. u John kicked the dog / The dog was kicked by John Solche Sätze wurden zueinander in Beziehung gesetzt, indem die unterschiedlichen Oberflächenstrukturen aus einer gemeinsamen Tiefenstruktur abgeleitet wurden. Diese TS wurde in Form eines Phrasemarkers repräsentiert, der selber das Ergebnis der Anwendung von Phrasenstrukturregeln war. ¨ In anderen Fällen verhielt es sich umgekehrt: zwei gleiche Oberflächenstrukturen entsprangen unterschiedlichen Tiefenstrukturen. Dieses ist beispielsweise bei struktureller Mehrdeutigkeit der Fall: ¨ u The boy tied the man with a tie

Basiskomponente PS–Regeln Lexikonregel Strikte Subkategorisierung Tiefenstruktur Architektur der GTG semantische Komponente semantische Repräsentation phonologische

Basiskomponente PS–Regeln Lexikonregel Strikte Subkategorisierung Tiefenstruktur Architektur der GTG semantische Komponente semantische Repräsentation phonologische Komponente phonologische Repräsentation Transformationskomponente Transformationsregeln Oberflächenstruktur

Kategorialgrammatik Der Terminus 'Kategorialgrammatik' umfaßt eine ganze Reihe von Theorien über algorithmische Verfahren zur

Kategorialgrammatik Der Terminus 'Kategorialgrammatik' umfaßt eine ganze Reihe von Theorien über algorithmische Verfahren zur syntaktischen und semantischen Analyse von Sätzen. Entwicklung: u Anfänge in den 20 er Jahren (Lesniewski, Ajdukiewicz) u erste Anwendung auf natürliche Sprachen in den 50 er Jahren (Bar. Hillel) u verlor in den 60 er Jahren stark an Bedeutung u neues Interesse an kategorialgrammatischen Ansätzen in den 70 er Jahren (Stichwort: Montague-Grammatik, ROSETTA) u stete Erweiterung und Modifikation seit Mitte der 80 er Jahre(Steedman)

Kategorialgrammatik Grundelemente der KG sind die KATEGORIEN, die sich jedoch bezüglich ihrer Form und

Kategorialgrammatik Grundelemente der KG sind die KATEGORIEN, die sich jedoch bezüglich ihrer Form und ihres Informationsgehaltes fundamental von 'herkömmlichen' Kategorien (N, V, PP, AP usw. ) unterscheiden. ¨ Kerngedanke hinter der Struktur der Kategorien ist die Annahme, bestimmte syntaktische und semantische Information, die mit einem Lexem verbunden ist, direkt in der Kategorie zu kodieren. Beispiel: ¨ u einem intransitiven Verb, wie z. B. died, würde in der Kategorialgrammatik eine Kategorie zugewiesen, aus der klar ablesbar ist, daß sich dieser Ausdruck zusammen mit einem NP-artigen Ausdruck zu einem Satz verbindet.

Kategorialgrammatik Die klassische Kategorialgrammatik kennt zwei Basiskategorien: S und N. ¨ Diese Basiskategorien können

Kategorialgrammatik Die klassische Kategorialgrammatik kennt zwei Basiskategorien: S und N. ¨ Diese Basiskategorien können über die folgende Regel zu einer komplexen Kategorie kombiniert werden: ¨ u wenn A eine Kategorie ist und B eine Kategorie ist, dann ist auch A/B eine Kategorie. Damit wären als Kategorien etabliert: S/N und N/S. ¨ Da eine komplexe Kategorie aber selber wieder Input für eine komplexe Kategeorie sein kann, ist das kategoriebildende Potential einer KG praktisch unbegrenzt: ¨

Kategorien der KG A B A/B S N S/N N (S/N)/N S ((S/N)/N)/S S/N

Kategorien der KG A B A/B S N S/N N (S/N)/N S ((S/N)/N)/S S/N S (S/N)/S

Regel der KG Auf der Basis dieser Kategorien reicht eine einzige Syntax-Regel, um Phrasen

Regel der KG Auf der Basis dieser Kategorien reicht eine einzige Syntax-Regel, um Phrasen bzw. Konstituenten abzuleiten. ¨ Diese Regel wird Funktionsanwendung genannt und hat die folgende Form: ¨ u Ist a von der Kategorie A/B und b von der Kategorie B, dann ist ab von der Kategorie A u Ist a von der Kategorie A und b von der Kategorie AB, dann ist ba von der Kategorie A. (Tip: die Multiplikation eines Bruches mit dem Wert des Nenners ergibt den Zähler: 1/2 x 2 = 1; 3/8 x 8 = 3 usw. ) ¨ Beispiel: John (ein Eigenname) ist von der Kategorie N, jumped (ein intransitives Verb) ist von der Kategorie SN. Nach der zweiten Regel gilt dann: John jumped ist von der Kategorie S (ein Satz). ¨

Kategorie - Funktionsanwendung Definition 'Kategorie: u Es gibt eine endliche Menge von Basiskategorien, z.

Kategorie - Funktionsanwendung Definition 'Kategorie: u Es gibt eine endliche Menge von Basiskategorien, z. B. N (= Name) und S (= Satz) u Es gibt einen Operator in den beiden Ausprägungen '/' und ''. u Jede Basiskategorie ist eine Kategorie u Wenn A und B Kategorien sind, sind auch A/B und AB Kategorien Regel: Funktionsanwendung u Wenn x von der Kategorie A/B ist und y von der Kategorie B dann ist xy von der Kategorie A u Wenn x von der Kategorie AB ist und y von der Kategorie B dann it yx von der Kategorie A.

Lexikon Zur Beschreibung unseres Satzes a very tall professor with grey hair wrote this

Lexikon Zur Beschreibung unseres Satzes a very tall professor with grey hair wrote this boring book benötigen wir folgende Kategorien: ¨ ¨ ¨ ¨ Basiskategorien Det (a, this) Appelativa (professor, hair, book) Adjektive (tall, grey, boring) Gradadverb (very) Transitives Verb (wrote) Präposition (with) ¨ ¨ ¨ ¨ S und N N/(N/N) N/N (N/N)/(N/N) ((N/N)/(N/N))/((N/N)/(N/N)) (SN)/N ((N/N)(N/N))/N

Parsing mit KG a very N/(N/N) tall professor with ? grey hair wrote this

Parsing mit KG a very N/(N/N) tall professor with ? grey hair wrote this boring book ((N/N)/(N/N))/((N/N)/(N/N)) (N/N)/(N/N) N/N ((N/N)(N/N))/N (N/N)/(N/N) N/N (SN)/N N/(N/N)/(N/N) N/N N/(N/N) ((N/N)/(N/N))/((N/N)/(N/N)) (N/N)/(N/N) N/N (N/N)(N/N) N/N N N/N SN N S

Kategorialgrammatik ¨ Wesentliche Merkmale einer KG: u synchroner Aufbau von syntaktischer und semantischer Strukturbeschreibung

Kategorialgrammatik ¨ Wesentliche Merkmale einer KG: u synchroner Aufbau von syntaktischer und semantischer Strukturbeschreibung u Kodierung syntaktischer/semantischer Information in den Kategorien. Die Art der Kategorisierung lexikalischer und syntaktischer Kategorien hat Auswirkungen auf das Verhältnis zwischen den einzelnen Komponenten der Grammatik. ¨ Die traditionelle KG kommt mit einer einzigen Syntax Regel aus. Durch diesen radikalen Lexikalismus, hier also die Angabe der syntaktischen Merkmale eines Lexems bereits im Lexikon, wäre es redundant, diese Art der Restriktion nochmals durch Syntax Regeln zu erfassen. ¨ Der Nachteil aber ist, daß die Kategorienkomponente, wie gesehen, extrem aufgebläht werden muß, um den möglichen syntaktischen Kombinationen, die ein lexikalisches Element eingehen kann, Rechnung zu tragen. ¨

Unifikationsgrammatiken Unifikationsgrammatik steht für eine Reihe moderner Grammatikformalismen, bei denen Merkmalstrukturen und deren Unifikation

Unifikationsgrammatiken Unifikationsgrammatik steht für eine Reihe moderner Grammatikformalismen, bei denen Merkmalstrukturen und deren Unifikation für die Ableitung grammatisch korrekter Formen eine zentrale Rolle spielt. ¨ Dazu gehören u. a. ¨ u die LFG (= Lexical-Functional Grammar) u die GPSG (= Generalized Phrase Structure Grammar) u die HPSG (=Head-Driven-Phrase-Structure Grammar)

Merkmalstrukturen Eigenschaften linguistischer Objekte (Linguistische Elemente wie z. B. Wörter oder Phrasen) werden in

Merkmalstrukturen Eigenschaften linguistischer Objekte (Linguistische Elemente wie z. B. Wörter oder Phrasen) werden in einer Unifikationsgrammatik als Bündel von Merkmalen verstanden. Diese Merkmalstrukturen haben die Form von Attribut-Wert Paaren, wobei die Werte entweder atomare Symbole oder aber selber wieder Merkmalstrukturen sein können.

Unifikation ist eine formale Operation, bei der zwei kompatible Merkmalsstrukuren zu einer neuen Merkmalsstruktur

Unifikation ist eine formale Operation, bei der zwei kompatible Merkmalsstrukuren zu einer neuen Merkmalsstruktur vereinigt werden können:

Unifikation Stimmen allerdings die Werte jeweils gleicher Attribute nicht überein, können die Merkmalstrukturen nicht

Unifikation Stimmen allerdings die Werte jeweils gleicher Attribute nicht überein, können die Merkmalstrukturen nicht unifiziert werden:

LFG ¨ Erste Anfänge der LFG finden wir Ende der siebziger Jahre (Bresnan, Kaplan),

LFG ¨ Erste Anfänge der LFG finden wir Ende der siebziger Jahre (Bresnan, Kaplan), z. T. motiviert aus der Kritik an der damaligen Modellvariante der generativen Transformationsgrammatik. u Im Unterschied zu selbiger haben in der LFG z. B. die grammatischen Funktionen den Status von Grundbegriffen, sind also nicht aus bestimmten Strukturen abgeleitet. u Phänomene, die in der TG über Transformationen erklärt wurden, werden hier als primär lexikalisch behandelt und also durch entsprechende Lexikoneinträge bzw. lexikalische Regeln beschrieben. ¨ In einer LFG werden zwei Ebenen der syntaktischen Repräsentation unterschieden: u die C- (=Constituent)-Structure und die u F(=Functional)-Structure ¨ Diese werden parallel über die Phrasenstrukturregeln der Grammatik erzeugt werden.

Prädikaten. Logik Sprechakt. Theorie Präsuppositions. Logik Funktionale Satz-Perspektive Standard Theorie Generative Semantik Kasus Grammatik

Prädikaten. Logik Sprechakt. Theorie Präsuppositions. Logik Funktionale Satz-Perspektive Standard Theorie Generative Semantik Kasus Grammatik Relationale Grammatik Erweiterte Standard -Theorie Interpretative Semantik Lexikalisch. Funktionale Grammatik

Architektur der LFG Grammatik Erweiterte PSG Lexikonregeln K-Strukturen F-Strukturen phonologische Interpretation semantische Interpretation phonologische

Architektur der LFG Grammatik Erweiterte PSG Lexikonregeln K-Strukturen F-Strukturen phonologische Interpretation semantische Interpretation phonologische Repräsentation semantische Repräsentation

F-Strukturen in LFG ¨ Die F-Struktur ist eine Merkmalsstruktur, deren Attribute sowohl die grammatischen

F-Strukturen in LFG ¨ Die F-Struktur ist eine Merkmalsstruktur, deren Attribute sowohl die grammatischen Funktionen (SUBJ, PRED) wie auch morphosyntaktische Merkmale wie z. B. CASE, NUM oder TENSE umfassen.

Transfer mit F-Strukturen John likes the dog Der Hund gefällt John (PRED) = 'like

Transfer mit F-Strukturen John likes the dog Der Hund gefällt John (PRED) = 'like <(SUBJ: $1) (OBJ: $2)>' ß Transfer Ý (PRED) = 'gefallen <(SUBJ: $2) (OBJ: $1)>'

Transfer mit F-Strukturen TRANSFER

Transfer mit F-Strukturen TRANSFER

F-Struktur Spec Mod Subj PRED Qual [Det Indef] Spec [PRED 'very'] PRED 'tall' 'professor'

F-Struktur Spec Mod Subj PRED Qual [Det Indef] Spec [PRED 'very'] PRED 'tall' 'professor' PRED 'with' Obj Mod [PRED 'grey'] PRED 'hair' PRED 'write <(Subj)(Obj)>' Tense Past Obj Spec Mod PRED [ ] [PRED 'boring'] 'book'