LFG als Interlingua in der maschinellen bersetzung Referat
LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05. 02. 2003
Interlingua • Ziel Eine Repräsentation soll Hierarchien von Substrukturen abbilden, dabei jedoch klare Zwischenbeziehungen zeigen. • gewünschtes Ergebnis Eine Repräsentation des Textes, die unabhängig von einer Einzelsprache existiert (= Basis für die Generierung des zielsprachigen Textes). • Nachteile Analyse und Generierung müssen streng getrennt sein Während der Generierung ist es nicht möglich, auf den Originaltext zurückzugreifen.
strukturelle Repräsentation in den Interlingua-Systemen • Propositionale Logik • Any government is dependent on its supporters. – All(X), government (X), indefinite (Y), plural (Y), support (Y, X, T), depend on (X, Y, T), timeless (T) • Wertung – Problemlose Analyse, Generierung beinahe unmöglich, da keine syntaktische Information vorhanden. • Lösungen: „multilingual paraphrasing“ – Every governmet has supporters which it depends on. – People who support all governments are depended on by them. – All governments depend on people who support them.
strukturelle Repräsentation in den Interlingua-Systemen • LFG • Zusammenfassung mehrerer Sprachen beim gleichzeitigen Ausgleich deren Unterschiede.
lexikalische Repräsentation in den Interlingua-Systemen • Konzepte • sprachunabhängige lexikalische Einheiten • „meanings derived from the process of understanding of texts“ • Text (sein linguistischer Inhalt), über Phänomene (Einheiten, Aktionen, Begebenheiten) außerhalb des Textes (außersprachliche Realität)
Definition von Interlingua • Eine Interlingua ist keine Sprache in herkömmlichen Sinne, sondern eine Art der Repräsentation (der Struktur). • Üblicherweise wird sie gezielt bei ausgewählten Sprachpaaren oder bei mehreren verwandten Sprachen angewandt.
Die Interlingua-Grammatiken • Generative Transformationsgrammatik (Chomsky, seit 1955) – 50. -90. Jahre – Oberflächenstruktur vs. Tiefenstruktur – Transformationen, die eine TS in eine OS überführen – Die Annahme, dass es sich um eine sprachunabhängige Basis für die semantische Interpretation handelt, hat sich nicht bestätigt.
Die Interlingua-Grammatiken • 2. Kasusgrammatik (Fillmore, 1968) – Vermutung, dass die Repräsentationen der Kasusstruktur die Syntaxuniversalien abbilden – oft benutzt worden in bilingualen transfer-basierten Systemen (z. B. Japanisch) – Problem: Kasusrollen nicht standardisiert („no widely agreed set of case relations“)
Maschinelle Übersetzung mit LFG • 70. Jahre (Bresnan, Kaplan) • als Kritik an GTG • zwei Ebenen der syntaktischen Repräsentation – C-Struktur (constituent-structure) – F-Struktur (functional-structure) • werden erzeugt über die Phrasenstrukturregeln • zusätzlich – Funktionen (als Grundbegriffe) – Lexikoneinträge (mit lexikalischen Regeln)
C-Struktur und F-Struktur • Beispiel
C-Struktur und F-Struktur • C-Struktur – Phrasenstrukturbaum – geordnete Aufstellung der Wörter und Phrasen des Satzes – kontextfreie Notation • F-Struktur – hierarchische Funktion – enspricht den grammatischen Funktionen (S, O, etc. ) – umfaßt auch morphosyntaktische Merkmale (Case, Num, Tense)
Transfer mit F-Strukturen • Einlesen des Quellsprachensatzes (Parser) • Ergebnis ist/sind F-Struktur(en) der Quellsprache • Übersetzung der F-Struktur(en) mithilfe von – Transfer-Lexikon (inkl. Subkategorisierung) – Top-Down-Verfahren • Ergebnis ist/sind F-Struktur(en) der Zielsprache • Generieren der Oberfläche (Generator)
Top down beim Transfer mit F-Strukturen • Suche von PRED (zunächst das vom Wurzelknoten dominierte PRED) • Überfprüfung der Valenz in der vorliegenden FStruktur • Suche vom Eintrag mit der gleichen Valenz • Eintrag = Grundlage für die F-Struktur der Zeilsprache • anschl. PRED der nächste niedrigen Stufe wird gesucht
Transfer mit F-Strukturen • Beispiel
Funktionen in der LFG • Description-by-analysis – Die Struktur kann nur diejenigen Eigenschaften haben, die aus der Information abgeleitet wurde, die in der vorliegenden Struktur explizit identifiziert wurde. • Codescription – Diese Beschreibungen lassen zu, dass die endgültige Struktur Eigenschaften hat, die in der F -Struktur nicht vorhanden sein können.
Funktionen in der LFG • Funktionen signalisieren das Überführen der Strukturen in andere Strukturen (z. B. von CStrukturen zu F-Strukturen, von F-Strukturen zu semantischen Strukturen).
Vorgehensweise bei der MÜ mit LFG (Stufe 2) • Die Beschreibung der zielsprachigen Strukturen ist von den quellsprachigen Strukturen mittels Analyse und Codescription abgeleitet. • Dabei werden zusätzliche Vermerke auf der Basis der C-Strukturen und der lexikalischen Einheiten gemacht. • Dies dient als Input für die Generierung der zielsprachigen Version.
Beispiel für die Leistungsfähigkeit • The student is likely to work. • Il est probable que l´etudiant travaillera.
Beispiel für die Leistungsfähigkeit • Berücksichtigung der Tempuskonkordanz
Fazit des Ansatzes von Kaplan • „an approach to machine translation that exploits the potential of simultaneous correspondences between different levels of linguistic representation“ • it allows „partial specification“ and „multi-leveltransfer“
Kommerzielle Nutzung • XLE (Xerox Linguistic Environment) – Xerox Palo Alto Research Center in California – Xerox Research Center in Europe (Grenoble) – Institut für maschinelle Sprachverarbeitung (Stuttgart) • FUJITSU (Japan) • NEC (Japan)
- Slides: 21