Def Computerlinguistik Computerlinguistik wissenschaftlichen theoretischen Sinne ist ein

  • Slides: 21
Download presentation
Def. : „Computerlinguistik“ Computerlinguistik wissenschaftlichen („theoretischen“) Sinne ist ein Teilgebiet der modernen Linguistik, das

Def. : „Computerlinguistik“ Computerlinguistik wissenschaftlichen („theoretischen“) Sinne ist ein Teilgebiet der modernen Linguistik, das berechenbare Modelle menschlicher Sprache entwirft, implementiert und untersucht. Computerlinguistik im technischen Sinne ist ein zwischen Linguistik und Informatik liegendes interdisziplinäres Forschungsgebiet, das sich mit der maschinellen Verarbeitung natürlicher Sprachen beschäftigt.

Theorie vs. Anwendung Theoretische Computerlinguistik entwirft, implementiert und untersucht die Modelle mit dem Ziel,

Theorie vs. Anwendung Theoretische Computerlinguistik entwirft, implementiert und untersucht die Modelle mit dem Ziel, zum Verständnis, zur Verifikation und zur Verbesserung der zugrundeliegenden linguistischen und psychologischen Theorien beizutragen. Angewandte („Technische“)Computerlinguistik entwirft, implementiert und untersucht die Modelle mit dem Ziel, Softwareanwendungen zu ermöglichen, die über eine (eingeschränkte) Beherrschung menschlicher Sprache verfügen.

Def. : „Linguistik“ „Die Linguistik ist eine "moderne", synchron orientierte, auf die interne Struktur

Def. : „Linguistik“ „Die Linguistik ist eine "moderne", synchron orientierte, auf die interne Struktur der Sprache bezogene Wissenschaft, die sprachliche Regularitäten auf allen Beschreibungsebenen untersucht und ihre Ergebnisse in explizierter (formalisierter) Beschreibungssprache und in integrierten Modellen darlegt“. (H. Bußmann "Lexikon der Sprachwissenschaft")

Teilbereiche der Linguistik Beschreibungs ebenen • Phonetik • Phonologie • Morphologie • Syntax •

Teilbereiche der Linguistik Beschreibungs ebenen • Phonetik • Phonologie • Morphologie • Syntax • Semantik • Pragmatik • Textlinguistik • Diskurstheorie • • Teildisziplinen Psycholinguistik Neurolinguistik Kontrastive Linguistik Historische Linguistik Sozio- und Ethno linguistik, Dialektologie Mathematische Linguistik Computerlinguistik

Kompetenz vs. Performanz Sprachliche Kompetenz: die endliche strukturierte Wissensbasis, die es den Sprechern einer

Kompetenz vs. Performanz Sprachliche Kompetenz: die endliche strukturierte Wissensbasis, die es den Sprechern einer Sprache ermöglicht, die wohlgeformten Äußerungen der Sprache zu generieren und zu interpretieren. Sprachliche Performanz: die Generierung oder Interpretation realer Äußerungen, bzw. die Gesamtheit der Prozesse, die beteiligt sind, wenn der Mensch auf der Basis der sprachlichen Kompetenz reale Äußerungen verwendet.

Wie verstehen wir Sprache?

Wie verstehen wir Sprache?

Probleme der Computerlinguistik (1) • Bestimmen der Wortbedeutung. Die gleiche Wortform kann je nach

Probleme der Computerlinguistik (1) • Bestimmen der Wortbedeutung. Die gleiche Wortform kann je nach Kontext eine andere Bedeutung aufweisen (vergleiche Homonym). Man muss die für den Kontext zutreffende Bedeutung auswählen. Auf der anderen Seite braucht man Formalismen zur Repräsentation von Wortbedeutungen. • Syntaktische Mehrdeutigkeit: In einigen Fällen lässt sich ein Satz auf mehrere Arten analysieren und deuten. Die Richtige auszuwählen erfordert semantische Information über den Sprechakt und die Intention der Sprecher. – Beispiel: "Peter sah Maria mit dem Fernglas" - hier ist für einen Computer nicht zwangsläufig klar, ob Peter Maria gesehen hat, die ein Fernglas in der Hand hielt, oder ob Peter Maria mit Hilfe des Fernglases sehen konnte.

Probleme der Computerlinguistik (2) • Manche Sätze sind nicht wörtlich zu verstehen: Beispielsweise erwartet

Probleme der Computerlinguistik (2) • Manche Sätze sind nicht wörtlich zu verstehen: Beispielsweise erwartet man auf die Frage "Können Sie mir bitte das Salz reichen? " nicht die Antwort "Ja" oder "Nein" (vergleiche Pragmatik). • Ein anderes Beispiel: Falls ein Kurs im letzten Jahr nicht angeboten wurde, dann ist die korrekte Antwort auf die Frage "Wie viele Studenten haben den Kurs im letzten Jahr bestanden? " nicht "keine", sondern "Der Kurs wurde im letzten Jahr nicht angeboten".

Zentrale Begriffe: Ambiguität(1) • phonetische Ambiguität (Homophone) Boot - bot • orthographische Ambiguität (Homographen)

Zentrale Begriffe: Ambiguität(1) • phonetische Ambiguität (Homophone) Boot - bot • orthographische Ambiguität (Homographen) • übersetzen - übersetzen • lexikalische Ambiguität (Homonyme) Bank - Bank • morphologische Ambiguität Staubecken - Staubecken

Ambiguität (2) • syntaktische Ambiguität Peter fuhr seinen Freund sturzbetrunken nach Hause. Visiting relatives

Ambiguität (2) • syntaktische Ambiguität Peter fuhr seinen Freund sturzbetrunken nach Hause. Visiting relatives can be boring. Ich traf den Sohn des Nachbarn mit dem Gewehr. Der Jäger verfolgte den Hirsch mit dem Fernrohr. • kompositionell-semantische Ambiguität Die zwei Mitarbeiter müssen vier Sprachen beherrschen. • pragmatische Ambiguität Das ist aber kalt hier. (Festst. , Aufford. , Klage)

Strukturbaum(1)

Strukturbaum(1)

Strukturbaum(2)

Strukturbaum(2)

Syntaktische Disambiguierung • Der Jäger verfolgte den Hirsch mit dem Fernrohr. • Der Hirsch

Syntaktische Disambiguierung • Der Jäger verfolgte den Hirsch mit dem Fernrohr. • Der Hirsch verfolgte den Jäger mit dem Fernrohr. • Der Frau verfolgte den Mann mit dem Fernrohr. • Die Frau verfolgte die Amöbe mit dem Mikroskop.

Analyserichtungen paradigmatische vs. syntagmatische Perspektive – paradigmatic vs. syntagmatic analysis The butler killed liked

Analyserichtungen paradigmatische vs. syntagmatische Perspektive – paradigmatic vs. syntagmatic analysis The butler killed liked loved adored hated kissed the dairy maid. syntagmatische Ebene, syntagmatische Beziehungen zwischen Elementen = Elemente, die im Satz aufeinander folgen paradigmatische Ebene, paradigmatische Beziehungen zwischen Elementen = Elemente, die in einem Kontext formal gegeneinander austauschbar sind

Allgemeine Aspekte • das sprachliche Zeichen (linguistic sign) nach Ferdinand de Saussure: concept image

Allgemeine Aspekte • das sprachliche Zeichen (linguistic sign) nach Ferdinand de Saussure: concept image acoustique signifié signifiant ‚ ’ arbre signified, thought, concept, content, Bezeichnetes, Signifikat, Inhalt(saspekt), ideelle Seite signifier, form, Bezeichnendes, Signifikant, Form(aspekt), materielle Seite, Lautbild

Semiotische Grundlagen Zeichentypen in der Semiotik: • Ikon, ikonisches Zeichen – icon, iconic sign

Semiotische Grundlagen Zeichentypen in der Semiotik: • Ikon, ikonisches Zeichen – icon, iconic sign Beziehung zwischen Bezeichnendem und Bezeichnetem: Ähnlichkeit z. B. Piktogramme • Index, indexikalisches Zeichen – index, indexical sign Beziehung zwischen Bezeichnendem und Bezeichnetem: Kausalität z. B. Rauch als Index für Feuer • Symbol, symbolisches Zeichen – symbol, symbolic sign Beziehung zwischen Bezeichnendem und Bezeichnetem: Arbitrarität z. B. die meisten sprachlichen Zeichen

Das semiotische Dreieck : concept, thought = Saussures signifié re fe rs s e

Das semiotische Dreieck : concept, thought = Saussures signifié re fe rs s e lis bo m y to s form, symbol = Saussures signifiant stands for referent (an imputed relation) Referent (in der außersprachlichen Wirklichkeit) Ogden, Charles K. , & Ivor A. Richards (1949), The meaning of meaning, 10 th ed. (1 st ed. 1923), London: Routledge & Kegan Paul.

Linguistische Grundlagen(1) Semantische Merkmale – semantic features: man woman child [+ HUMAN] bull cow

Linguistische Grundlagen(1) Semantische Merkmale – semantic features: man woman child [+ HUMAN] bull cow calf [+ BOVINE] stallion mare foal [+ EQUINE] [+ MALE] [- MALE] [+ ADULT] [± MALE] [- ADULT] [+ HUMAN] [- HUMAN] [+ ANIMATE]

Linguistische Grundlagen (2) Semantische Merkmale – semantic features • • • woman: stallion: calf:

Linguistische Grundlagen (2) Semantische Merkmale – semantic features • • • woman: stallion: calf: [+ ANIMATE] [+ HUMAN] [- MALE] ([+ FEMALE]) [+ ADULT] [+ ANIMATE] [- HUMAN] ([+ EQUINE]) [+ MALE] [+ ADULT] [+ ANIMATE] [- HUMAN] ([+ BOVINE]) [± MALE] [- ADULT]