Computerlinguistik Die Informationsgesellschaft von morgen gestalten Sprachen analysieren

  • Slides: 47
Download presentation
Computerlinguistik Die Informationsgesellschaft von morgen gestalten – Sprache(n) analysieren und verarbeiten mit dem Computer

Computerlinguistik Die Informationsgesellschaft von morgen gestalten – Sprache(n) analysieren und verarbeiten mit dem Computer Prof. Dr. Anette Frank Seminar für Computerlinguistik Universität Heidelberg www. cl. uni-heidelberg. de

Computerlinguistik – Was ist das? Google Translate Semanti c Web Meinten Sie: . .

Computerlinguistik – Was ist das? Google Translate Semanti c Web Meinten Sie: . . ? ? LEO Google Suche Rechtschreib -korrektur Diktiersysteme Maschinelle Sprachverarbeitung Computerlinguistik Sprachtechnologie

Computerlinguistik – Was ist das? Computerlinguistik ist ein junges Fach, das 1947 seinen Anfang

Computerlinguistik – Was ist das? Computerlinguistik ist ein junges Fach, das 1947 seinen Anfang nahm. . . Warren Weaver, Mathematiker, Translation (1949) Statistische Verfahren der Informationstheorie und Kryptographie als Modell für die automatische Übersetzung natürlicher Sprachen Chinesisch ist wie verschlüsseltes Englisch.

Computerlinguistik – Was ist das? . . . und das heute die moderne Gesellschaft

Computerlinguistik – Was ist das? . . . und das heute die moderne Gesellschaft mitgestaltet und prägt Sprachbasierte Internetsuche (Google, Yahoo, . . . ) Business Intelligence: Meinungen im WWW suchen e. Science: Fakten für Wissenschaft & Firmen e. Learning: Sprachlernprogramme und Wörter. Buch auf Knopfdruck Kommunikation mit Computern . . .

Faszination Sprache Von der Faszination, Sprache(n) zu analysieren und zu verarbeiten – die Natur,

Faszination Sprache Von der Faszination, Sprache(n) zu analysieren und zu verarbeiten – die Natur, Funktion und Diversität von Sprache(n) zu verstehen und formal zu modellieren – und diese Erkenntnisse für neue Aufgaben in der Wissenschaft und der IT-Gesellschaft nutzbar zu machen mit empirischen, formalen und informatischen Methoden

Sprache und Wissen Sprache: das Medium par excellence für die Übermittlung von Wissen Kognition

Sprache und Wissen Sprache: das Medium par excellence für die Übermittlung von Wissen Kognition und Wissen Situation Sprachen Dialogue Image Text

Sprache und Informatik Sprachdaten verarbeiten mit informatischen Methoden: Effizienz und automatisches Lernen Kognition und

Sprache und Informatik Sprachdaten verarbeiten mit informatischen Methoden: Effizienz und automatisches Lernen Kognition und Wissen Situation Sprachen Dialogue Image Text

Übersicht Computerlinguistik als Wissenschaft Berufsfelder Computerlinguistische Forschung Interdisziplinäre Forschung IT- und Sprachtechnologiefirmen, Verlage, .

Übersicht Computerlinguistik als Wissenschaft Berufsfelder Computerlinguistische Forschung Interdisziplinäre Forschung IT- und Sprachtechnologiefirmen, Verlage, . . . Computerlinguistik in HD Sollte ich Computerlinguistik studieren? Studiengänge Forschung und Lehre am SCL in Heidelberg

Computerlinguistik als Wissenschaft Linguistik Struktur von Sprache(n) Bedeutung Kommunikation Formale Modellierung Informatik & Mathematik

Computerlinguistik als Wissenschaft Linguistik Struktur von Sprache(n) Bedeutung Kommunikation Formale Modellierung Informatik & Mathematik Formale Sprachen Effiziente Algorithmen Statistik Computerlinguistik Spezielle Verfahren für die Sprachverarbeitung Datengetriebene statistische Lernverfahren

Computerlinguistik und Nachbardisziplinen Linguistik Informatik & Mathematik Computerlinguistik Kognitionswissenschaft Künstliche Intelligenz

Computerlinguistik und Nachbardisziplinen Linguistik Informatik & Mathematik Computerlinguistik Kognitionswissenschaft Künstliche Intelligenz

CL und Linguistik Formalisierung linguistischer Theorien Modellierung aller Sprachebenen: von Laut zu Bedeutung Formalisierung

CL und Linguistik Formalisierung linguistischer Theorien Modellierung aller Sprachebenen: von Laut zu Bedeutung Formalisierung der Struktur multipler Sprachen Empirische Validierung anhand von Korpora Linguistik Computerlinguistik

CL und Linguistik Formalisierung linguistischer Theorien Modellierung aller Sprachebenen: von Laut zu Bedeutung Formalisierung

CL und Linguistik Formalisierung linguistischer Theorien Modellierung aller Sprachebenen: von Laut zu Bedeutung Formalisierung der Struktur multipler Sprachen Empirische Validierung anhand von Korpora akustisches Signal (speech) geschriebener Text (text) Bedeutung (logische Form) Kognitiver Inhalt Johanna(x) buch(y) lesen(e, x, y) Johanna liest ein Buch.

Ambiguitäten auf allen Ebenen Phonologie Wreck a nice beach. – Recognize speech. Morphologie Time

Ambiguitäten auf allen Ebenen Phonologie Wreck a nice beach. – Recognize speech. Morphologie Time flies (V/N) like (V/P) an arrow. Syntax Der Mann sah die Frau mit dem Fernglas. – Wer hat das Fernglas? Semantik Jeder Holländer liebt eine Frau. Die Operation ist gelungen. – Medizin oder Militär? Diskurs Fritz und Maria fuhren nach Paris. Dort trafen/trennten sie sich.

Informatische und statistische Methoden Effiziente Algorithmen der Informatik Statistische Disambiguierung – Wahrscheinlichkeitsmodelle modellieren Erwartungen

Informatische und statistische Methoden Effiziente Algorithmen der Informatik Statistische Disambiguierung – Wahrscheinlichkeitsmodelle modellieren Erwartungen P(N|Art) > P(V|Art) These. ART measures. V/N. . . Informatik & Mathematik Computerlinguistik

Informatische und statistische Methoden Effiziente Algorithmen der Informatik Statistische Disambiguierung – Wahrscheinlichkeitsmodelle modellieren Erwartungen

Informatische und statistische Methoden Effiziente Algorithmen der Informatik Statistische Disambiguierung – Wahrscheinlichkeitsmodelle modellieren Erwartungen P(N|Art) > P(V|Art) – Häufige Nachbarwörter helfen, Bedeutungen zu ermitteln Quelle: Wortschatz Leipzig

CL und Künstliche Intelligenz Kann ein Computer Sprache verstehen? Bedeutung von Sprache in realen

CL und Künstliche Intelligenz Kann ein Computer Sprache verstehen? Bedeutung von Sprache in realen Situationen verstehen Schlussfolgern und Planen Wissen – Glauben – Planen im Dialog Computerlinguistik Künstliche Intelligenz

CL und Künstliche Intelligenz Kann ein Computer Sprache verstehen? Bedeutung von Sprache in realen

CL und Künstliche Intelligenz Kann ein Computer Sprache verstehen? Bedeutung von Sprache in realen Situationen verstehen Schlussfolgern und Planen Wissen – Glauben – Planen im Dialog Automatische Akquisition von Wissen Modellierung von Wissen in Ontologien (Semantic Web) Extraktion multilingualer Ontologien aus Wikipedia und Textkorpora Wissensbasierte Sprachgenerierung im Dialog

CL und Künstliche Intelligenz Kann ein Computer Sprache verstehen? Bedeutung von Sprache in realen

CL und Künstliche Intelligenz Kann ein Computer Sprache verstehen? Bedeutung von Sprache in realen Situationen verstehen Schlussfolgern und Planen Wissen – Glauben – Planen im Dialog Automatische Akquisition von Wissen Modellierung von Wissen in Ontologien (Semantic Web) Extraktion multilingualer Ontologien aus Wikipedia und Textkorpora Wissensbasierte Sprachgenerierung im Dialog

Kognitionswissenschaftliche Aspekte Kann CL Sprachverarbeitung simulieren? Empirische Validierung (computer)linguistischer Theorien Blickbewegungsmessung, EEG, f. MRT

Kognitionswissenschaftliche Aspekte Kann CL Sprachverarbeitung simulieren? Empirische Validierung (computer)linguistischer Theorien Blickbewegungsmessung, EEG, f. MRT Kognitive Korrelate von Wortbedeutungen? Computerlinguistik Kognitionswissenschaft

Übersicht Computerlinguistik als Wissenschaft Berufsfelder Computerlinguistische Forschung Interdisziplinäre Forschung IT- und Sprachtechnologiefirmen, Verlage, .

Übersicht Computerlinguistik als Wissenschaft Berufsfelder Computerlinguistische Forschung Interdisziplinäre Forschung IT- und Sprachtechnologiefirmen, Verlage, . . . Computerlinguistik in HD Sollte ich Computerlinguistik studieren? Studiengänge Forschung und Lehre am SCL in Heidelberg

Berufsfeld Forschung Entwicklung neuer Verfahren und Methoden Universitäten Forschungsabteilungen der (IT-)Industrie Google, Yahoo, Microsoft,

Berufsfeld Forschung Entwicklung neuer Verfahren und Methoden Universitäten Forschungsabteilungen der (IT-)Industrie Google, Yahoo, Microsoft, SAP, IBM, Telekom, Siemens, Daimler Klassische und neue Forschungsgebiete Frage-Antwort Systeme, Informationsextraktion Automatische Textzusammenfassung Maschinelle Übersetzung Wissensbasierte Textgenerierung in virtuellen Welten Erkennung von Meinungen und „Sentiment“ Erforschung kognitiver Korrelate für Wortbedeutungen

Interdisziplinäre Forschung e. Humanities CL für Geistes- und Sozialwissenschaften Formale Textanalyse und Korpuslinguistik für

Interdisziplinäre Forschung e. Humanities CL für Geistes- und Sozialwissenschaften Formale Textanalyse und Korpuslinguistik für Medienanalyse, Politik-, Literatur- und Sprachwissenschaften Zitationsanalyse in den Kulturwissenschaften Natürlichsprachliche Suche in Museen und Bibliotheken e. Science CL für Lebens- und Naturwissenschaften Text Mining Informationsextraktion aus wissenschaftlichen Arbeiten Namenserkennung in Chemie, Physik, . .

Sprachtechnologie in Firmen Kn tale. Adngaely. Esntgin aw Do issenschaften sw n e b

Sprachtechnologie in Firmen Kn tale. Adngaely. Esntgin aw Do issenschaften sw n e b e L n e d in g in in ne&r. Text Me hiee rc ra ie en sh ff T ri g e e B r m Speechino. Specialist logie und „Lerlagswuns g okikaolifo rsrch V s is R ie men r m fü u i g m n in a g in r M “ g A t g x f u. Spracherkennungse ü n T o f r b i r in a p u n ternatio fdruck n m r ngsanalyse –synthesesysteme p ultilinguale. Srprund e o l n h K c n a a f le u e. Lear Produkte innu WM ise se vnogn und buch a sbaseörter M er u im Call-Center, rs tf klch rk u iocle il. Eain im tw g n u. Automobil, a Genenrie. Lreuxnikga: das Wfürn. Behindertenhilfe lt. M von Produkt g vo „ n u KoÜbersetzungstechnologie l l n e t t r dokumentat s o r ll ie E r t e Sprache“ ionen Benutzeradaptive Diktiersysteme

IT-Gesellschaft von morgen gestalten Computerlinguistik

IT-Gesellschaft von morgen gestalten Computerlinguistik

Übersicht Computerlinguistik als Wissenschaft Berufsfelder Computerlinguistische Forschung Interdisziplinäre Forschung IT- und Sprachtechnologiefirmen, Verlage, .

Übersicht Computerlinguistik als Wissenschaft Berufsfelder Computerlinguistische Forschung Interdisziplinäre Forschung IT- und Sprachtechnologiefirmen, Verlage, . . . Computerlinguistik in HD Sollte ich Computerlinguistik studieren? Studiengänge Forschung und Lehre am SCL in Heidelberg

Computerlinguistik studieren Computerlinguistik betreiben heißt empirisch untersuchen, theoretisch verallgemeinern, ingenieurmäßige praktische Umsetzung Voraussetzungen für

Computerlinguistik studieren Computerlinguistik betreiben heißt empirisch untersuchen, theoretisch verallgemeinern, ingenieurmäßige praktische Umsetzung Voraussetzungen für ein erfolgreiches Studium der CL Interesse an formalem Problemlösen (z. B. Mathematik, Informatik) Interesse für Sprachen Analytisches Denken Es sind KEINE besonderen Vorkenntnisse erforderlich

Studiengänge Bachelor (B. A. ) 3 Jahre, 180 Leistungspunkte 75% HF 50% 2. HF

Studiengänge Bachelor (B. A. ) 3 Jahre, 180 Leistungspunkte 75% HF 50% 2. HF 25% NF 25% Inf. 25% NF 50% 1. HF 75% HF B. A. -Arbeit CL B. A. -Arbeit 1. HF Master (M. A. ) 2 Jahre, 120 Leistungspunkte 100% HF 80% HF (in Vorb. ) 20% NF M. A. -Arbeit CL 20% NF 80% HF M. A. -Arbeit HF

Studienaufbau B. A. Sem. 4 -5 Auslandssemester 6 Computerlinguistik Linguistik Informatik Bachelor-Arbeit, Abschlussprüfung Seminare

Studienaufbau B. A. Sem. 4 -5 Auslandssemester 6 Computerlinguistik Linguistik Informatik Bachelor-Arbeit, Abschlussprüfung Seminare und Vorlesungen (Wahlpflichtbereich) Softwareprojekt, Generierung, Informationsextraktion, Information Retrieval, Algorithmen & Datenstrukturen Grundlagenvorlesungen 1 -3 Logik, Math. Grundlagen, Statistik Syntax, Semantik, . . . Programmierung

Computerlinguistik in HD Grundsätze Praxisnahe Ausbildung Programmiertechnische Kenntnisse Seminare und Softwareprojekte: Verzahnung von Theorie

Computerlinguistik in HD Grundsätze Praxisnahe Ausbildung Programmiertechnische Kenntnisse Seminare und Softwareprojekte: Verzahnung von Theorie und Praxis Arbeiten im Team Berufspraktikum Einbindung in die Forschung Hilfskrafttätigkeit in Forschungsprojekten Vortragsreihen und „Forschungsseminare“ Forschungsorientierte Abschlussarbeiten

Unsere Umgebung in Forschung & Lehre Neuphilologische Fakultät Germanistik Anglistik Romanistik Slawistik Deutsch als

Unsere Umgebung in Forschung & Lehre Neuphilologische Fakultät Germanistik Anglistik Romanistik Slawistik Deutsch als Fremdsprache bieten Fachkombinationen in B. A. - und M. A. -Studiengängen Weitere Fachkombinationen: Psychologie, Sozial- und Politikwissenschaften, Ostasienwissenschaften, Sinologie, Japanologie, Informatik, . . .

Unsere Umgebung in Forschung & Lehre Computerlinguistik, Informatik(en), Mathematik European Media Lab Forschungsabteilung „Natural

Unsere Umgebung in Forschung & Lehre Computerlinguistik, Informatik(en), Mathematik European Media Lab Forschungsabteilung „Natural Language Processing“ Kooperation in Lehre, Forschung, Doktorandenausbildung Informatik(en) Software Engineering, Effiziente Algorithmen, Formale Sprachen, Datenbanken, Netzwerke, . . . Geoinformatik, Medizinische Informatik Interdisziplinäres Zentrum Wissenschaftliches Rechnen Optimierung, Clustercomputing, Bildverarbeitung, Robotik HGS: Mathematische und computergestützte Methoden für die Wissenschaft

Unsere Umgebung CL in der Metropolregion

Unsere Umgebung CL in der Metropolregion

Computerlinguistik in HD Multimodale multilinguale Sprach- u. Wissensverarbeitung Kognition und Wissen Situation Sprachen Dialogue

Computerlinguistik in HD Multimodale multilinguale Sprach- u. Wissensverarbeitung Kognition und Wissen Situation Sprachen Dialogue Text

Unsere Forschungsthemen Multilinguale Sprachverarbeitung Lexikalische Semantik und Wissensakquisition Ontologiebasierte Informationsextraktion Wissensbasierte Sprachgenerierung Diskursverarbeitung Synchrone

Unsere Forschungsthemen Multilinguale Sprachverarbeitung Lexikalische Semantik und Wissensakquisition Ontologiebasierte Informationsextraktion Wissensbasierte Sprachgenerierung Diskursverarbeitung Synchrone Generierung: Sprache & 3 D-Szenen e. Humanities: Exzellenzcluster „Asia and Europe“ Sprachverarbeitung für die Ritualforschung Quotationfinder Digitalisierung multilingualer Bibliographien

Si. GHTSee Generierung natürlichsprachlicher Navigationsanweisungen in 3 D-Simulationen Landmarks from Open Street Maps Heidelberg

Si. GHTSee Generierung natürlichsprachlicher Navigationsanweisungen in 3 D-Simulationen Landmarks from Open Street Maps Heidelberg 3 D: Alexander Zipf, Universität HD

Si. GHTSee Generierung natürlichsprachlicher Navigationsanweisungen in 3 D-Simulationen

Si. GHTSee Generierung natürlichsprachlicher Navigationsanweisungen in 3 D-Simulationen

Noch Fragen? Heute Infostand der Computerlinguistik Mitarbeiter und Studierende Fragen und Antworten rund ums

Noch Fragen? Heute Infostand der Computerlinguistik Mitarbeiter und Studierende Fragen und Antworten rund ums Fach & Studium Demos Informationsbroschüre Zu Hause Homepage: www. cl. uni-heidelberg. de Studienberatung und Sprechstunden studienberatung@cl. uni-heidelberg. de Fachschaft: fs-coli@cl. uni-heidelberg. de

Wir freuen uns auf Sie ! Bei der Computerlinguistik im Neuenheimer Feld

Wir freuen uns auf Sie ! Bei der Computerlinguistik im Neuenheimer Feld

Unser Team Professuren ? Anette Frank Computerlinguistik Stefan Riezler Linguistische Informatik z. Z. noch

Unser Team Professuren ? Anette Frank Computerlinguistik Stefan Riezler Linguistische Informatik z. Z. noch Google Inc. N. N. Computerlinguistik in Berufung

Unser Team Hochschulassistenten Matthias Hartung Simone Paolo Ponzetto M. A. Computerlinguistik Dr. phil. Computerlinguistik

Unser Team Hochschulassistenten Matthias Hartung Simone Paolo Ponzetto M. A. Computerlinguistik Dr. phil. Computerlinguistik ? ? N. N.

Unser Team Wissenschaftliche Mitarbeiter Nils Reiter Dipl. -Linguist Sascha Fendrich Dipl. -Mathematiker Eva Sourjikóva

Unser Team Wissenschaftliche Mitarbeiter Nils Reiter Dipl. -Linguist Sascha Fendrich Dipl. -Mathematiker Eva Sourjikóva M. A. Computerlinguistik

Unser Team Wissenschaftliche Mitarbeiter Michael Roth M. Sc. Computational Linguistics Stephanie Schuldes Anand Mishra

Unser Team Wissenschaftliche Mitarbeiter Michael Roth M. Sc. Computational Linguistics Stephanie Schuldes Anand Mishra (EMLR) (Klassische Indologie) M. A. Computerlinguistik M. Sc. Computer Science

Unser Team Privatdozenten und Lehrbeauftragte PD Dr. Karin Haenelt, Fraunhofer Institut, Darmstadt PD Dr.

Unser Team Privatdozenten und Lehrbeauftragte PD Dr. Karin Haenelt, Fraunhofer Institut, Darmstadt PD Dr. Kurt Eberle, Lingenio, Heidelberg Dr. Michael Herweg, IBM Deutschland Dr. Carsten Günther, Heidelberg mobil International Markus Klehr, Heidelberg mobil International, Heidelberg Claudia Kunze, M. A. Siemens Ulm Dr. Sebastian Rudolph, AIFB, Universität Karlsruhe Dr. Michael Strube, EML Research, Heidelberg Dr. Andreas Witt, Institut für Deutsche Sprache, Mannheim Dr. Andrea Zielinski, FIZ, Karlsruhe

Unser Team B. A. -Fachstudienberater Sascha Fendrich, Dipl. -Math. Studienberatung Beratung bei der Abfassung

Unser Team B. A. -Fachstudienberater Sascha Fendrich, Dipl. -Math. Studienberatung Beratung bei der Abfassung von Abschlussarbeiten ERASMUS-Programme

Unser Team Ressourcen-Manager Nils Reiter, Dipl. -Linguist Chef der Gruppe Resources & Tools Die

Unser Team Ressourcen-Manager Nils Reiter, Dipl. -Linguist Chef der Gruppe Resources & Tools Die “graue Eminenz” der Studienberatung Führt das Rockbüro

Unser Team Sekretariat Anke Sopka Systemadministration und „Gruppe Technik“ Markus Kirschner

Unser Team Sekretariat Anke Sopka Systemadministration und „Gruppe Technik“ Markus Kirschner

Sprache verstehen Come to see us at our information desk !

Sprache verstehen Come to see us at our information desk !