Abfragen aus einer Sprachdatenbank Jonathan Harrington Aufbau Funktion
Abfragen aus einer Sprachdatenbank Jonathan Harrington
Aufbau & Funktion von Sprachdatenbanken Erstellung Praat, EMU Abfrage EMU Digitale Zeitsignale akustisch, artikulatorisch Signale Signalverarbeitung Die Signale davon Etikettieren Verknüpfung mit Symbolen Etikettierung abgeleitete Signale (z. B. spektrale Daten) Abfrage Eine Segmentliste Abfrage Analyse R
Der Kern einer Abfrage Welche Ebene? Phonetik Welche Einheiten? = u: (Alle ‘u: ’ Einheiten der Phonetik Ebene) Wort = Duden (Alle ‘Duden’ Einheiten der Wort Ebene)
Welche Ebene? Phonetic Welche Einheiten? = u: Findet Nicht nur in dieser Äußerung sondern in der gesamten Sprachdatenbank. . .
Das Ergebnis einer Abfrage ist eine Segmentliste Etikettierung Startzeit Endzeit Äußerung
Beziehung: Segmentliste und Signale
Wie wird eine Abfrage durchgeführt? Database operations -> Query database
* wav bedeutet: alle Äußerungen mit dieser Extension abfragen *01* lab wäre: alle Äußerungen mit Extension. lab abfragen, die 01 in der Dateiname enthalten Alle "i: " Einheiten der Phonetic-Ebene
Das Ergebnis ist eine Segmentliste Als Text-Datei speichern: File -> Save, dann n. txt, in eigene Dateien (n ist ein beliebiger Name).
Die Text-Datei
Verbindung zur R-Programmiersprache starten > library(emu) angenommen, die Text-Datei ist n. txt und befindet sich in eigene Dateien > read. emusegs("H: /n. txt") Read 6 items Read 2 records segment list from database: timetable query was: Phonetic = i labels start end utts 1 i: 3605. 31 3742. 19 HPTE 003 2 i: 4505. 50 4565. 19 HPTE 003
Oder die Abfrage direkt in R mit der emu. query() Funktion durchführen emu. query("timetable", "*", "Phonetic=i: ") Welche Sprachdatenbank? Welche Äußerungen? Welche Abfrage? Siehe S. 8
1. Query database 2. Graphical query
Beziehung zwischen Graphical Query und Etikettierungen
u: Phonetic (Alle ‘u: ’ Einheiten der Phonetic Ebene)
* wav bedeutet: alle Äußerungen mit dieser Extension abfragen *01* lab wäre: alle Äußerungen mit Extension. lab abfragen, die 01 in der Dateiname enthalten
Ergebnis: Segmentliste save (Dateiname aussuchen)
Aufgabe Eine Textdatei aller ‘Duden’ Einheiten der Word-Ebene speichern Ergebnis
Weitere Abfragen 1. Abfragen aus einer Ebene 1. 1 Kernfragen Einfach: [u: ] Einheiten der Phonetik Ebene Mehrere Einheiten: [u: ] und [i: ] Einheiten der Phonetik Ebene Einheiten außer irgendwelchen Einheiten Alle Einheiten außer Duden und Diele der Wort Ebene 1. 2 Reihenfolge (NB aus einer Ebene) /b/ Phoneme vor /i: / Phonemen (also /b/ in /bi: /) ‚Duden‘ der Word Ebene gefolgt von ‚ist‘ der Word Ebene (also Reihenfolgen von ‚Duden ist‘) 2. Abfragen aus mehreren Ebenen /u: / Phoneme in starken Silben /u: / und /i: / Phoneme vor /g/ Phoneme in starken Silben
1. 1 Kernfragen Mehrere Einheiten Alle Einheiten außer einer/mehreren Einheiten
1. 2 Reihenfolge (NB aus einer Ebene) /g i: / Phoneme
2. Abfragen aus mehreren Ebenen H-Phonetic Einheiten in /d/ Phonemen in L-Einheiten der Type Ebene
H-Phonetic Einheiten in /d/ Phonemen in L-Einheiten der Type Ebene Ergebnis
H Einheiten in /d/ Phonemen in Wörtern von Type L
/d/ Phoneme in Wörtern von Type L, die H Phonetic Einheiten dominieren Phoneme Einheiten
/d/ Phoneme in Wörtern von Type L, die H Phonetic Einheiten dominieren
Fragen: siehe http: //www. phonetik. uni-muenchen. de/~jmh/ Lehre > Seminar EMU R > Query Übung
- Slides: 28