Programmierkurs fr absolute Anfnger Perl Praat bash Caren
Programmierkurs für absolute Anfänger Perl, Praat & bash Caren Brinckmann Sommersemester 2005 http: //www. coli. uni-saarland. de/~cabr/teaching. php Sprachsynthese - Ein Überblick
Motivation l stupide Arbeiten dem Computer überlassen l weniger Zeit und konsistenter als von Hand l Wiederholungen / Änderungen / Fehlerbehebung leicht möglich l Arbeiten mit großen Datenmengen möglich Sprachsynthese - Ein Überblick 1
Beispiele l l Intonationsuntersuchung: Wörter aus der Datenbank CELEX heraussuchen, die nur aus stimmhaften Lauten bestehen Perzeptionsexperiment n n l l "pieps" vor wav-Dateien einfügen Ausgabedaten von SCAPE für statistische Analyse umformatieren Produktionsexperiment: Daten mit Praat labeln, Werte in tabellarischer Form ausgeben und für statistische Analyse umformatieren Analyse eines annotierten Korpus: n n durchschnittliche Dauerwerte aller Laute Häufigkeiten von Tilgungen und Ersetzungen Programmierkurs für absolute Anfänger – Sitzung 1 2
Ziele l l l l programmiertechnische Grundkonzepte verstehen Aufgaben strukturiert analysieren und als Algorithmus formulieren können einfache Programme selbst schreiben können klaren Programmierstil aneignen Fehler suchen und finden fremde Programme verstehen und verändern können selbstständig weiterlernen können Programmierkurs für absolute Anfänger – Sitzung 1 3
Kursinhalt l Sprachen n Schwerpunkt: Perl w höhere Programmiersprache w sehr gut geeignet für die Verarbeitung von großen Textmengen n n l Praat-Skripte: automatisierte Analyse von Sprachdateien Shell-Skripte (bash): Wiederholung von UNIX-Befehlen Daten n CELEX: lexikalische Datenbank (Deutsch, Englisch, Niederländisch) mit Informationen über w Aussprache mit Silbengrenzen w Morphologie und Syntax w Worthäufigkeit n Kiel Corpus: gelesene und spontane Sprachdaten w segmentelle und prosodische Annotation Programmierkurs für absolute Anfänger – Sitzung 1 4
Vorstellungsrunde l l Name und Studienfächer? Vorwissen: n n n l l Programmiererfahrung? Windows/Unix-Kenntnisse? Praat? Motivation: was würdest Du gerne können? Erwartungen, Wünsche? Programmierkurs für absolute Anfänger – Sitzung 1 5
Organisatorisches l l Di: Vorlesung (5. 09) Fr: Übung (5. 08) Besprechung der bearbeiteten Übungsaufgaben Ausgabe der neuen Übungsaufgaben CIP-Pool (5. 08): Einloggen unter Linux und unter Windows möglich? Wenn nicht Systemgruppe eigene e-mail Adresse schicken an: cabr@coli. uni-sb. de Programmierkurs für absolute Anfänger – Sitzung 1 6
Scheinerwerb (1) l l regelmäßige Anwesenheit: max. 2 Vorlesungen und 2 Übungen verpassen Übungsaufgaben n l 2 schriftliche Kurztests im Laufe des Semesters n n l 1 Woche Bearbeitungszeit Bearbeitung zu zweit! Abgabe per e-mail (cabr@coli. uni-sb. de) Termine werden rechtzeitig bekanntgegeben Minimum: 50% der Gesamtpunktzahl über beide Tests Abschlussaufgabe n n kleines, abgegrenztes Projekt eigene Vorschläge möglich Bearbeitung zu zweit! Programmierung + Dokumentation Programmierkurs für absolute Anfänger – Sitzung 1 7
Scheinerwerb (2) Endnote: l Übungsaufgaben: l Kurztests: l Abschlussaufgabe: 40% 20% 40% Fragen? Programmierkurs für absolute Anfänger – Sitzung 1 8
Einführendes Beispiel Daten: g 40 u: 156 t 65 @ 52 n 80 t 72 a: 267 k 91 Aufgabe: Algorithmus, der die Dauer der Äußerung berechnet 1. lies aus der Eingabedatei die Dauerwerte ein 2. summiere die Einzeldauern auf 3. gib die Summe aus Eingabe Verarbeitung Programmierkurs für absolute Anfänger – Sitzung 1 Ausgabe 9
Was ist ein Algorithmus? l Bearbeitungsvorschrift, die aus elementaren Grundschritten besteht: n n n Lesen Schreiben arithmetische Operation Vergleichen Springen l liefert auf eine eindeutig festgelegte Weise zu jeder vorgegebenen Eingabe in endlich vielen Schritten eine Ausgabe l jedes Programm führt mindestens einen Algorithmus aus Programmierkurs für absolute Anfänger – Sitzung 1 10
Flussdiagramm: Gesamtdauer START Datei öffnen gesamtdauer : = 0 lies die nächste Zeile nein alle Zeilen gelesen? Zeile aufteilen in Einzelelemente: nenne 1. Wert einzellaut nenne 2. Wert einzeldauer ja Ausgabe gesamtdauer Datei schließen STOP gesamtdauer : = gesamtdauer + einzeldauer Programmierkurs für absolute Anfänger – Sitzung 1 11
Elemente von Flussdiagrammen Grenzstelle START STOP Verzweigung Ein-/Ausgabe (Lesen/Schreiben) Übergangsstelle allgemeine Operation Ablauflinien Programmierkurs für absolute Anfänger – Sitzung 1 12
Beispiel: Durchschnittsdauer START Datei öffnen gesamtdauer : = 0 anzahl_laute : = 0 lies die nächste Zeile nein alle Zeilen gelesen? Zeile aufteilen in Einzelelemente: nenne 1. Wert einzellaut nenne 2. Wert einzeldauer gesamtdauer : = gesamtdauer + einzeldauer anzahl_laute : = anzahl_laute + 1 ja durchschnittsdauer : = gesamtdauer / anzahl_laute Ausgabe durchschnittsdauer Datei schließen STOP Programmierkurs für absolute Anfänger – Sitzung 1 13
Beispiel: Durchschnittsdauer von 't' START Datei öffnen gesamtdauer_t : = 0 anzahl_laute_t : = 0 lies die nächste Zeile nein alle Zeilen gelesen? Zeile aufteilen in Einzelelemente: nenne 1. Wert einzellaut nenne 2. Wert einzeldauer einzellaut = 't' ? ja durchschnittsdauer_t : = gesamtdauer_t / anzahl_laute_t Ausgabe durchschnittsdauer_t nein Datei schließen STOP ja gesamtdauer_t : = gesamtdauer_t + einzeldauer anzahl_laute_t : = anzahl_laute_t + 1 Programmierkurs für absolute Anfänger – Sitzung 1 14
Beispiel: Durchschnittsdauer aller Dateien in einem Verzeichnis START Verzeichnis öffnen durchschnittsdauer : = gesamtdauer / anzahl_dateien Ausgabe durchschnittsdauer Verzeichnis schließen STOP gesamtdauer : = 0 anzahl_dateien : = 0 ja alle Dateien verarbeitet? nein verarbeite nächste Datei mit Unterprogramm "gesamtdauer" nenne Rückgabewert gesamtdauer_datei gesamtdauer : = gesamtdauer + gesamtdauer_datei anzahl_dateien : = anzahl_dateien + 1 Programmierkurs für absolute Anfänger – Sitzung 1 15
Übung Daten: g 40 u: 156 t 65 @ 52 n 80 t 72 a: 267 k 91 Aufgaben: Flussdiagramm für ein Programm, das 1) den längsten Laut und seine Dauer ausgibt a: 267 2) die maximale Dauer von 't' ausgibt 72 Programmierkurs für absolute Anfänger – Sitzung 1 16
Höhere Programmiersprachen (1) l l erlauben strukturierte Beschreibung von Algorithmen der "Quellcode" eines Programms wird automatisch in entsprechende Maschinenbefehle übersetzt: n kompilierte Sprachen, z. B. C, C++ Quellcode Compiler lauffähiges Binary w Vorteil: kompilierte Programme sind sehr schnell w Nachteil: maschinenabhängig n Skriptsprachen oder interpretierte Sprachen, z. B. bash, Praat. Skriptsprache: Interpreter führt den Quellcode direkt aus w Vorteil: maschinenunabhängig, Übersetzungsschritt fällt weg w Nachteil: langsamer n interpretative Sprachen und virtuelle Maschinen, z. B. Perl, Java: Mischform von Compiler und Interpreter Programmierkurs für absolute Anfänger – Sitzung 1 17
Höhere Programmiersprachen (2) l imperativ-prozedural: Pascal, Basic, Perl, Skriptsprachen Ø Ø Ø l objektorientiert: C++, Java Ø l klassische Aufgabenstellung: Eingabe, Verarbeitung, Ausgabe "wie? ": Weg zur Lösung = Folge von Operationen Hauptprogramm mit Unterprozeduren Zusammenfassung von Daten und auf diesen Daten operierenden Algorithmen zu Objekten deklarativ: Lisp, Prolog 1. "was? ": Beschreibung was berechnet werden soll, nicht wie diese Rechnung durchzuführen ist Programmierkurs für absolute Anfänger – Sitzung 1 18
Syntax & Semantik l Þ Syntax: Die Programme müssen der fest vorgeschriebenen Grammatik der jeweiligen Programmiersprache gehorchen Quellcode muss syntaktisch korrekt sein, damit er vom Compiler. Interpreter übersetzt werden kann Beispiel (Perl): $z=$x+$y; $z=$x plus $y; ## syntaktisch korrekt ## syntaktisch falsch Semantik: Bedeutung des jeweiligen programmiersprachlichen Konstrukts was bewirkt es, wenn es ausgeführt wird Þ Programme können syntaktisch korrekt sein, aber semantisch falsch! l Programmierkurs für absolute Anfänger – Sitzung 1 19
Sprachelemente imperativ-prozeduraler Programmiersprachen (1) l sequenzielle Ablauforientierung: Ø Ø l Konstante: Ø l Objekt mit einem Wert, der sich über die ganze Programmablaufzeit nicht ändert Variable: Ø Ø Ø l Anweisungen werden nacheinander ausgeführt Anweisungen erzeugen oder verändern Werte Objekt, das während des Programmablaufs beliebig oft seinen Wert ändern kann hat immer einen festen Namen Typisierung: in vielen Sprachen haben Variablen einen Typ, z. B. dürfen sie nur Zahlen oder Zeichen enthalten Feld / Array / Vektor: Ø Ø Liste von durchnummerierten Variablen, z. B. dauer 0, dauer 1, dauer 2 Felder fangen in vielen Programmiersprachen mit Index 0 an! Programmierkurs für absolute Anfänger – Sitzung 1 20
Sprachelemente imperativ-prozeduraler Programmiersprachen (2) l Operator: Ø Ø l Ausdruck: Ø l erzeugt aus einem oder zwei Werten (= Operanden) einen neuen Wert unäre Operatoren haben einen Operanden, z. B. -2 binäre Operatoren haben zwei Operanden, z. B. 2 * 3 Präzedenz von Operatoren im Zweifelsfall Klammern setzen, z. B. (4 * 3) + 10 besteht aus Konstanten, Variablen und Operatoren, z. B. $x + $y (addiert die Werte der Variablen $x und $y) Zuweisung: Ø Ø setzt den Wert einer Variablen auf den Wert eines Ausdrucks, z. B. $z = $x + $y Achtung: Vergleich (==) vs. Zuweisung (=) Programmierkurs für absolute Anfänger – Sitzung 1 21
Kontrollstrukturen l Verzweigung / bedingte Anweisung Ø Ø l prüft, ob eine bestimmte Aussage wahr ist sie wahr, wird ein bestimmter Programmteil ausgeführt, sonst ein anderer (oder nichts) Schleifen Ø ein bestimmter Programmteil wird mehrmals durchlaufen, solange oder bis eine bestimmte Aussage wahr ist Programmierkurs für absolute Anfänger – Sitzung 1 22
Prozeduren und Funktionen 1. Strukturierung und Teamarbeit l Prozedur: Unterprogramm, das für sich alleine lauffähig ist, und das beliebig oft wiederverwendet werden kann 1. Funktion: Prozedur, die nach Beendigung ihrer Arbeit zusätzlich einen Wert zurückliefert 2. Funktionen und Prozeduren können Parameter haben, d. h. Eingabedaten, mit denen sie arbeiten Programmierkurs für absolute Anfänger – Sitzung 1 23
Wahrheitswerte l l Überprüfung einer Aussage auf ihren Wahrheitsgehalt, z. B. einzellaut = 't' Aussage hat einen Wahrheitswert Kodierung von Wahrheitswerten: n n l 0 = falsch 1 = wahr logische Operatoren: nicht, oder, und A nicht A A B A oder B A und B 0 1 0 0 1 1 0 1 0 1 1 Programmierkurs für absolute Anfänger – Sitzung 1 24
komplexe Aussagen l Präzedenz der logischen Operatoren: n n n l nicht hat eine höhere Präzedenz als und hat eine höhere Präzedenz als oder "Gurken sind rot und 5 ist gerade oder Juli ist ein Sommermonat" "Gurken sind rot und (5 ist gerade oder Juli ist ein Sommermonat)" Übung: wahr oder falsch? n n n n 4 ist ungerade oder Juli ist ein Sommermonat 4 ist ungerade und Juli ist ein Sommermonat 7 ist ungerade und 3 mal 5 ist 15 nicht 4 ist gerade 3 plus 4 ist 7 oder 7 ist ungerade und 3 mal 5 ist 17 (3 plus 4 ist 7 oder 7 ist ungerade) und 3 mal 5 ist 17 nicht (4 ist ungerade oder Juli ist ein Sommermonat) nicht 4 ist ungerade und Juli ist ein Sommermonat Programmierkurs für absolute Anfänger – Sitzung 1 25
zum Nachlesen l Ziegler, Joachim (2002): Programmieren lernen mit Perl. Kapitel 1. Berlin: Springer. Þ im Handapparat in der Bibliothek Programmierkurs für absolute Anfänger – Sitzung 1 26
- Slides: 27