Formale Sprachen Teil 3 Klaus Becker 2006 2

Formale Sprachen Teil 3 Klaus Becker 2006

2 Syntax und Semantik

3 Teil 1 Mini-Programmiersprache

4 Zielsetzung Ziel ist es, für eine einfache Programmiersprache einen Interpreter und einen Compiler zu entwickeln. Die hier betrachtete Programmiersprache orientiert sich an der Sprache zur Steuerung des Roboters Karol. hinlegen schritt wiederhole solange Nicht. Ist. Ziegel wiederhole solange Nicht. Ist. Wand schritt *wiederhole links. Drehen *wiederhole

5 Die Programmiersprache Zur Vereinfachung der Darstellung verwenden wir abkürzende Bezeichner für die Anweisungen der Programmiersprache. h s wh nz wh nw s *wh l *wh hinlegen schritt wiederhole solange Nicht. Ist. Ziegel wiederhole solange Nicht. Ist. Wand schritt *wiederhole links. Drehen *wiederhole

6 Die Programmiersprache My. Ka Elementare Anweisungen: h a s l r „Ziegel hinlegen“ „Ziegel aufheben“ „Schritt vorwärts“ „links drehen“ „rechts drehen“ Elementare Bedingungen: nz nw h s wh nz wh nw s *wh l *wh „nicht auf Ziegel“ „nicht vor Wand“ Kontrollanweisung: wh. . . *wh „wiederhole solange. . . “ Ein My. Ka-Programm setzt sich – wie im Beispiel gezeigt – aus elementaren und Kontrollanweisungen zusammen. Bei der Darstellung von My. Ka-Programmen dürfen mehrere Anweisungen in eine Zeile geschrieben werden, . . .

Zweistufige Sprachbeschreibung 7 Oft ist es sinnvoll, eine formale Sprache zweistufig festzulegen: Zeichen: Zeilenumbruch {ASCII: a, b, c, . . . , ´*´, ´ ´, chr(13), chr(10), . . . } Festlegung der korrekten Token (Wörter) Wörter / Token: Alphabet für Token Sprache der Token {h, a, s, l, r, nz, nw, wh, *wh} Festlegung der korrekten Tokenfolgen (Sätze) Sätze / Tokenfolgen: {h s wh nz wh nw s *wh l *wh , . . . } Alphabet für Programme Sprache der Programme

8 Eine Grammatik für My. Ka ! Terminalsymbole S=s L=l R=r H=h A=a NW = n w NZ = n z WHA = w h WHE = '*' w h. . . My. Ka 1. grm . . . "Start Symbol" = <Programm> ! Produktionen <Programm> : : = <Anweisungsfolge> : : = <Anweisung> <Anweisungsfolge> <Bedingung> : : = NW <Bedingung> : : = NZ <Anweisung> : : = S <Anweisung> : : = L <Anweisung> : : = R <Anweisung> : : = H <Anweisung> : : = A <Anweisung> : : = WHA <Bedingung> <Anweisungsfolge> WHE

9 Aufgabe Starten Sie das Werkzeug „GOLD Parser Builder“ und laden Sie die Datei „My. Ka 1. grm“. Testen Sie die hier vorgegebene Grammatik zur präzisen Festlegung der Programmiersprache My. Ka.

10 Es fehlt die Semantik Bisher wurde nur die Syntax der Sprache My. Ka festgelegt. Die Bedeutung der einzelnen Sprachelemente scheint klar zu sein. Aber ist das wirklich so? Bereits bei der elementaren Anweisung „h“ ist nicht klar, wie viele Ziegel hingelegt werde, ob der / die Ziegel in die Zelle, in der sich der Roboter befindet, gelegt werden, oder in die vor dem Roboter usw. . Ziel ist es im Folgenden, auch die Semantik der Programmiersprache exakt zu beschreiben. Zwei Ansätze sollen hierzu vorgestellt werden: Zum einen soll die Bedeutung der Konstrukte der Sprache My. Ka durch das Verhalten eines Interpreters festgelegt werden (Interpreteransatz). Zum anderen soll die Bedeutung von Konstrukten der Sprache My. Ka auf die Bedeutung der Konstrukte einer anderen (bereits bekannten) Sprache zurückgeführt werden (Übersetzeransatz). Letztlich werden hier somit ein Interpreter und ein Übersetzer (Compiler) für die Programmiersprache My. Ka entwickelt. Zur syntaktischen Vorbereitung werden zudem ein Scanner und ein Parser für diese Sprache benutzt.

11 Teil 2 Scanner und Parser

12 Syntaxanalyse Zur Analyse der Syntax der Sprache My. Ka sollen im Folgenden ein Scanner und ein Parser entwickelt werden. Nach der Syntaxanalyse soll feststehen, ob eine vorgegebene Zeichenfolge ein syntaktisch korrektes My. Ka. Programm darstellt. h s wh nz wh nw s *wh l *wh

Scanner 13 Aufgabe eines Scanners ist es, aus einer Zeichenfolge lexikalische Einheiten zu bilden und diese als Tokenfolge aufzubereiten. Scanner-Automat h s wh nz wh nw s *wh l *wh Scanner h s wh nz wh nw s *wh l *wh

Scanner-Automat 14 q 1 z w q 2 ´ ´; chr(13); chr(10) w n Der Scanner benutzt einen endlichen Automaten zur Erkennung der lexikalischen Einheiten. h q 3 w * q 0 s; l; r; h; a q 30 q 10 Fehlerzustand ´ ´; chr(13) q 20 Immer dann, wenn der Endzustand erreicht wird, ist ein Token erkannt. Danach beginnt der Scanner seine Arbeit wieder im Anfangszustand.

15 Parser Aufgabe eines Parsers ist es, eine Tokenfolge auf syntaktische Korrektheit zu analysieren (und evtl. die Tokenfolge geeignet aufzubereiten). h s wh nz wh nw s *wh l *wh Parser-Automat Parser Ok!

Parser-Automat 16 Oberstes Kellerzeichen / Eingabezeichen: Kelleroperation any / s : any / l : any / r : any / h : any / a : wh / *wh : pop any / wh : push wh q 1 any / s : any / l : any / r : any / h : any / a : any / wh : any / *wh : any / nz : any / nw : q 0 else / *wh : any / nz : any / nw : Der Parser benutzt einen Kellerautomaten zur syntaktischen Analyse der Tokenfolge. q 2 Der Kellerautomaten akzeptiert eine Zeichenfolge, wenn der Automat nach Abarbeitung der Zeichenfolge im Enzustand ist und wenn zudem der Keller leer ist. Fehlerzustand

17 Aufgabe Testen Sie den implementierten Scanner. Schauen Sie sich die Implementierung an. Berücksichtigen Sie beim Scanner-Automaten zusätzlich folgende Kontrollanweisung: if <Bed. > th <Anw. > el <Anw. > *if Ergänzen Sie die Implementierung des Scanner-Automaten entsprechend und testen Sie den erweiterten Scanner.

18 Aufgabe Testen Sie den implementierten Parser. Schauen Sie sich die Implementierung an. Berücksichtigen Sie beim Parser-Automaten zusätzlich folgende Kontrollanweisung: if <Bed. > th <Anw. > el <Anw. > *if Ergänzen Sie die Implementierung des Parser-Automaten entsprechend und testen Sie den erweiterten Parser.

19 Teil 3 Ein Programm-Interpreter

20 Ein Interpreter führt die Anweisungen Schritt für Schritt aus. Er beschreibt damit das Verhalten der jeweiligen Anweisungen. Interpreter h s wh nz wh nw s *wh l *wh Zustand vorher: abzuarbeitendes Programm; Roboterwelt Eine präzise Interpreterbeschreibung kann somit zur Festlegung der Semantik der Elemente der Programmiersprache benutzt werden (Interpreter-Semantik). Zustand nachher: abzuarbeitendes Programm; Roboterwelt

21 Ausführungstransformationen 1 wahr h s wh nz wh nw s *wh l *wh 1 s wh nz wh nw s *wh l *wh wh nw s *wh l wh nz wh nw s. . .

Ausführungstransformationen 22 1 1 wahr wh nw s *wh l wh nz wh nw s. . . 1 s wh nw s *wh l wh nz wh nw s. . .

Ausführungstransformationen 23 1 1 falsch wahr wh nw s *wh l wh nz wh nw s. . . 1 wh nz wh nw s *wh l *wh 1 l wh nz wh nw s *wh l *wh wh nw s *wh l wh nz wh nw s. . .

24 Transformationsregeln Vor der Wand s. . .

25 Transformationsregeln Anzahl: n h. . . Anzahl: n+1 . . .

26 Transformationsregeln wahr falsch wh <K> *wh. . . <K> wh <K> *wh. . .

27 Semantikfestlegung mit Regeln s. . . Das Verhalten des Interpreters wird hier präzise mit Hilfe von Transformationsregeln festgelegt. Diese bilden somit die Grundlage für eine Implementierung des Interpreters. Solange d. Restprogramm-Stapel nicht leer ist wende die zum obersten Stapelelement passende Transformationsregel an . . .

28 Aufgabe Testen Sie den implementierten Interpreter. Schauen Sie sich die Implementierung an. Entwerfen Sie Transformationsregeln, die Ausführung der folgenden Kontrollanweisung beschreiben: if <Bed. > th <Anw. > el <Anw. > *if Ergänzen Sie die Implementierung des Interpreters entsprechend der Transformationsregeln.

29 Teil 4 Ein Programm-Übersetzer

30 Ein Übersetzer transformiert Programme der Ausgangs. Programmiersprache (Quellsprache) in eine andere Sprache (Zielsprache). Eine präzise Übersetzerbeschreibung kann zur Festlegung der Semantik der Elemente der Ausgangs. Programmiersprache benutzt werden, sofern die Semantik der Zielsprache klar ist (Übersetzer-Semantik). Übersetzer h s wh nz wh nw s *wh l *wh Zustand vorher: abzuarbeitendes Programm; Roboterwelt Zustand nachher: abzuarbeitendes Programm; Roboterwelt h s nz 10 nw 8 s 4 l 2

31 Von der Quell- zur Zielsprache h s wh nz wh nw s *wh l *wh 0 h 1 s 2 nz? falsch wahr 3 4 nw? falsch 5 6 wahr s 4 8 l 9 10 h s nz 10 nw 8 s 4 l 2 Die Quellsprache My. Ka verfügt über die Kontrollstruktur wh. . . *wh zur Ausführung von Wiederholungen. Die Zielsprache soll solche Wiederholungen durch GOTOSprünge ersetzen.

32 Von der Quell- zur Zielsprache h s wh nz wh nw s *wh l *wh h s nz 10 nw 8 s 4 l 2 h s wh nz wh nw s *wh l *wh 0: 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 0 h 1 s 2 nz? falsch wahr 3 4 nw? falsch 5 6 wahr h s nz? f: goto 10 w: nw? f: goto 8 w: s goto 4 l goto 2 stop 0: 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: h s nz 10 nw 8 s 4 l 2 s h 0 4 8 l 9 10 s 1 nz 10 nw 8 2 3 4 5 s 6 4 7 l 8 2 9 GOTO-Programme werden in verkürzter Form als Folge von Token (siehe oben) dargestellt.

Übersetzungsvorgang im Detail 33 h s wh nz wh nw s *wh l *wh 0 wh nz wh nw s *wh l *wh 2 hs s wh nz wh nw s *wh l *wh 1 h nz wh nw s *wh l *wh 2 2 hs . . .

Übersetzungsvorgang im Detail 34 nz wh nw s *wh l *wh 2 4 hs h s nz * wh nw s *wh l *wh 4 h s nz * 2 42 6 42 h s nz * nw * . . .

Übersetzungsvorgang im Detail 35 s *wh l *wh 6 l *wh 42 8 h s nz * nw * h s nz * nw 8 s 4 *wh l *wh 7 h s nz * nw * s 42 2 9 2 h s nz * nw 8 s 4 l . . .

Übersetzungsvorgang im Detail 36 *wh 9 h s nz * nw 8 s 4 l 10 h s nz 10 nw 8 s 4 l 2 2

Transformationsregeln 37 s. . . i Quellcode . . . Das Verhalten des Übersetzers kann präzise mit Hilfe von Transformationsregeln festgelegt werden. . Markenzähler Zielcode Hilfsstapel für Rücksprungmarken . . . i+1. . . s . . . Solange die Quellcode-Schlange nicht leer ist wende die passende Transformationsregel an Diese bilden dann die Grundlage für eine Implementierung des Übersetzers.

Regel für eine elementare Anweisung 38 Eine elementare Anweisung wird direkt in die Code-Schlange übernommen. Der Markenzähler wird um 1 erhöht. s. . . i+1 . . . s

Regel für die Wiederhole-Anweisung 39 Die aktuelle Markennummer wird zur späteren Festlegung der Rücksprungadresse in einem Hilfsstapel zwischengespeichert. wh. . . i i. . .

Regel für die Wiederhole-Anweisung 40 . . . i+2. . . * . . . Die Bedingung wird in die Code-Schlange übernommen. Zusätzlich wird ein Platzhalter (hier *) übernommen, der später mit einer Marke für einen Vorwärtssprung ersetzt wird. Hiermit soll ein Sprung aus der Schleife ermöglicht werden, wenn die Bedingung nicht erfüllt ist. Des weiteren wird der Markenzähler um 2 erhöht. Hiermit soll ein Sprung zur ersten Anweisung innerhalb der Schleife ermöglicht werden, sofern die Bedingung erfüllt ist.

Regel für das Ende einer Wiederholung 41 *wh. . . i k. . . * … . . . i+1 … k . . . Die auf einem Hilfsstapel abgelegte Rücksprungmarke wird in die Codeschlange übernommen. Zusätzlich wird das letzte * in der Codeschlange durch den neuen Markenzähler ersetzt. Hierdurch wird der Sprung „aus der Schleife“ realisiert.

42 Aufgabe Testen Sie den implementierten Compiler. Schauen Sie sich die Implementierung an. Entwerfen Sie Transformationsregeln, die Übersetzung der folgenden Kontrollanweisung beschreiben: if <Bed. > th <Anw. > el <Anw. > *if Ergänzen Sie die Implementierung des Compilers entsprechend der Transformationsregeln.

43 Teil 5 Aufgaben und Lösungsvorschläge

44 Aufgabe Erweitern Sie die Programmiersprache um folgende Kontrollanweisung: if <Bed. > t <Anw. > e <Anw. > *if Ergänzen Sie entsprechend den Scanner, den Parser, den Interpreter und den Übersetzer (Codegenerator).

45 Die Programmiersprache Zur Vereinfachung der Darstellung verwenden wir abkürzende Bezeichner für die Anweisungen der Programmiersprache. wh nw if nz th h s el s *if *wh hinlegen schritt wiederhole solange Nicht. Ist. Ziegel wiederhole solange Nicht. Ist. Wand schritt *wiederhole links. Drehen *wiederhole

Erweiterter Scanner-Automat 46 q 1 z w q 2 ´ ´; chr(13); chr(10) w n q 3 w * q 0 i s; l; r; h; a; t; e i t q 4 e q 5 Fehlerzustand h q 30 q 6 f h l q 10 ´ ´; chr(13) q 20

Erweiterter Parser-Automat 47 Oberstes Kellerzeichen / Eingabezeichen: Kelleroperation any / s : any / l : any / r : any / h : any / a : wh / *wh : pop if / *if : pop any / th : push th th / el : pop any / wh : push wh any / if : push if q 1 any / nz : any / nw : q 0 else / *wh : any / nz : any / nw : q 2 Fehlerzustand

48 Zusätzliche Regeln f. d. Interpreter wahr falsch if th <A 1> el <A 2> *if. . . <A 1>. . . <A 2>. . .

49 Aufgabe Beschreiben Sie die Arbeitsweise des Code-Interpreters mit Hilfe geeigneter Transformationsregeln. Ergänzen Sie hierzu den folgenden Lösungsvorschlag.

Lösungsvorschlag 50 i . . . >s. . . i+1 . . . s >. . .

51 Lösungsvorschlag

52 Literaturhinweise A. Hermes, D. Stobbe: Informatik Zwei, Klett-Verlag 1990. E. Modrow: Automaten, Schaltwerke, Sprachen. Dümmlers-Verlag 1988. E. Modrow: Theoretische Informatik mit Delphi. Emu-online 2005.