TEKNIK KOMPILASI Team Penyusun Gopa Kustriono Zulfiandri M

  • Slides: 154
Download presentation
TEKNIK KOMPILASI Team Penyusun : Gopa Kustriono Zulfiandri M Akbar Marwan Sulistyo Puspitodjati

TEKNIK KOMPILASI Team Penyusun : Gopa Kustriono Zulfiandri M Akbar Marwan Sulistyo Puspitodjati

TUJUAN n Mengetahui Penerapan konsep ilmu komputer pada perilaku komputer yaitu algoritma, arsitektur komputer,

TUJUAN n Mengetahui Penerapan konsep ilmu komputer pada perilaku komputer yaitu algoritma, arsitektur komputer, stuktur data maupun penerapan teori bahasa dan automata n Compiler adalah merupakan konstruksi inti dari ilmu komputer

DAFTAR PUSTAKA n Practice and principles of Compiler building with C, Henk Alblas, Albert

DAFTAR PUSTAKA n Practice and principles of Compiler building with C, Henk Alblas, Albert Nymeyer, Prentice Hall, 1996 n Introduction to The theory of computation, Michael sipser, PWS publishing Company, 1997 n The Essence of Compilers, Robin Hunter, Prentice Hal Europe, 1999 n Modern Compiler Design, Dick Grune, Henri E. Bal, Et all, John Wiley & Son, 2000

Bahasan Materi Kuliah n Pendahuluan: arti dari Kompilasi n Translator: Compiler dan interpreter Bahasa

Bahasan Materi Kuliah n Pendahuluan: arti dari Kompilasi n Translator: Compiler dan interpreter Bahasa Pemrograman Pembuatan Compiler Konsep bahasa dan Notasi Hirarki Comsky Aturan Produksi Diagram state Notasi BNF Diagram Syntax Kualitas Compiler n n n n n

Bahasan Materi Kuliah n n n n Beberapa translator Struktur Compiler Lexical Analysis Syntax

Bahasan Materi Kuliah n n n n Beberapa translator Struktur Compiler Lexical Analysis Syntax Analysis Semantics Error Handling Optimation Tabel informasi

ARTI KATA TEKNIK KOMPILASI n Teknik : q n Kompilasi : q n Metode

ARTI KATA TEKNIK KOMPILASI n Teknik : q n Kompilasi : q n Metode atau Cara Proses mengabungkan serta menterjermahkan sesuatu (source program) menjadi bentuk lain Compile : q To translate a program written in a high-level programming language into machine language.

Translator : Compiler & Interpreter Translator : n Adalah suatu program dimana mengambil input

Translator : Compiler & Interpreter Translator : n Adalah suatu program dimana mengambil input sebuah program yang ditulis pada satu bahasa program (source language) ke bahasa lain (The object on target language) n Jika source language adalah high level language, seperti cobol, pascal, fortran maka object language adalah low-level language atau mesin language. Translator seperti ini disebut COMPILER

Kenapa perlu Translator ? n Dengan bahasa mesin adalah bahasa bentuk bahasa terendah komputer,

Kenapa perlu Translator ? n Dengan bahasa mesin adalah bahasa bentuk bahasa terendah komputer, berhubungan langsung dengan bagian komputer seperti bits, register & sangat primitive n Jawaban atas pertanyaan ini akan membingungkan bagi programmer yang membuat program dengan bahasa mesin. n Bahasa mesin adalah tidak lebih dari urutan 0 dan 1 n Instruksi dalam bahasa mesin bisa saja dibentuk menjadi micro-code, semacam prosedur dalam bahasa mesin n Bagaimana dengan orang tidak mengerti bahasa mesin

Ada Beberapa Translator 1. Assembler Source code adalah bahasa assembly, Object code adalah bahasa

Ada Beberapa Translator 1. Assembler Source code adalah bahasa assembly, Object code adalah bahasa mesin *. asm Assembler Object code *. exe /*. com 2. Compiler Source code adalah bahasa tingkat tinggi, object code adalah bahasa mesin atau bahasa assembly. Source code dan data diproses berbeda

Data Source code Compiler Execution Hasil Object Code 3. Interpreter tidak menghasilkan bentuk object

Data Source code Compiler Execution Hasil Object Code 3. Interpreter tidak menghasilkan bentuk object code, tetapi hasil translasinya hanya dalam bentuk internal, dimana program induk harus selalu ada-berbeda dengan compiler Source code Translator Data Hasil

Translator : Compiler & Interpreter Source Program Compiler ERROR MESSAGES OBJECT PROGRAM

Translator : Compiler & Interpreter Source Program Compiler ERROR MESSAGES OBJECT PROGRAM

COMPILER vs INTERPRETER n Compiler bisa menangkap berbagai kesalahan dalam 1 program kode sumber

COMPILER vs INTERPRETER n Compiler bisa menangkap berbagai kesalahan dalam 1 program kode sumber secara sekaligus. Kalau Interpreter cuma bisa menangkap beberapa kesalahan pada 1 baris kode sumber pada suatu saat n Biasanya program yang dihasilkan compiler lebih cepat dari waktu pelaksanaan program dengan interpreter. n Kalau compiler menghasilkan kode antara (misal object code) dan harus digabungkan / dilink menjadi bentuk yang dapat dijalankan mesin / komputer (executable). Kalau Interpreter biasanya tidak menghasilkan kode antara. n Kalau hendak menjalankan program hasil kompilasi bisa dilakukan tanpa kode sumber. Kalau interpreter butuh kode sumber.

COMPILER vs INTERPRETER n Kalau dengan kompiler, maka pembuatan kode yang bisa dijalankan mesin

COMPILER vs INTERPRETER n Kalau dengan kompiler, maka pembuatan kode yang bisa dijalankan mesin dilakukan dalam 2 tahap terpisah, yaitu parsing / pembuatan kode objek dan linking / penggabungan kode objek dengan library. Kalau interpreter tidak ada proses terpisah. n Kalau compiler membutuhkan linker untuk menggabungkan kode objek dengan berbagai macam library demi menghasilkan suatu kode yang bisa dijalankan oleh mesin. Kalau interpreter tidak butuh linker. n Interpreter cocok untuk membuat / menguji coba modul / sub-routine / program-program kecil. Kalau compiler agak repot karena untuk mengubah suatu modul / kode objek kecil, maka harus dilakukan proses linking / penggabungan kembali semua objek dengan library yang diperlukan. n Pada kompiler bisa dilakukan optimisasi / peningkatan kwalitas kode yang bisa dijalankan. Ada yang dioptimasi supaya lebih cepat, ada yang supaya lebih kecil, ada yang dioptimasi untuk sistem dengan banyak processor. Kalau interpreter susah / tidak bisa dioptimasikan.

Proses kompilasi dikelompokkan ke dalam dua kelompok besar : 1. 2. analisa : program

Proses kompilasi dikelompokkan ke dalam dua kelompok besar : 1. 2. analisa : program sumber dipecah-pecah dan dibentuk menjadi bentuk antara (intermediate representation) sintesa : membangun program sasaran yang diinginkan dari bentuk antara

Fase-fase proses sebuah kompilasi

Fase-fase proses sebuah kompilasi

Penganalisa Leksikal n membaca program sumber, karakter demi karakter. Sederetan (satu atau lebih) karakter

Penganalisa Leksikal n membaca program sumber, karakter demi karakter. Sederetan (satu atau lebih) karakter dikelompokkan menjadi satu kesatuan mengacu kepada pola kesatuan kelompok karakter (token) yang ditentukan dalam bahasa sumber. Kelompok karakter yang membentuk sebuah token dinamakan lexeme untuk token tersebut. Setiap token yang dihasilkan disimpan di dalam tabel simbol. Sederetan karakter yang tidak mengikuti pola token akan dilaporkan sebagai token tak dikenal (unidentified token)

Penganalisa Sintaks n memeriksa kesesuaian pola deretan token dengan aturan sintaks yang ditentukan dalam

Penganalisa Sintaks n memeriksa kesesuaian pola deretan token dengan aturan sintaks yang ditentukan dalam bahasa sumber. Sederetan token yang tidak mengikuti aturan sintaks akan dilaporkan sebagai kesalahan sintaks (sintax error). Secara logika deretan token yang bersesuaian dengan sintaks tertentu akan dinyatakan sebagai pohon parsing (parse tree)

Penganalisa Semantik memeriksa token dan ekspresi dari batasan yang ditetapkan. Batasan-batasan tersebut misalnya :

Penganalisa Semantik memeriksa token dan ekspresi dari batasan yang ditetapkan. Batasan-batasan tersebut misalnya : a. panjang maksimum token identifier adalah 8 karakter, b. panjang maksimum ekspresi tunggal adalah 80 karakter, c. nilai bilangan bulat adalah -32768 s/d 32767, d. operasi aritmatika harus melibatkan operan yang bertipe sama n

Pembangkit Kode Antara n membangkitkan kode antara (intermediate code) berdasarkan pohon parsing. Pohon parse

Pembangkit Kode Antara n membangkitkan kode antara (intermediate code) berdasarkan pohon parsing. Pohon parse selanjutnya diterjemahkan oleh suatu penerjemah yang dinamakan penerjemah berdasarkan sintak (syntax-directed translator). Hasil penerjemahan ini biasanya merupakan perintah tiga alamat (three-address code) yang merupakan representasi program untuk suatu mesin abstrak. Perintah tiga alamat bisa berbentuk quadruples (op, arg 1, arg 2, result), tripels (op, arg 1, arg 2). Ekspresi dengan satu argumen dinyatakan dengan menetapkan arg 2 dengan - (strip, dash)

Pengoptimal kode n melakukan optimasi (penghematan space dan waktu komputasi), jika mungkin, terhadap kode

Pengoptimal kode n melakukan optimasi (penghematan space dan waktu komputasi), jika mungkin, terhadap kode antara

Pembangkit Kode Mesin n membangkitkan kode dalam bahasa target tertentu (misalnya bahasa mesin)

Pembangkit Kode Mesin n membangkitkan kode dalam bahasa target tertentu (misalnya bahasa mesin)

Contoh Kompilasi

Contoh Kompilasi

View dari programmer

View dari programmer

Mesin View

Mesin View

Pembuatan compiler Bahasa mesin n Sangat sukar dan sangat sedikit kemungkinannya untuk membuat compiler

Pembuatan compiler Bahasa mesin n Sangat sukar dan sangat sedikit kemungkinannya untuk membuat compiler dengan bahasa ini, karena manusia susah mempelajari bahasa mesin, n Sangat tergantung pada mesin, n Bahasa Mesin kemungkinan digunakan pada saat pembuatan Assembler

Pembuatan compiler Assembly n Hasil dari program mempunyai Ukuran yang relatif kecil n Sulit

Pembuatan compiler Assembly n Hasil dari program mempunyai Ukuran yang relatif kecil n Sulit dimengerti karena statement/perintahnya singkat-singkat, butuh usaha yang besar untuk membuat n Fasilitas yang dimiliki terbatas

Pembuatan compiler Bahasa Tingkat Tinggi (high level language) n Lebih mudah dipelajari n Fasilitas

Pembuatan compiler Bahasa Tingkat Tinggi (high level language) n Lebih mudah dipelajari n Fasilitas yang dimiliki lebih baik (banyak) n Memiliki ukuran yang relatif besar, misal membuat compiler pascal dengan menggunakan bahasa C n Untuk mesin yang berbeda perlu dikembangkan tahapan tambahan. n Misal membuat compiler C pada Dos bedasarkan compiler C pada unix

Pembuatan compiler Boot. Strap n Untuk membangun sesuatu yang besar, dibangun/dibuat dulu bagian intinya

Pembuatan compiler Boot. Strap n Untuk membangun sesuatu yang besar, dibangun/dibuat dulu bagian intinya (niklaus Wirth - saat membuat pascal compiler)

Boot. Strap P 2 P 1 Po n PO dibuat dengan assembly, n P

Boot. Strap P 2 P 1 Po n PO dibuat dengan assembly, n P 1 dibuat dari P 0, dan n P 2 dibuat dari P 1, jadi compiler untuk bahasa P dapat dibuat tidak harus dengan menggunakan assembly secara keseluruhan

Contoh dari source program ke dalam kode mesin Source code IF COUNT =10 GOTO

Contoh dari source program ke dalam kode mesin Source code IF COUNT =10 GOTO DONE ELSE GOTO AGAIN ENDIF Assembly Language Compare A to B If equal go to C Go to D Machine language Compare 3477 2883 If = go to 23883 Go to 23343 Actual machine code 1001010001010100101010010010100101010010010

BAHASA SUMBER

BAHASA SUMBER

DEFINISI “bahasa sumber” n n n Bahasa adalah kumpulan kalimat. Kalimat adalah rangkaian kata.

DEFINISI “bahasa sumber” n n n Bahasa adalah kumpulan kalimat. Kalimat adalah rangkaian kata. Kata adalah unit terkecil komponen bahasa yang tidak bisa dipisah-pisahkan lagi. Kalimat-kalimat : ‘Seekor kucing memakan seekor tikus. ’ dan ‘Budi menendang sebuah bola. ’ adalah dua contoh kalimat lengkap Bahasa Indonesia. ‘A cat eats a mouse’ dan ‘Budi kick a ball. ’ adalah dua contoh kalimat lengkap Bahasa Inggeris. ‘if a 2 < 9. 0 then b 2 : = a 2+a 3; ’ dan ‘for i : = start to finish do A[i] : = B[i]*sin(i*pi/16. 0). ’ adalah dua contoh kalimat lengkap dalam Bahasa Pemrograman Pascal. Dalam bahasa pemrograman kalimat lebih dikenal sebagai ekspresi sedangkan kata sebagai token

Bahasa Tingkat Tinggi (Pemrograman ) n Bahasa yang lebih dikenal oleh manusia, maksudnya adalah

Bahasa Tingkat Tinggi (Pemrograman ) n Bahasa yang lebih dikenal oleh manusia, maksudnya adalah statement yang digunakan menggunakan bahasa yang dipakai oleh manusia (inggris), n Bahasa pemrograman didefinisikan dengan menentukan bentuk programnya (sintak) dan arti programnya (semantik) n Memberikan fasilitas yang lebih banyak, seperti struktur kontrol program yang terstruktur, blok-blok serta prosedur dan fungsi n Progam mudah untuk di koreksi (debug) n Tidak tergantung pada salah satu mesin n Kontrol struktur seperti : kondisi (if. . Then. . Else ), perulangan (For, while ), Struktur blok (begin. . End {. . } )

Tingkatan Bahasa Pemrograman

Tingkatan Bahasa Pemrograman

Sumber perancangan bahasa n n n Konstruksi yang diturunkan dari bahasa alami, karena bahasa

Sumber perancangan bahasa n n n Konstruksi yang diturunkan dari bahasa alami, karena bahasa alami dapat digunakan sebagai panduan untuk perancangan sintaks Matematika, misal untuk perancangan operasi aritmatika Bahasa pemrograman yang sudah ada.

Tujuan perancangan bhs program n n n Komunikasi dengan manusia Pencegahan deteksi kesalahan Usability

Tujuan perancangan bhs program n n n Komunikasi dengan manusia Pencegahan deteksi kesalahan Usability Efektifitas pemrograman Compilability (mengurangi kompleksitas, mis: penggunaan bracket) Efisiensi dengan meminimalisir ketidakcocokan antara hardware dengan bahasa

Tujuan perancangan bhs program(2) n n n Machine independent Simplicity : penyederhanaan komponen bahasa

Tujuan perancangan bhs program(2) n n n Machine independent Simplicity : penyederhanaan komponen bahasa program Orthogonality : kumpulan primitive yang dikombinasikan dengan berbagai cara dalam membangun kontrol dan struktur data dalam bahasa program

Struktur Ekspresi Metode pengurutan evaluasi dalam ekspresi : n. Explicit Bracketing n. Operator binding

Struktur Ekspresi Metode pengurutan evaluasi dalam ekspresi : n. Explicit Bracketing n. Operator binding Binding adalah asosiasi antara atribut dan entity atau antara operasi dan simbol. Binding time adalah waktu yang dialokasikan untuk menyatukan variable dengan nilainya.

Struktur Data Empat aspek dalam struktur data n Deklarasi data n Tipe data yang

Struktur Data Empat aspek dalam struktur data n Deklarasi data n Tipe data yang tersedia n Alokasi storage n Lingkup variabel

Struktur I/O n n Format free langsung ditampilkan sehingga mudah bagi user untuk memeriksa

Struktur I/O n n Format free langsung ditampilkan sehingga mudah bagi user untuk memeriksa kebenaran program. Contoh pada VB. Formatted output ditampilkan secara terformat, seperti di C : printf(), delphi/VB : format()

ANDAIKAN. . . Anda akan menciptakan sebuah bahasa program, coba sebutkan urutan proses yang

ANDAIKAN. . . Anda akan menciptakan sebuah bahasa program, coba sebutkan urutan proses yang harus ditentukan/skenario yang dijalani untuk menghasilkan bahasa pemrograman impian Anda tersebut !

SKENARIO PERANCANGAN 1. 2. 3. 4. 5. 6. 7. 8. 9. Tentukan apa yang

SKENARIO PERANCANGAN 1. 2. 3. 4. 5. 6. 7. 8. 9. Tentukan apa yang diinginkan. Tentukan feature yang mungkin Tentukan desain dan sesuaikan dengan featurenya Tentukan rincian, parsing, dan error checking. Tuliskan user manual dan help. Evaluasilah, jika salah mulai lagi dari langkah 3. Jika sudah benar, optimisasilah dan uji segala kemungkinan. Cobakan kepada pengguna, tunggu reaksinya. Perbaiki bug dan mulai versi baru.

n Tools Bantu Compiler Free Compiler Construction Tools http: //www. thefreecountry. com/developercity/compiler. html n

n Tools Bantu Compiler Free Compiler Construction Tools http: //www. thefreecountry. com/developercity/compiler. html n TASSKAF. Bahasa TASSKAF ini merupakan subset dari Java. Dapat disusun suatu program ke byte code yang dapat dijalankan di Java Virtual Machine (JVM). Pada site tersebut juga tersedia informasi materi kuliah dengan LEX, YACC http: //rw 4. cs. uni-sb. de/~martin/COMP/TK/ n GENTLE. Gentle ini merupakan perangkat bantu (toolkit) modern untuk menulis compiler dan mengimplemntasikannya pada bahasa tertentu. Perangkat bantu ini mendukung semua proses translasi, dari definisi tree sintaks abstrak, pater matching, smart traversal dan lain sebagainya. Toolkit ini telah digunakan secara luas di riest dan industri. http: //www. first. gmd. de/gentle/ n ELI. Merupakan suatu lingkungan pemrograman yang memungkinkan membuat suatu implementasi bahasa pemrograman secara lengkap dari suatu sepsifikasi. Perangkat bantu ini menangani struktural analisis, analisis nama, type, value dlsb dan akan menghasilkan kode C. http: //www. cs. colorado. edu/~eliuser/

ANTLR, ANother Tool for Language Recognition, is a language tool that provides a framework

ANTLR, ANother Tool for Language Recognition, is a language tool that provides a framework for constructing recognizers, interpreters, compilers, and translators from grammatical descriptions containing actions in a variety of target languages Made by : Terrence Parr <almost by himself> For 15 Years 15 TH ?

IDE SISTEM PEMBELAJARAN CERDAS What’s a Surprise? Topic Skripsi with Compiler technique

IDE SISTEM PEMBELAJARAN CERDAS What’s a Surprise? Topic Skripsi with Compiler technique

KONSEP dan NOTASI BAHASA

KONSEP dan NOTASI BAHASA

Konsep dan Notasi bahasa n Teknik Kompilasi merupakan kelanjutan dari konsep-konsep yang telah kita

Konsep dan Notasi bahasa n Teknik Kompilasi merupakan kelanjutan dari konsep-konsep yang telah kita pelajari dalam teori bahasa dan automata n Thn 56 -59 Noam chomsky melakukan penggolongan tingkatan dalam bahasa, yaitu menjadi 4 class n Penggolongan tingkatan itu disebut dengan hirarki Comsky n 1959 Backus memperkenalkan notasi formal baru untuk syntax bahasa yang lebih spesifik n Peter Nour (1960) merevisi metode dari syntax. Sekarang dikenal dengan BNF (backus Nour Form)

Konsep dan Notasi bahasa n Tata bahasa (grammar) adalah sekumpulan dari himpunan variabel-variabel, simbol-simbol

Konsep dan Notasi bahasa n Tata bahasa (grammar) adalah sekumpulan dari himpunan variabel-variabel, simbol-simbol terminal, simbol non-terminal, simbol awal yang dibatasi oleh aturan-aturan produksi n Aturan produksi adalah pusat dari tata bahasa yang menspesifikasikan bagaimana suatu tata bahasa melakukan transformasi suatu string ke bentuk lainnya

Konsep dan Notasi bahasa n Syntax : suatu aturan yang memberitahu apakah sesuatu kalimat

Konsep dan Notasi bahasa n Syntax : suatu aturan yang memberitahu apakah sesuatu kalimat (string) adalah valid dalam program atau tidak n Semantic : suatu aturan-aturan yang memberikan arti kepada program

Review Mesin Automata Misal : FSA Misal : Ada mesin penjual permen yang Memuat

Review Mesin Automata Misal : FSA Misal : Ada mesin penjual permen yang Memuat aturan 2 sbb : Harga Permen Rp. 25 Mesin tsb dpt menerima koin Rp. 5 (n), Rp. 10 (d) Rp. 25 (q) $ = tombol utk mengeluarkan permen. Kemungkinan 2 yang Terjadi diperlihatkan gambar :

Review Mesin Automata Misal : FSA State Diagram nya adalah :

Review Mesin Automata Misal : FSA State Diagram nya adalah :

Contoh lain : FSA

Contoh lain : FSA

Konsep dan Notasi bahasa Penggolongan Chomsky Bahasa Mesin Automata Aturan Produksi

Konsep dan Notasi bahasa Penggolongan Chomsky Bahasa Mesin Automata Aturan Produksi

Keterangan n n menyatakan simbol – simbol yang berada di ruas kiri aturan produksi

Keterangan n n menyatakan simbol – simbol yang berada di ruas kiri aturan produksi menyatakan simbol – simbol yang berada di ruas kanan aturan produksi Simbol-simbol terdiri dari simbol terminal dan non terminal/variabel (masih bisa diturunkan lagi) Simbol terminal biasanya dinyatakan dengan huruf kecil, sementara non terminal dengan huruf besar

Aturan Produksi n n Tipe O / Unrestricted: Tidak Ada batasan pada aturan produksi

Aturan Produksi n n Tipe O / Unrestricted: Tidak Ada batasan pada aturan produksi Abc De Tipe 1 / Context sensitive: Panjang string ruas kiri harus lebih kecil atau sama dengan ruas kanan Ab De. F CD e. F n n Tipe 2 / Context free grammar: Ruas kiri haruslah tepat satu simbol variable B CDe. Fg D Bc. De Tipe 3 / Regular: Ruas kanan hanya memiliki maksimal 1 simbol non terminal dan diletakkan paling kanan sendiri A e A efg. H C D

Aturan produksi yang tidak legal !!! n Simbol E tidak boleh berada pada ruas

Aturan produksi yang tidak legal !!! n Simbol E tidak boleh berada pada ruas kiri misal E Abd n Aturan produksi yang ruas kirinya hanya memuat simbol terminal saja misal : a bd atau ab bd

Hirarki Comsky Unrestricted Context Sensitive Context free Regular

Hirarki Comsky Unrestricted Context Sensitive Context free Regular

Contoh Tata Bahasa Sederhana n <program> n <Statement-list> <statement> | <statement>; <statement-list> <statement> <var>

Contoh Tata Bahasa Sederhana n <program> n <Statement-list> <statement> | <statement>; <statement-list> <statement> <var> : = <expression> <Expression> <term> | <term><op 1> <expression> <term> <factor> | <factor> <op 2> <term> <factor> <var> | <constant> n n n BEGIN <Statement-list> END <var> A|B| …. | Z <op 1> +|-|= <op 2> ^|*|/ <constant> <real_number> | <integer_part> <real_number> <integer_part> <fraction> <digit> <integer_part>. <fraction> <digit> | <integer_part> < digit> <digit> | <digit> <fraction> 0|1|…. |9

Contoh Begin A : = 1; B : = A + 2 END

Contoh Begin A : = 1; B : = A + 2 END

Diagram State n Digunakan untuk mendapatkan token, mempermudah melakukan analisis lexical n Token adalah

Diagram State n Digunakan untuk mendapatkan token, mempermudah melakukan analisis lexical n Token adalah simbol terminal dari teori bahasa dan automata

Contoh : suatu tata bahasa memiliki himpunan simbol terminal/token berikut (ID, PLUS, MINUS, dan

Contoh : suatu tata bahasa memiliki himpunan simbol terminal/token berikut (ID, PLUS, MINUS, dan INT) token ID untuk karakter huruf a-z, 0 -9, token INT untuk digit, token PLUS untuk Penjumlahan dan token MINUS untuk Pengurangan PLUS MINUS + huruf ID Huruf, Digit S Digit Blank INT Digit

Notasi BNF (Backus-Nour Form) n Aturan Produksi bisa dinyatakan dengan notasi BNF n BNF

Notasi BNF (Backus-Nour Form) n Aturan Produksi bisa dinyatakan dengan notasi BNF n BNF menggunakan abstraksi untuk struktur syntax : : = sama identik dengan simbol | sama dengan atau <> pengapit simbol non terminal {} Pengulangan dari 0 sampai n kali Misalkan aturan produksi sbb: E T | T+E | T-E T a Notasi BNFnya adalah E : : = <T> | <T> + <E> | <T> - <E> T : : = a

Diagram Syntax n Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis n Menggunakan simbol

Diagram Syntax n Alat bantu (tools) dalam pembuatan parser/ analisis sintaksis n Menggunakan simbol persegi panjang untuk non terminal n Lingkaran untuk simbol terminal Misalnya E T | T+E | T-E E T + -

BNF: <Block> : : = BEGIN <statement> { SEMICOL <statement>} END BEGIN Statement ;

BNF: <Block> : : = BEGIN <statement> { SEMICOL <statement>} END BEGIN Statement ; END

Kualitas dari Waktu yang dibutuhkan untuk kompilasi; Compiler n tergantung dari n ü Algoritma

Kualitas dari Waktu yang dibutuhkan untuk kompilasi; Compiler n tergantung dari n ü Algoritma compiler ü Pembuat (compilator) Compiler itu sendiri Kualitas dari obyek program yang dihasilkan ü n Ukuran yang dihasilkan Fasilitas-fasilitas Integrasi yang lainnya ü IDE (integrated Development Environment)

Struktur COMPILER gram pro Source Lexical Analysis (scanner) alysis n A x a t

Struktur COMPILER gram pro Source Lexical Analysis (scanner) alysis n A x a t Syn ) (parser Interm ediate code mization i t p O e d o C Code Gene ratio n Object code

Keterangan n Lexical Analyzer = scanner, Syntax Analyzer, dan Intermediate Code merupakan fungsi Analisis

Keterangan n Lexical Analyzer = scanner, Syntax Analyzer, dan Intermediate Code merupakan fungsi Analisis dalam compiler, yang bertugas mendekomposisi program sumber menjadi bagian-bagian kecil n Code generation dan Code optimization adalah merupakan fungsi synthesis yang berfungsi melakukan pembangkitan / pembuatan dan optimasi program (object program) n Scanner adalah mengelompok-an program asal/sumber menjadi token n Parser (mengurai) bertugas memeriksa kebenaran dan urutan dari token yang terbentuk oleh scanner

Lexical Analysis (scanner) - berhubungan dengan bahasa n Mengidentifikasikan semua besaran yang membuat suatu

Lexical Analysis (scanner) - berhubungan dengan bahasa n Mengidentifikasikan semua besaran yang membuat suatu bahasa n Mentransformasikan ke token-token n Menentukan jenis dari token-token n Menangani kesalahan n Menangani tabel simbol n Scanner, didesign untuk mengenali - keyword, operator, identifier n Token : separates characters of the source language into group that logically belong together n Misalnya : konstanta, nama variabel ataupun operator dan delimiter (atau sering disebut menjadi besaran lexical)

Lexical Analysis ( Besaran leksikal ) n n n Identifier dapat berupa keyword atau

Lexical Analysis ( Besaran leksikal ) n n n Identifier dapat berupa keyword atau nama kunci, seperti IF. . ELSE, BEGIN. . END (pada Pascal), INTEGER (pascal), INT, FLOAT (Bhs C) Konstanta : Besaran yang berupa bilangan bulat (integer), bilangan pecahan (float/Real), boolean (true/false), karakter, string dan sebagainya Operator; Operator arithmatika ( + - * / ), operator logika ( < =>) Delimiter; Berguna sebagai pemisah/pembatas, seperti kurung-buka, kurung -tutup, titik, koma, titik-dua, titik-koma, white-space White Space: pemisah yang diabaikan oleh program, seperti enter, spasi, ganti baris, akhir file

Lexical Analysis - Contoh n Contoh 1: ada urutan karakter yang disebut dengan statement

Lexical Analysis - Contoh n Contoh 1: ada urutan karakter yang disebut dengan statement fahrenheit : = 32 + celcius * 1. 8, Maka akan diterjemahkan kedalam token-token seperti dibawah ini identifier fahrenheit operator : = integer 32 operator penjumlahan + Identifier operator perkalian real / float celcius * 1. 8

Lexical Analysis - Contoh 2 n n n Setiap bentuk dari token di representasi

Lexical Analysis - Contoh 2 n n n Setiap bentuk dari token di representasi sebagai angka dalam bentuk internal, dan angkanya adalah unik Misalnya nilai 1 untuk variabel, 2 untuk konstanta, 3 untuk label dan 4 untuk operator, dst Contoh instruksi : q n Kondisi : IF A > B THEN C = D; Maka scanner akan mentransformasikan kedalam token-token, sbb:

Lexical Analysis - Contoh 2 l Kondisi l 3 l : 26 l IF

Lexical Analysis - Contoh 2 l Kondisi l 3 l : 26 l IF 20 l A l > 1 l THEN l C 15 21 1 l 1 B D 1 l ; 27 Token-token ini sebagai inputan untuk syntax Analyser , token-token ini bisa berbentuk pasangan item. Dimana Item pertama menunjukkan alamat atau lokasi dari token pada tabel simbol. Item kedua adalah representasi internal dari token. Semua token direpresentasikan dengan informasi yang panjangnya tetap (konstan), suatu alamat (address atau pointer) dan sebuah integer (bilangan bulat)

Syntax Analyzer n Pengelompokan token-token kedalam class syntax (bentuk syntax), seperti procedure, Statement dan

Syntax Analyzer n Pengelompokan token-token kedalam class syntax (bentuk syntax), seperti procedure, Statement dan expression n Grammar : sekumpulan aturan-aturan, untuk mendefinisikan bahasa sumber n Grammar dipakai oleh syntax analyser untuk menentukan struktur dari program sumber n Proses pen-deteksian-nya (pengenalan token) disebut dengan parsing

Syntax Analyzer n Maka Syntax analyser sering disebut dengan parser n Pohon sintaks yang

Syntax Analyzer n Maka Syntax analyser sering disebut dengan parser n Pohon sintaks yang dihasilkan digunakan untuk semantics analyser yang bertugas untuk menentukan ‘maksud’ dari program sumber. n Misalnya operator penjumlahan maka semantics analyser akan mengambil aksi apa yang harus dilakukan

Contoh n Terdapat statement : ( A + B ) * ( C +

Contoh n Terdapat statement : ( A + B ) * ( C + D ) n Akan menghasilkan bentuk sintaksis: <factor>, <term> & <expression>

Syntax tree n Pohon sintaks/ Pohon penurunan (syntax tree/ parse tree) beguna untuk menggambarkan

Syntax tree n Pohon sintaks/ Pohon penurunan (syntax tree/ parse tree) beguna untuk menggambarkan bagaimana memperoleh suatu string dengan cara menurunkan simbol-simbol variable menjadi simbol-simbol terminal. n Misalnya: S AB A a. A | a B b. B | B Penurunan untuk menhasilkan string aabbb

Parsing atau Proses Penurunan Parsing dapat dilakukan dengan cara : n Penurunan terkiri (leftmost

Parsing atau Proses Penurunan Parsing dapat dilakukan dengan cara : n Penurunan terkiri (leftmost derivation) : simbol variable yang paling kiri diturunkan (tuntas) dahulu n Penurunan terkanan (rightmost derivation): variable yang paling kanan diturunkan (tuntas) dahulu n Misalkan terdapat ingin dihasilkan string aabbaa dari context free language: S a AS | a, A Sb. A | ba

Parsing atau Proses Penurunan kiri : S => a. AS Penurunan kanan : S

Parsing atau Proses Penurunan kiri : S => a. AS Penurunan kanan : S => a. AS => a. Sb. AS => a. Aa => aab. AS => a. Sb. Aa => aaabba. S => a. Sbbaa => aabbaa

Parsing Misalnya: S -> a. B | b. A A -> a | a.

Parsing Misalnya: S -> a. B | b. A A -> a | a. S |b. AA B -> b | b. S | a. BB Penurunan untuk string aaabbabba Dalam hal ini perlu untuk melakukan percobaan pemilihan aturan produksi yang bisa mendapatkan solusi

Metode Parsing Perlu memperhatikan 3 hal: l l l Waktu Eksekusi Penanganan Kesalahan Penanganan

Metode Parsing Perlu memperhatikan 3 hal: l l l Waktu Eksekusi Penanganan Kesalahan Penanganan Kode Parsing digolongkan menjadi: n Top-Down Penelusuran dari root ke leaf atau dari simbol awal ke simbol terminal metode ini meliputi: l l n Backtrack/backup : Brute Force No backtrack : Recursive Descent Parser Bottom-Up Metode ini melakukan penelusuran dari leaf ke root

Parsing: Brute force n Memilih aturan produksi mulai dari kiri n Meng-expand simbol non

Parsing: Brute force n Memilih aturan produksi mulai dari kiri n Meng-expand simbol non terminal sampai pada simbol terminal n Bila terjadi kesalahan (string tidak sesuai) maka dilakukan backtrack n Algoritma ini membuat pohon parsing secara top-down, yaitu dengan cara mencoba segala kemungkinan untuk setiap simbol non-terminal n Contoh suatu language dengan aturan produksi sebagai berikut S a. Ad | a. B A b|c B ccd | ddc n Misal ingin dilakukan parsing untuk string ‘accd’

Parsing: Brute force (i) S (ii) S a A (iii) d a S A

Parsing: Brute force (i) S (ii) S a A (iii) d a S A d b Terjadi kegagalan (iii), dilakukan back track (iv) S a A (v) d a S (vi) B c Terjadi kegagalan lagi (iv), dilakukan back-track S a B c c d

Parsing: Brute force Kelemahan dari metode-metode brute-force n Mencoba untuk semua aturan produksi yang

Parsing: Brute force Kelemahan dari metode-metode brute-force n Mencoba untuk semua aturan produksi yang ada sehingga menjadi lambat (waktu eksekusi) n Mengalami kesukaran untuk melakukan pembetulan kesalahan n Memakan banyak memakan memori, dikarenakan membuat backup lokasi backtrack n Grammar yang memiliki Rekursif Kiri tidak bisa diperiksa, sehingga harus diubah dulu sehingga tidak rekursif kiri, Karena rekursif kiri akan mengalami Loop yang terus-menerus

Brute force : Contoh Terdapat grammar/tata bahasa G = (V, T, P, S), dimana

Brute force : Contoh Terdapat grammar/tata bahasa G = (V, T, P, S), dimana V= (“E”, ”T”, ”F”) Simbol Non. Terminal (variable) T= (“i”, ”*”, ”/” , ”+”, ”-”) Simbol Terminal S=”E” Simbol Awal / Start simbol String yang diinginkan adalah i * i aturan produksi (P) yang dicobakan adalah 1. E T | T + E | T - E T F|F*T|F/T F i accept (diterima)

Brute force : Contoh 2. E T | E+T | E-T T F |

Brute force : Contoh 2. E T | E+T | E-T T F | T* F | T / F F i accept (diterima) n Meskipun ada rekursif kiri, tetapi tidak diletakkan sebagai aturan yang paling kiri 3. E E+T | E-T | T T T* F | T / F | F F i Rekursif kiri, program akan mengalami loop

Brute force : Aturan produksi Aturan Produksi yang rekursif memiliki ruas kanan (hasil produksi)

Brute force : Aturan produksi Aturan Produksi yang rekursif memiliki ruas kanan (hasil produksi) yang memuat simbol variabel pada ruas kiri Sebuah produksi dalam bentuk A A merupakan produksi rekursif kanan = berupa kumpulan simbol variabel dan terminal contoh: S d S B ad B bentuk produksi yang rekursif kiri A A merupakan produksi rekursif Kiri contoh: S Sd B B ad

Aturan produksi : Brute force Produksi yang rekursif kanan akan menyebabkan penurunan tumbuh kekanan,

Aturan produksi : Brute force Produksi yang rekursif kanan akan menyebabkan penurunan tumbuh kekanan, Sedangkan produksi yang rekursif kiri akan menyebabkan penurunan tumbuh ke kiri. Contoh: Context free Grammar dengan aturan produksi sebagai berikut:

Aturan produksi : Brute force Dalam Banyak penerapan tata-bahasa, rekursif kiri tidak diinginkan, Untuk

Aturan produksi : Brute force Dalam Banyak penerapan tata-bahasa, rekursif kiri tidak diinginkan, Untuk menghindari penurunan kiri yang looping, perlu dihilangkan sifat rekursif, dengan langkah-langkah sebagai berikut: n Pisahkan Aturan produksi yang rekursif kiri dan yang tidak; misalnya Aturan produksi yang rekursif kiri A A 1 | A 2 |. . . | A n Aturan produksi yang tidak rekursif kiri A 1 | 2 |. . . | n

Aturan produksi : Brute force n lakukan per-ganti-an aturan produksi yang rekursif kiri, sebagai

Aturan produksi : Brute force n lakukan per-ganti-an aturan produksi yang rekursif kiri, sebagai berikut: 1. A 1 Z | 2 Z |. . . | n Z 2 Z 1 | 2 |. . . | n 3 Z 1 Z | 2 Z |. . . | n Z

Aturan produksi : Brute force n Pergantian dilakukan untuk setiap aturan produksi dengan simbol

Aturan produksi : Brute force n Pergantian dilakukan untuk setiap aturan produksi dengan simbol ruas kiri yang sama, bisa muncul variabel Z 1, Z 2 dst, sesuai dengan variabel yang menghasilkan rekurisif kiri Contoh: Tata Bahasa Context free S Sab | a. Sc | dd | ff | Sbd n Pisahkan aturan produksi yang rekursif kiri S Sab | Sbd Ruas Kiri untuk S: 1=ab , 2=bd n Aturan Produksi yang tidak rekursif kiri S a. Sc | dd | ff dari situ didapat untuk Ruas Kiri untuk S: 1 = a. Sc, 2 = dd, 3= ff

Aturan produksi : Brute force n Langkah berikutnya adalah penggantian yang rekursif kiri S

Aturan produksi : Brute force n Langkah berikutnya adalah penggantian yang rekursif kiri S Sab | Sbd, dapat digantikan dengan 1. S a. Sc. Z 1 | dd. Z 1 | ff. Z 1 2. Z 1 ab | bd 3. n Z 1 ab. Z 1 | bd. Z 1 Hasil akhir yang didapat setelah menghilangkan rekursif kiri adalah sebagai Berikut: S a. Sc | dd | ff S a. Sc. Z 1 | dd. Z 1 | ff. Z 1 ab | bd Z 1 ab. Z 1 | bd. Z 1

n Aturan produksi : Brute force Kalau pun tidak mungkin menghilangkan rekursif kiri dalam

n Aturan produksi : Brute force Kalau pun tidak mungkin menghilangkan rekursif kiri dalam penyusunan aturan produksi maka produksi rekursif kiri diletakkan pada bagian belakang atau terkanan, hal ini untuk menghindari looping pada awal proses parsing n Metode ini jarang digunakan, karena semua kemungkinan harus ditelusuri, sehingga butuh waktu yang cukup lama serta memerlukan memori yang besar untuk penyimpanan stack (backup lokasi backtrack) n Metode ini digunakan untuk aturan produksi yang memiliki alternatif yang sedikit

Parsing: Recursive Descent Parser Parsing dengan Recursive Descent Parser n Salah satu cara untuk

Parsing: Recursive Descent Parser Parsing dengan Recursive Descent Parser n Salah satu cara untuk meng-aplikasikan bahasa context free n Simbol terminal maupun simbol variabelnya sudah bukan sebuah karakter n Besaran leksikal sebagai simbol terminalnya, besaran syntax sebagai simbol variablenya /non terminalnya n Dengan cara penurunan secara recursif untuk semua variabel dari awal sampai ketemu terminal n Tidak pernah mengambil token secara mumdur (back tracking) n Beda dengan turing yang selalu maju dan mundur dalam melakukan parsing

Aturan Produksi memakai Recursif Descent : n n Semua simbol variabel dijadikan prosedur/fungsi Jika

Aturan Produksi memakai Recursif Descent : n n Semua simbol variabel dijadikan prosedur/fungsi Jika ketemu simbol terminal pada aturan produksi , maka panggil prosedurnya Penelusuran bersifat top down mengikuti sintaks sesuai pola pada diagram sintaks Fungsi/prosedur ditulis untuk setiap non terminal dari suatu produksi. Setiap fungsi/prosedur akan melemparkan nilai benar atau salah bergantung pada apakah fungsi tersebut mengenali substring yang diterima sebagai ekspansi dari non terminal.

Contoh : Grammar dengan BNF : <program> : : = t_PROG t_ID t_SEMICOL <block>

Contoh : Grammar dengan BNF : <program> : : = t_PROG t_ID t_SEMICOL <block> t_DOT <block> : : = t_BEGIN <statement> {t_SEMICOL <statement>} t_END <statement> : : = t_ID t_ASS <simple exp> | t_IF <exp> t_THEN <statement> t_ELSE <statement> <exp> : : = <simple_exp> t_EQ <simple exp> | <simple_exp> t_LT <simple_exp>| <simple_exp> t_GT <simple_exp> Dst…….

Penggalan program untuk grammar tsb

Penggalan program untuk grammar tsb

Semantics Analyser n Proses ini merupakan proses kelanjutan dari proses kompilasi sebelumnya, yaitu analisa

Semantics Analyser n Proses ini merupakan proses kelanjutan dari proses kompilasi sebelumnya, yaitu analisa leksikal (scanning) dan analisa sintaks (parsing) n Bagian terakhir dari tahapan analisis adalah analisis semantik n Memanfaatkan pohon sintaks yang dihasilkan dari parsing n Proses analisa sintak dan analisa semantik merupakan dua proses yang sangat erat kaitannya, dan sulit untuk dipisahkan

Semantics Analyser Contoh : A : = ( A+B) * (C+D) n Parser hanya

Semantics Analyser Contoh : A : = ( A+B) * (C+D) n Parser hanya akan mengenali simbol-simbol ‘: =‘, ‘+’, dan ‘*’, parser tidak mengetahui makna dari simbol-simbol tersebut n Untuk mengenali makna dari simbol-simbol tersebut, Compiler memanggil routin semantics

Semantics Analyser Untuk mengetahui makna, maka routin ini akan memeriksa: n Apakah variabel yang

Semantics Analyser Untuk mengetahui makna, maka routin ini akan memeriksa: n Apakah variabel yang ada telah didefinisikan sebelumnya n Apakah variabel-variabel tersebut tipenya sama n Apakah operand yang akan dioperasikan tersebut ada nilainya, dan seterusnya n Menggunakan tabel simbol n Pemeriksaan bisa dilakukan pada tabel identifier, tabel display, dan tabel block

Semantics Analyser Pengecekan yang dilakukan dapat berupa: n Memeriksa penggunaan nama-nama (keberlakuannya) l Duplikasi

Semantics Analyser Pengecekan yang dilakukan dapat berupa: n Memeriksa penggunaan nama-nama (keberlakuannya) l Duplikasi Apakah sebuah nama terjadi pendefinisian lebih dari dua kali. Pengecekan dilakukan pada bagian pengelolaan block l Terdefinisi Apakah nama yang dipakai pada program sudah terdefinisi atau belum. Pengecekan dilakukan pada semua tempat kecuali block n Memeriksa tipe Melakukan pemeriksaan terhadap kesesuaian tipe dalam statement - statement yang ada, Misalnya bila terdapat suatu operasi, diperiksa tipe operand nya

Semantics Analyser Contohnya; n expresi yang mengikut IF berarti tipenya boolean, akan diperiksa tipe

Semantics Analyser Contohnya; n expresi yang mengikut IF berarti tipenya boolean, akan diperiksa tipe identifier dan tipe ekspresinya n Bila ada operasi antara dua operand maka tipe operand pertama harus bisa dioperasikan dengan operand yang kedua Analisa Semantic sering juga digabungkan dengan intermediate code yang akan menghasilkan output intermediate code. Intermediate code ini nantinya akan digunakan pada proses kompilasi berikutnya (pada bagian back end compilation)

Intermediate Code n Memperkecil usaha dalam membuat compilator dari sejumlah bahasa ke sejumlah mesin

Intermediate Code n Memperkecil usaha dalam membuat compilator dari sejumlah bahasa ke sejumlah mesin n Lebih Machine Independent, hasil dari intermediate code dapat digunakan lagi pada mesin lainnya n Proses Optimasi lebih mudah. Lebih mudah dilakukan pada intermediate code dari pada program sumber (source program) atau pada kode assembly dan kode mesin n Intermediate code ini lebih mudah dipahami dari pada kode assembly atau kode mesin n Kerugiannya adalah melakukan 2 kali transisi, maka dibutuhkan waktu yang relatif lama

Intermediate Code Ada dua macam intermediate code yaitu Notasi Postfix dan N-Tuple Notasi POSTFIX

Intermediate Code Ada dua macam intermediate code yaitu Notasi Postfix dan N-Tuple Notasi POSTFIX <Operand> < Operator> Misalnya : ( a +b ) * ( c+d ) maka Notasi postfixnya ab+ cd+ * Semua instruksi kontrol program yang ada diubah menjadi notasi postfix, misalnya IF <expr> THEN <stmt 1> ELSE <stmt 2>

POSTFIX Diubah ke postfix menjadi ; <expr> <label 1> BZ <stmt 1> <label 2>

POSTFIX Diubah ke postfix menjadi ; <expr> <label 1> BZ <stmt 1> <label 2> BR < stmt 2> BZ : Branch if zero (salah) BR: melompat tanpa harus ada kondisi yang ditest Contoh : IF a > b THEN c : = d ELSE c : = e

POSTFIX Contoh : IF a > b THEN c : = d ELSE c

POSTFIX Contoh : IF a > b THEN c : = d ELSE c : = e Dalam bentuk Postfix 11 a 19 12 b 20 25 13 > 21 BR 14 22 22 c 15 BZ 23 e 16 c 24 : = 17 d 25 18 : = bila expresi (a>b) salah, maa loncat ke instruksi 22, Bila expresi (a>b) benar tidak ada loncatan, instruksi berlanjut ke 16 -18 lalu loncat ke 25

POSTFIX Contoh: WHILE <expr> DO <stmt> Diubah ke postfix menjadi ; Instruksi : <expr>

POSTFIX Contoh: WHILE <expr> DO <stmt> Diubah ke postfix menjadi ; Instruksi : <expr> <label 1> BZ <stmt> <label 2> BR a: = 1 WHILE a < 5 DO a : = a + 1 Dalam bentuk Postfix 10 a 18 a 11 1 19 a 12 : = 20 1 13 a 21 + 14 5 22 : = 15 < 23 16 25 24 BR 17 BZ 25 13

TRIPLES NOTATION Notasi pada triple dengan format <operator> <operand> Contoh: A : = D

TRIPLES NOTATION Notasi pada triple dengan format <operator> <operand> Contoh: A : = D * C + B / E Jika dibuat intermidiate code triple: 1. * , D, C 2. /, B, E 3. +, (1), (2) 4. : =, A, (3) Perlu diperhatikan presedensi (hirarki) dari operator, operator perkalian dan pembagian mendapatkan prioritas lebih dahulu dari oada penjumlahan dan pengurangan

TRIPLES NOTATION Contoh lain: IF X > Y THEN X : = a -

TRIPLES NOTATION Contoh lain: IF X > Y THEN X : = a - b ELSE X : = a + b Intermidiate code triple: 1. >, X, Y 2. BZ, (1), (6) bila kondisi 1 loncat ke lokasi 6 3. -, a, b 4. : =, X, (3) 5. BR, , (8) 6. +, a, b 7. : =, X, (6)

TRIPLES NOTATION Kelemahan dari notasi triple adalah sulit pada saat melakukan optimasi, maka dikembangkan

TRIPLES NOTATION Kelemahan dari notasi triple adalah sulit pada saat melakukan optimasi, maka dikembangkan Indirect triples yang memiliki dua list; list instruksi dan list eksekusi. List Instruksi berisikan notasi triple, sedangkan list eksekusi mengatur eksekusinya; contoh A : = B + C * D / E F : = C * D List Instruksi List Eksekusi 1. *, C, D 1. 1 2. /, (1), E 2. 2 3. +, B, (2) 3. 3 4. : =, A , (3) 4. 4 5. : =, F, (1) 5. 1 6. 5

Quardruples Notation Format dari quardruples adalah <operator> <operand> <result> Result atau hasil adalah temporary

Quardruples Notation Format dari quardruples adalah <operator> <operand> <result> Result atau hasil adalah temporary variable yang dapat ditempatkan pada memory atau register. Problemnya adalah bagaimana mengelola temporary variable seminimal mungkin Contoh: A : = D * C + B / E Jika dibuat intermidiate codenya : 1. * , D, C, T 1 2. / , B, E, T 2 3. +, T 1, T 2, A

Quardruples Notation n Hasil dari tahapan anlisis diterima oleh code generator (pembangkit kode) n

Quardruples Notation n Hasil dari tahapan anlisis diterima oleh code generator (pembangkit kode) n Intermediate code ditansfromasikan kedalam bahasa assembly atau mesin n Misalnya (A+B)*(C+D) dan diterjemahkan kedalam bentuk quadruple: 1. +, A, B, T 1 2. + , C, D, T 2 3. *, T 1, T 2, T 3 Dapat ditranslasikan kedalam bahasa assembly dengan accumulator tunggal:

Code Generator LDA A ADD B STO T 1 LDA C ADD D STO

Code Generator LDA A ADD B STO T 1 LDA C ADD D STO T 2 LDA T 1 MUL T 2 STO T 3 ( isi A ke dalam accumulator) (isi accumulator dijumlahan dengan B) ( Simpan isi Accumulator ke T 1) hasil dari code generator akan diterima oleh code optimation , Misalnya untuk kode assembly diatas dioptimasikan menjadi: LDA ADD STO LDA ADD MUL STO A B T 1 C D T 1 T 2

Perjalanan sebuah intruksi <assign> Id 1 : = <Expr> Source Program X =Y+X Analisis

Perjalanan sebuah intruksi <assign> Id 1 : = <Expr> Source Program X =Y+X Analisis Leksikal Token-token Id 1: =Id 2+Id 1 LDA A ADD Y Id 2 + Id 1 Code Generator STO X Analisis dan Analisis Sintaksis sematiks Tabel Simbol

Error Handling n Kesalahan Program n Penanganan Kesalahan n Reaksi Compiler Pada kesalahan n

Error Handling n Kesalahan Program n Penanganan Kesalahan n Reaksi Compiler Pada kesalahan n Error Recovery n Error repair

Kesalahan Program dapat berupa ü Kesalahan leksikal ü Kesalahan Sintaks ü Kesalahan Semantics

Kesalahan Program dapat berupa ü Kesalahan leksikal ü Kesalahan Sintaks ü Kesalahan Semantics

Error Handling - Kesalahan Program dapat berupa ü ü Kesalahan leksikal n Kesalahan dalam

Error Handling - Kesalahan Program dapat berupa ü ü Kesalahan leksikal n Kesalahan dalam mengetik/mengeja n Misal THEN dituliskan dengan TEN atau THN Kesalahan Sintaks n misalnya dalam operasi aritmatika dengan tanda kurung yang jumlahnya kurang, contoh n ü A: = X + (B * (C+D) Kesalahan Semantics

Error Handling - Kesalahan Program ü Kesalahan Semantics n Tipe data yang salah Contoh

Error Handling - Kesalahan Program ü Kesalahan Semantics n Tipe data yang salah Contoh : int c; c = 1. 5 * 0. 78 n Variable belum didefinisikan Misal : B : = B + 1 tetapi b belum didefinisikan

Error Handling - Penanganan Kesalahan Langkah-langkah: ü Mendeteksi kesalahan ü Melaporkan kesalahan ü Tindak

Error Handling - Penanganan Kesalahan Langkah-langkah: ü Mendeteksi kesalahan ü Melaporkan kesalahan ü Tindak lanjut perbaikan

Error Handling - Penanganan Kesalahan ü Misal: compiler menemukan kesalahan, yang bisa meliputi n

Error Handling - Penanganan Kesalahan ü Misal: compiler menemukan kesalahan, yang bisa meliputi n Kode kesalahan n Pesan Kesalahan dalam bahasa alami n Nama dan atribut identifier n contoh : error 162 Jumlah: Unknow identifier n Dapat diartikan: Kode kesalahan =162, pesan kesalahan = unknown identifier, nama identifier = jumlah

Error Handling - Reaksi terhadap Kesalahan Ada Beberapa reaksi yang dilakukan oleh compiler ü

Error Handling - Reaksi terhadap Kesalahan Ada Beberapa reaksi yang dilakukan oleh compiler ü Reaksi-reaksi yang tidak dapat diterima ü Reaksi yang benar, tapi kurang dapat diterima dan kurang bermanfaat

Error Handling - Reaksi terhadap Kesalahan Ada Beberapa reaksi yang dilakukan oleh compiler ü

Error Handling - Reaksi terhadap Kesalahan Ada Beberapa reaksi yang dilakukan oleh compiler ü Reaksi-reaksi yang tidak dapat diterima l Compilator crash: Berhenti atau hang l Looping : compilator tidak bisa berhenti (infinite/onbounded loop) l Menghasilkan Obyek program yang salah : berbahaya, bisa diketahui/muncul setelah program dieksekusi

Error Handling - Reaksi terhadap Kesalahan Ada Beberapa reaksi yang dilakukan oleh compiler ü

Error Handling - Reaksi terhadap Kesalahan Ada Beberapa reaksi yang dilakukan oleh compiler ü Reaksi yang benar, tapi kurang dapat diterima dan kurang bermanfaat l Compilator menemukan kesalahan pertama, melaporkannya, lalu berhenti (halt) l Pemrogram membuang waktu untuk melakukan pengulangan compilasi untuk setiap kali terdapat sebuah error

Error Handling - Reaksi terhadap Kesalahan ü Reaksi-reaksi yang dapat diterima l l Reaksi

Error Handling - Reaksi terhadap Kesalahan ü Reaksi-reaksi yang dapat diterima l l Reaksi yang sudah dapat dilakukan ; Compilator melaporkan Error n Recovery : Pemulihan n Repair : Perbaikan Reaksi yang belum dapat dilakukan n Compiler mengkoreksi kesalahan n Menghasilkan obyek program sesuai yang diinginkan pemrogram n Compiler memiliki kemampuan untuk ‘mengetahui’ maksud dari pemrogram n Belum diimplementasikan pada program (sekarang ini)

Error Handling - Error Recovery Bertujuan mengembalikan parser ke kondisi stabil agar supaya dapat

Error Handling - Error Recovery Bertujuan mengembalikan parser ke kondisi stabil agar supaya dapat melanjutkan proses parsing ke posisi selanjutnya. ü ü Mekanisme Ad Hoc l Recovery yang dilakukan tergantung dari si pembuat compiler l Tidak terikat pada suatu aturan tertentu l Disebut juga dengan istilah purpose error recovery Syntax directed Recovery misal begin A : = A + 1 ; B : = B + 1; C : = C + 1 end ;

Error Handling - Error Recovery Pada contoh diatas, compiler akan mengenali sebagai (dalam Notasi

Error Handling - Error Recovery Pada contoh diatas, compiler akan mengenali sebagai (dalam Notasi BNF) begin <statement> ? , statement> ; <statement> end; ? Akan diperlakukan sebagai ‘; ’ Second Error Recovery : untuk melokalisir kesalahan l Panic Mode n Maju terus sampai ketemu delimiter n Contoh : IF A = 1 Kondisi : = true; n l Pada kondisi diatas THEN tidak ada, compiler melanjutkan sampai ketemu delimiter (; ) Unit Deletion n n Menghapus keseluruhan suatu unit sintaksik (misalnya : <block>, <exp>, <statement> dan sebagainya Mempermudah untuk melakukan error repairing

Error Handling - Error Recovery l Context Sensitive Recovery n Berkaitan dengan semantics n

Error Handling - Error Recovery l Context Sensitive Recovery n Berkaitan dengan semantics n contoh : B : = ‘Budi Luhur’ n Pada awal program variabel B belum dideklarasikan, maka berdasarkan permunculannya maka diasumsikan variabel B bertipe string

Error Handling - Error repair Memperbaiki kesalahan dan membuat source program valid (memodifikasi) ü

Error Handling - Error repair Memperbaiki kesalahan dan membuat source program valid (memodifikasi) ü Mekanisme Ad Hoc l ü Tergantung pada sipembuat compiler Syntax directed Repair l Menyisipkan / membuang simbol terminal yang dianggap hilang atau yang menyebabkan error l contoh WHILE A < 1 I : = I = 1; l compiler akan menyisipkan DO

Error Handling - Error repair l Contoh lain Procedure Increment ; begin x :

Error Handling - Error repair l Contoh lain Procedure Increment ; begin x : = X + 1 end; l Kelebihan simbol end, yang menyebabkan kesalahan, maka compiler akan membuangnya

Error Handling - Error repair ü Context Sensitive Repair l Tipe identifier: membuat identifier

Error Handling - Error repair ü Context Sensitive Repair l Tipe identifier: membuat identifier dummy var A : String begin A : = 0; end maka compilator akan memperbaiki kesalahan dengan membuat identifier baru , misalnya B bertipe integer l Spelling Repair: memperbaiki kesalahan pengetikan pada identifier, misalnya: WHILLE A = 1 DO identifier yang salah tersebut diperbaiki menjadi WHILE

Teknik Optimasi n Dependensi Optimasi n Optimasi Lokal n Optimasi Global n Dependensi Optimasi

Teknik Optimasi n Dependensi Optimasi n Optimasi Lokal n Optimasi Global n Dependensi Optimasi bertujuan untuk menghasilkan kode program yang berukuran lebih kecil dan lebih cepat l Machine Dependent Optimizer l Machine Independent Optimizer (Optimasi lokal dan Optimasi global)

Teknik Optimasi : Optimasi Lokal : adalah optimasi yang dilakukan hanya pada suatu blok

Teknik Optimasi : Optimasi Lokal : adalah optimasi yang dilakukan hanya pada suatu blok dari source code, dengan cara: ü Folding menganti konstata atau ekpresi yang bisa dievaluasi pada saat compile time dengan nilai komputasinya. Misalnya: A : = 2 + 3 + B bisa diganti dengan A: = 5 + B 5 dapat mengantikan ekspresi 2 + 3 ü Redundant-Subexpression Elimination hasilnya digunakan lagi dari pada dilakukan computasi ulang, contoh: A: = B + C X : = Y + B + C

Teknik Optimasi : Optimasi Lokal ü Optimasi dalam sebuah Iterasi l Loop Unrrolling: Menganti

Teknik Optimasi : Optimasi Lokal ü Optimasi dalam sebuah Iterasi l Loop Unrrolling: Menganti suatu loop dengan menulis statement yang ada dalam loop ditulis beberapa kali l Karena sebuah iterasi pada implemnetasi ke level rendah, memerlukan : n Inisialisasi nilai awal, pada loop dilakukan sekali pada saat permulaan eksekusi loop n Penge-test-an, apakah variabel loop telah mencapai kondisi terminasi n Adjustment yaitu: penambahan atau pengurangan nilai pada variabel loop dengan jumlah tertentu n Operasi yang terjadi pada tubuh perulangan (loop body)

Teknik Optimasi : Optimasi Lokal n Contoh : FOR I : = 1 to

Teknik Optimasi : Optimasi Lokal n Contoh : FOR I : = 1 to 2 DO A[I] : = 0; dapat dioptimasikan menjadi A[1] : = 0; A[2] : = 0; n Frequency Reduction: Pemindahan statement ke tempat yang lebih jarang dieksekusi, contoh FOR I: = 1 to 10 DO BEGIN X : = 5 A : = A + 1 END: X : = 5 FOR I: = 1 to 10 DO BEGIN A : = A + 1 END:

Teknik Optimasi : Optimasi Lokal ü Strength Reduction q Penggantian suatu operasi dengan operasi

Teknik Optimasi : Optimasi Lokal ü Strength Reduction q Penggantian suatu operasi dengan operasi lain yang lebih cepat dieksekusi q misalnya: pada komputer operasi perkalian memerlukan waktu eksekusi lebih banyak dari pada operasi penjumlahan q contoh lain A: = A + 1 q dapat digantikan dengan INC(A)

Teknik Optimasi : Optimasi GLobal Optimasi global biasanya dilakukan dengan suatu graph terarah yang

Teknik Optimasi : Optimasi GLobal Optimasi global biasanya dilakukan dengan suatu graph terarah yang menunjukkan jalur yang mungkin selama eksekusi program ada dua kegunaan yaitu bagi programmer dan compiler itu sendiri ü Bagi Programmer q Unreachable/dead code: Kode yang tidak pernah dieksekusi misalnya : X : = 5; IF X = 0 THEN A : = A + 1 Instruksi A : = A + 1 tidak pernah dikerjakan q

Teknik Optimasi : Optimasi GLobal q Unused parameter : parameter yang tidak pernah digunakan

Teknik Optimasi : Optimasi GLobal q Unused parameter : parameter yang tidak pernah digunakan dalam procedure n Misalnya : procedure penjumlahan(a, b, c ; Integer); var x : integer; begin x : = a + b; end Parameter c tidak pernah digunakan sehingga tidak perlu diikut sertakan

Teknik Optimasi : Optimasi GLobal n Unsused Variabel : variabel yang tidak pernah dipergunakan

Teknik Optimasi : Optimasi GLobal n Unsused Variabel : variabel yang tidak pernah dipergunakan Program pendek; var a, b: integer begin a : = 5; end; n B tidak pernah digunakan

Teknik Optimasi : Optimasi GLobal n Variabel : variabel yang dipakai tanpa nilai awal.

Teknik Optimasi : Optimasi GLobal n Variabel : variabel yang dipakai tanpa nilai awal. Contoh n ü Program Awal; var a, b: integer begin a : = 5 a : = a + b; end; variabel b digunakan tetapi tidak memiliki harga awal Bagi Compiler q q Meningkatkan efisiensi eksekusi program Menghilangkan useless code/kode yang tidak terpakai

var A, B, C, D, E, I, J, X, Y : integer; begin B

var A, B, C, D, E, I, J, X, Y : integer; begin B : = 5; A : = 10 - B / 4 * 3 + 2; C : = A + B; Y : = 10; D : = A + B – E; for I : = 1 to 85 do begin X : = X + 1; B : = B – X; Y : = 7; end While Y< 5 do E : = E – B; end

Tabel Informasi Dua fungsi penting Tabel Informasi l Untuk membantu pemeriksaan kebenaran semantik dari

Tabel Informasi Dua fungsi penting Tabel Informasi l Untuk membantu pemeriksaan kebenaran semantik dari program sumber l Untuk membantu dan mempermudah dalam pembuatan intermediate code dan proses pembuatan kode-kode (pembangkitan kode)

Tabel Informasi Secara umum, sebuah tabel simbol bisa memiliki elemen-elemen tabel sebagai berikut, meskipun

Tabel Informasi Secara umum, sebuah tabel simbol bisa memiliki elemen-elemen tabel sebagai berikut, meskipun tidak semuanya dipergunakan oleh semua compiler l No. urut identifier: menentukan nomor urut pada tabel simbol l Nama identifier

Tabel Informasi - Kegunaan l Tipe identifier l Object time address l Dimensi dari

Tabel Informasi - Kegunaan l Tipe identifier l Object time address l Dimensi dari identifier yang bersangkutan l Nomor baris variabel yang dideklarasikan l Nomor baris variabel yang direferensikan l Field link

Tabel Informasi - Implementasi Ada beberapa jenis Tabel Informasi l Tabel identifier; berfungsi menampung

Tabel Informasi - Implementasi Ada beberapa jenis Tabel Informasi l Tabel identifier; berfungsi menampung semua identifier yang terdapat dalam program l Tabel Array: berfungsi menampung informasi tambahan untuk sebuah array l Tabel blok: mencatat varibel-variabel yang ada pada blok yang sama l Tabel Real: Menyimpan elemen tabel bernilai real l Tabel string: menyimpan informasi string l Tabel display: mencatat blok yang aktif

Tabel Informasi - Identifier Tabel Identifier memiliki; l No Urut identifier dalam tabel l

Tabel Informasi - Identifier Tabel Identifier memiliki; l No Urut identifier dalam tabel l Nama Identifier l Jenis dari identifier; seperti Prosedur, fungsi, tipe variabel dan konstanta l Tipe dari identifier yang bersangkutan; seperti Integer (bilangan bulat), Char, boolean , array, record, file l level dari identifier (depth of block); hal ini menyangkut letak identifier dalam program, konsepnya sama dengan pembentukan tree, misalnya main program level 0

Tabel Informasi - Identifier Untuk identifier, pencatatan dapat berupa seperti; l Alamat relatif/address dari

Tabel Informasi - Identifier Untuk identifier, pencatatan dapat berupa seperti; l Alamat relatif/address dari identifier untuk implementasi l Informasi referensi dari identifier terntentu ke alamat tabel identifier yang lainnya l link; menghubung antar identifier l Normal: digunakan pada pemanggilan parameter, untuk membedakan parameter by value dan by reference l Contoh (dalam pascal)

Program A; Var B : Integer; Procedure X (Z: char) Tabel Informasi Identifier var

Program A; Var B : Integer; Procedure X (Z: char) Tabel Informasi Identifier var C : Integer begin. . dst Tabel identifier akan mencatat semua identifier; 0 A 1 B 2 X 3 Z 4 C

Tab. Id: Array [0. . tabmax] of record nama : String; link : integer;

Tab. Id: Array [0. . tabmax] of record nama : String; link : integer; Obj : object; Tabel Informasi - contoh Tipe : Types; ref : Integer; normal : Boolean; Level : 0. . Maxlevel; address : Integer; End Dimana objek =(konstant, variabel, prosedur, fungsi) Types = (notipe, int, reals, booleans, chars, arrays, record

Tabel Informasi - Array Tabel Array dipergunakan untuk menyimpan informasi suatu identifier yang bertipe

Tabel Informasi - Array Tabel Array dipergunakan untuk menyimpan informasi suatu identifier yang bertipe array, tabel ini memilik field: l No. Urut suatu array dalam tabel l Tipe dari indeks array yang bersangkutan l Tipe element array l Referensi dari elemen array l Index batas dan bawah array l Jumlah elemen array l Ukuran total array (total = atas - bawah + 1) x elemen size l Elemen size

Tabel Informasi - Block Tabel Blok Dipergunakan untuk menyimpan informasi blok yang ada pada

Tabel Informasi - Block Tabel Blok Dipergunakan untuk menyimpan informasi blok yang ada pada tabel utama. Berisikan field l no urut blok l batas awal blok l batas akhir blok l ukuran parameter/parameter size l ukuran variabel/ variabel size l last variabel l last parameter

Tabel Informasi - Block Contoh Program A Var B : Integer; Procedure X (Z:

Tabel Informasi - Block Contoh Program A Var B : Integer; Procedure X (Z: char); Var C : Integer; begin. . Untuk Blok A Blok B last variable =2 4 Variable size = 2 (dianggap int 2 byte) 2 Last parameter = 0 (tanpa parameter) 3 parameter size =0 1 (char butuh 1 byte)

Tabel Informasi - Implementasi Tabel Real Dipergunakan untuk menyimpan nilai dari suatu identifier yang

Tabel Informasi - Implementasi Tabel Real Dipergunakan untuk menyimpan nilai dari suatu identifier yang bertipe real (pecahan). Elemen-elemen dari tabel ini adalah sebagai berikut; n NO urut elemen n Nilai real suatu variabel real yang mengacu ke indeks tabel ini Pemikirannya disini setiap tipe yang memiliki oleh suatu bahasa akan memiliki tabelnya sendiri

Tabel Informasi - Implementasi Tabel String Dipergunakan untuk menyimpan informasi string yang terdapat pada

Tabel Informasi - Implementasi Tabel String Dipergunakan untuk menyimpan informasi string yang terdapat pada program sumber. Elemen-elemen yang terdapat dalam tabel ini adalah: q no Urut elemen q Karakter-karakter yang merupakan konstanta

Tabel Informasi - Implementasi Tabel Display menyimpan informasi-informasi mengenai blok-blok yang lagi aktif. Elemen

Tabel Informasi - Implementasi Tabel Display menyimpan informasi-informasi mengenai blok-blok yang lagi aktif. Elemen -elemen yang terdapat dalam tabel ini adalah: q No Urut tabel q Blok yang aktif Pengisian tabel display dilakukan dengan konsep stack