Calcolatori Elettronici Assemblatore Linker e Loader Francesco Lo
Calcolatori Elettronici Assemblatore, Linker e Loader Francesco Lo Presti rielaborate da Salvatore Tucci Assembler, Linker & 1
Compilazione q Nella prima fase, il programma ad alto livello viene tradotto nel linguaggio assembler utilizzando un apposito programma detto compilatore q Dopo la fase di compilazione, il programma scritto il linguaggio assembler viene tradotto in linguaggio macchina utilizzando un apposito programma detto assemblatore (assembler) q Spesso con il termine compilazione si indica l’intero processo di traduzione da linguaggio ad alto livello a linguaggio macchina (essendo l’assemblatore spesso integrato con il compilatore) Assembler, Linker & 2
Il processo di compilazione Programma sorgente hello. c q Il programma sorgente è scritto in un linguaggio ad alto livello (ad es. , C) compilatore hello. s q Il codice oggetto, scritto Programma in linguaggio assembler in linguaggio macchina, viene memorizzato su disco assemblatore Programma in linguaggio macchina (codice oggetto) hello. out caricatore Programma in memoria q Il caricatore (loader) carica il programma in memoria principale per l’esecuzione Assembler, Linker & 3
Il linker q Il linker (link editor o collegatore) ha il compito di collegare tra loro vari moduli che compongono lo stesso programma m m Programma sorgente suddiviso in più file che vengono compilati separatamente creando diversi file oggetto Utilizzo di funzioni di libreria q Il linker collega tra loro i file contenenti il codice oggetto dei vari moduli che costituiscono il programma, unendovi anche il codice delle funzioni di libreria utilizzate, producendo un file contenente il codice eseguibile, memorizzato su disco Assembler, Linker & 4
Esempio. globl main . globl proc . globl is_in main: . . . proc: is_in: addi $sp, -20 jal proc . . . beq $s 0, $zero, ret addi $t 0, $zero, 0 addi $t 1, $zero, 0 while: slt $t 2, $t 0, $a 2 addi $a 0, $s 0, -1 beq $t 2, $zero, end addi $a 1, $s 1, 0 sll $t 3, $t 0, 2 addi $a 2, $s 2, 0 add $t 3, $a 1, $t 3 jal lw $t 4, 0($t 3) proc addi $s 3, $v 0, 0 bne $t 4, $a 0, inc addi $a 0, $s 0, 0 addi $t 1, $zero, 1 addi $a 1, $s 1, 0 j end addi $a 2, $s 2, 0 inc: jal is_in beq $v 0, $zero, else 2 sll $s 3, 1 addi $t 0, 1 j while end: addi $v 0, $t 1, 0 jr $ra addi $s 3, 1 j ret else 2: addi $s 3, 2 ret: addi $v 0, $s 3, 0. . . addi $sp, 20 jr $ra Assembler, Linker & 5
L’assemblatore q Traduce un modulo in assembler in un file oggetto m Una combinazione di ü Istruzioni in linguaggio macchina ü Dati ü Informazioni per la corretta collocazione del modulo in memoria: Rilocazione m Esempio ü Per poter tradurre in linguaggio macchina le istruzioni di salto, l’assemblatore deve poter determinare gli indirizzi corrispondenti alle etichette usate nei salti (tabella dei simboli) ü Tabella dei simboli: contiene le corrispondenze tra nomi delle etichette (simboli) ed indirizzi di memoria q Il file oggetto prodotto dall’assemblatore assume che il modulo parta dalla locazione di memoria 0 (indirizzi relativi) m Sarà il linker a gestire la rilocazione ü Istruzioni dipendenti da un indirizzo assoluto Assembler, Linker & 6
Il processo di assemblaggio q Il processo di traduzione in linguaggio macchina è semplice, salvo per le istruzioni con riferimenti a etichette locali non ancora dichiarate (riferimenti in avanti: l’etichetta è usata prima di essere definita) q Assemblatore a due passate m Prima passata: calcola la lunghezza delle istruzioni e genera una tabella dei simboli, contenente l’associazione tra i nomi delle etichette ed i corrispondenti indirizzi di memoria m Seconda passata: tutti i riferimenti locali sono noti: usando la tabella dei simboli, può generare il codice macchina q Assemblatore ad una passata m Traduce in codice binario tutte le istruzioni tranne quelle con riferimenti in avanti (tecnica del backpatching) m Mette queste istruzioni in una tabella dei simboli irrisolti m Alla fine traduce anche queste m Maggiore velocità ma intera rappresentazione binaria in memoria Assembler, Linker & 7
Struttura del file oggetto q Nei sistemi Unix, il file oggetto è composto da 6 sezioni distinte m Object file header (intestazione) ü Dimensione e posizione delle altre parti del file oggetto m Segmento di testo ü Codice in linguaggio macchina per le procedure nel file sorgente; possono esserci riferimenti irrisolti (istruzioni contenenti riferimenti a simboli esterni) m Segmento di dati ü Rappresentazione binaria dei dati m Informazioni di rilocazione ü Identificazione di istruzioni e dati da aggiornare al momento della rilocazione, in quanto dipendenti da indirizzi di memoria assoluti m Tabella dei simboli ü Simboli definiti nel modulo e riferibili dall’esterno (etichette globali) e lista dei riferimenti irrisolti (ad es. per uso di funzioni di libreria) m Informazioni per il debugger ü Descrizione concisa del modo in cui il programma è stato compilato Assembler, Linker & 8
Esempio: Primo Passata. globl proc: addi $sp, -20. . . beq $s 0, $zero, ret addi $a 0, $s 0, -1 addi $a 1, $s 1, 0 addi $a 2, $s 2, 0 jal proc addi $s 3, $v 0, 0 Tabella dei Simboli Etichetta Indirizzo proc 0 x 00 else 2 0 x 60 ret 0 x 64 addi $a 0, $s 0, 0 addi $a 1, $s 1, 0 addi $a 2, $s 2, 0 jal is_in beq $v 0, $zero, else 2 sll $s 3, 1 addi $s 3, 1 j ret else 2: addi $s 3, 2 ret: addi $v 0, $s 3, 0. . . addi $sp, 20 jr $ra Assembler, Linker & 9
Esempio: Secondo Passata. globl proc: addi $sp, -20 . . . beq $s 0, $zero, ret beq $s 0, $zero, 14 addi $a 0, $s 0, -1 addi $a 1, $s 1, 0 addi $a 2, $s 2, 0 jal proc addi $s 3, $v 0, 0 addi $a 0, $s 0, 0 Generazione addi $a 1, $s 1, 0 addi $a 2, $s 2, 0 jal is_in 0 x 0 Macchina Etichetta proc else 2 ret Indirizzo 0 x 00 0 x 64 addi $s 3, $v 0, 0 addi $a 0, $s 0, 0 addi $a 1, $s 1, 0 Codice Tabella dei Simboli addi $a 2, $s 2, 0 jal ? ? ? Tabella dei Simboli Etichetta Indirizzo proc 0 x 00 is_in 0 x 4 B beq $v 0, $zero, else 2 beq $v 0, $zero, 3 Relocation Information sll $s 3, 1 addi $s 3, 1 j ret j 0 x 64 else 2: addi $s 3, 2 Istr. jal j ret: addi $v 0, $s 3, 0 . . . addi $sp, 20 jr $ra Indirizzo 0 x 38 0 x 4 B 0 x 5 B Assembler, Linker & 10
Il linker q Ciascun modulo ha il suo spazio degli indirizzi m Quando i moduli vengono collegati occorre traslare i loro spazi degli indirizzi q Occorre risolvere tutti i riferimenti esterni – tramite etichette globali - ossia le chiamate tra moduli e riferimenti a variabili globali q Compiti del linker (a partire dalla tabella dei simboli e dalle informazioni di rilocazione) m m m Porre simbolicamente in memoria istruzioni e dati Determinare gli indirizzi dei dati e delle etichette dei salti Unire i riferimenti interni ed esterni alle procedure q Il linker produce un file oggetto che può essere eseguito sulla macchina m Stesso formato del file oggetto ma con tutti i riferimenti risolti e senza informazioni di rilocazione Assembler, Linker & 11
Esempio 0 x 400000 . . . jal ? ? ? 0 x 4000 AC . . . 0 x 4000 B 0 addi $sp, -20. . . beq $s 0, $zero, 14 addi $a 0, $s 0, -1 addi $a 1, $s 1, 0 addi $a 2, $s 2, 0 jal 0 x 400124 addi $t 1, $zero, 0 0 x 00 slt $t 2, $t 0, $a 2 addi $s 3, $v 0, 0 beq $t 2, $zero, 8 addi $a 0, $s 0, 0 sll $t 3, $t 0, 2 addi $a 1, $s 1, 0 add $t 3, $a 1, $t 3 addi $a 2, $s 2, 0 lw $t 4, 0($t 3) jal ? ? ? bne $t 4, $a 0, 2 beq $v 0, $zero, 3 addi $t 1, $zero, 1 sll $s 3, 1 j 0 x 30 addi $s 3, 1 addi $t 0, 1 j 0 x 64 j 0 x 08 addi $s 3, 2 addi $v 0, $t 1, 0 addi $v 0, $s 3, 0. . . addi $t 0, $zero, 0 0 x 400158 jr $ra addi $sp, 20 0 x 400120 jr $ra Assembler, Linker & 12
Esempio 0 x 400000 . . . jal 0 x 4000 B 0 0 x 4000 AC . . . 0 x 4000 B 0 addi $sp, -20. . . beq $s 0, $zero, 14 addi $a 0, $s 0, -1 addi $a 1, $s 1, 0 addi $a 2, $s 2, 0 jal 0 x 400124 addi $t 1, $zero, 0 0 x 4000 B 0 slt $t 2, $t 0, $a 2 addi $s 3, $v 0, 0 beq $t 2, $zero, 8 addi $a 0, $s 0, 0 sll $t 3, $t 0, 2 addi $a 1, $s 1, 0 add $t 3, $a 1, $t 3 addi $a 2, $s 2, 0 lw $t 4, 0($t 3) jal 0 x 400124 bne $t 4, $a 0, 2 beq $v 0, $zero, 3 addi $t 1, $zero, 1 sll $s 3, 1 j 0 x 400154 addi $s 3, 1 addi $t 0, 1 j 0 x 400104 j 0 x 40012 B addi $s 3, 2 addi $v 0, $t 1, 0 addi $v 0, $s 3, 0. . . addi $t 0, $zero, 0 0 x 400158 jr $ra addi $sp, 20 0 x 400120 jr $ra Assembler, Linker & 13
Istruzioni MIPS da Rilocare q Indirizzi relativi al PC (istruzioni beq e bne): da non rilocare m L’indirizzamento relativo al PC è preservato anche se il codice viene spostato q Indirizzi assoluti (istruzioni j e jal): da rilocare q q sempre Da rilocare anche istruzioni lw e sw che utilizzano il registro $gp per indirizzare dati statici Riferimenti esterni (tipicamente istruzione jal): da rilocare sempre Assembler, Linker & 14
Il loader q Una volta che il linker ha creato il file eseguibile, esso viene di solito memorizzato su disco q All’atto dell’esecuzione, il S. O. lo carica dal disco e ne avvia l’esecuzione q Il loader si occupa di far partire il programma m m m Legge l’intestazione per determinare la dimensione dei segmenti testo e dati Crea uno spazio di memoria sufficiente per testo e dati Copia istruzioni e dati in memoria Copia nello stack i parametri (se presenti) passati al main Inizializza i registri e lo stack pointer Salta ad una procedura di inizializzazione che copia i parametri nei registri appositi dallo stack e poi invoca la procedura di inizio del programma (main() in C) Assembler, Linker & 15
Librerie collegate dinamicamente q Svantaggi del collegamento statico (prima dell’esecuzione del programma) m Le routine della libreria fanno parte del codice eseguibile ü Uso di vecchie versioni della libreria anche se disponibili nuove versioni m Caricamento dell’intera libreria anche se usata parzialmente q Librerie collegate dinamicamente (DLL) m Le routine della libreria non sono collegate e caricate finché il programma non viene eseguito m Ogni routine viene collegata solo dopo essere invocata (lazy procedure linkage) Assembler, Linker & 16
- Slides: 16