Introduccin al Diseo de Compiladores ASIGNATURA COMPILADORES Ao

![BIBLIOGRAFÍA [AHO] Compilers. Principles, Techniques, and Tools Aho, Sethi; Adisson-Wesley – 1986 [TEU] Compiladores: BIBLIOGRAFÍA [AHO] Compilers. Principles, Techniques, and Tools Aho, Sethi; Adisson-Wesley – 1986 [TEU] Compiladores:](https://slidetodoc.com/presentation_image_h/31b69e1a0f837efb1d695afed8ee8de7/image-2.jpg)


































- Slides: 36
Introducción al Diseño de Compiladores ASIGNATURA: COMPILADORES Año 2004 1
BIBLIOGRAFÍA [AHO] Compilers. Principles, Techniques, and Tools Aho, Sethi; Adisson-Wesley – 1986 [TEU] Compiladores: Conceptos fundamentales. Teufel ; Addison Wesley - 1995 [SAN] Compiladores. Teoría y construcción. Sanchís Llorca y Galán Pascual. Paraninfo – 1988 [WIR] Algoritmos + Estructuras de Datos = Programas Niklaus Wirth. Ediciones del Castillo – 1980 [GHE] Conceptos de Lenguajes de Programación Ghezzi, Jazayeri; Ed. Díaz de Santos -1982 -1986 [LEV] Lex &Yacc. Levine; Mason; Brown; O’Reilly & Ass. 1995 Año 2004 2
CONTENIDOS n Tema 1. - Introducción a la Compilación n Tema 2. - Lenguajes, autómatas y gramáticas n Tema 3. - Análisis léxico n Tema 4: Tablas de Símbolos n Tema 5. - Análisis sintáctico n Tema 6. - Análisis semántico n Tema 7. - Principios básicos de la fase de síntesis Año 2004 3
INTRODUCCIÓN Año 2004 4
Conceptos relacionados Arquitectura de Computadoras Teoría de Lenguajes de Programación Compiladores Ingeniería de Software Teoría de Algoritmos Con algunas técnicas básicas de escritura de compiladores se pueden construir traductores para una gran variedad de lenguajes y máquinas Año 2004 5
Compiladore s Un compilador es un programa que lee un programa en un lenguaje y lo traduce a un programa equivalente en otro lenguaje, y además informa al usuario sobre la presencia de errores en el programa de entrada programa compilador fuente programa objeto mensajes de error Aparente complejidad- Tareas básicas Año 2004 6
CLASIFICACION GENERAL n n n De una pasada o de múltiples pasadas De carga y de ejecución De depuración o de optimización HISTORIA n n Experimentación relacionada a traducción de fórmulas 1950: difícil escritura Primer FORTRAN: 18 años Hoy: técnicas sistemáticas, lenguajes de implementación, entornos de programación y herramientas de software Año 2004 7
HISTORIA Computadoras Hombre Código Máquina Ensamblador Código Máquina Lenguaje Ensamblador Código Máquina Compilador Lenguaje de Ensamblador Alto Nivel Año 2004 8
HOY…. Y A FUTURO n El Diseño de un compilador surge como resultado de: 4 4 4 n Desarrollo de un nuevo lenguaje de programación Adición de extensiones a los ya existentes Explotación de las características del hardware A futuro: 4 Extensión para el cómputo paralelo y distribuido Año 2004 9
TIPOS DE SISTEMAS DE COMPILACIÓN n ENSAMBLADOR Traducen programas escritos en lenguaje ensamblador a código máquina n COMPILADOR Traducen programas escritos en lenguaje de alto nivel a código intermedio o a código máquina n INTERPRETE No genera código objeto, analiza y ejecuta directamente cada proposición del Programa Fuente (PF) n PREPROCESADOR Sustituyen macros, incluyen archivos o extensión del lenguaje. Año 2004 10
SISTEMA PARA PROCESAMIENTO DE UN LENGUAJE estructura del programa fuente preprocesador programa fuente compilador programa objeto en lenguaje ensamblador código de máquina relocalizable editor de carga y enlace biblioteca archivos obj. relocal. código de máquina absoluto Año 2004 11
PARTES DE LA COMPILACIÓN n n ANÁLISIS (Etapa Inicial): Divide al PF en sus elementos componentes y crea una representación intermedia. Se determinan las operaciones y se registran en una estructura de árbol (ej. árbol sintáctico) SÍNTESIS (Etapa Final): Construye el PO deseado a partir de la representación Intermedia (requiere técnicas más especializadas) Año 2004 12
UN AMBIENTE GENERAL DE COMPILACIÓN Fuente Análisis léxico Análisis sintáctico Análisis semántico Intermedio Más: Sistemas de edición y depuración Generador de código Código relocalizable Enlazador Objeto Año 2004 13
ANÁLISIS DEL PROGRAMA FUENTE n ANALISIS LINEAL (Léxico- Exploración- Scanner) Se lee el programa como una cadena de izquierda a derecha, se agrupan y se generan componentes léxicos o tokens (secuencia de caracteres con significado colectivo) n ANALISIS JERARQUICO (Sintáctico- Parser) Los componentes léxicos se agrupan en colecciones anidadas con un significado colectivo ( frases gramaticales que por lo general se representan mediante árboles sintácticos) n ANALISIS SEMANTICO Se realizan revisiones para asegurar que los componentes de un programa se ajustan de un modo significativo Año 2004 14
EJEMPLO DE ANÁLISIS: posicion : = inicial + velocidad * 60 a ) Componentes léxicos: 1. El identificador posicion 2. El símbolo de asignación : = 3. El identificador inicial 4. El signo de suma: + 5. El identificador velocidad 6. El signo de multiplicación: * 7. El número 60 Los identificadores o nombres reconocidos se organizan en una tabla de símbolos que se usará en los pasos siguientes Año 2004 15
posicion : = inicial + velocidad * 60 b ) Análisis sintáctico (árbol de analis. sint. ) proposición de asignación identificador : = expresión posicion + expresión identificador inicial expresión identificador velocidad Año 2004 * expresión número 60 16
posicion : = inicial + velocidad * 60 b ) Análisis sintáctico ( reglas recursivas) l l l Las construcciones léxicas no requieren recursión (ej. Reconocer un identificador) mientras que las sintácticas suelen requerirlas (ej. Emparejamiento de paréntesis o Begin. End) La estructura jerárquica de un programa normalmente se expresa mediante reglas recursivas Exp : : ident | nro Exp : : Exp + Exp| Exp * Exp | (Exp) Las gramáticas libres de contexto (GLC) son una formalización de reglas recursivas que pueden guiar el análisis sintáctico Año 2004 17
posicion : = inicial + velocidad * 60 c ) Análisis semántico l l l Significado de una unidad gramatical, interpretación Traducir la entrada a una forma de representación intermedia Análisis y verificación de tipos Utiliza la estructura jerárquica del Análisis sintáctico El árbol semántico permite una representación interna compacta del árbol de análisis sintáctico. Ejemplos: : = posicion + inicial * velocidad entareal 60 60 Año 2004 18
FASES DE UN COMPILADOR PROGRAMA FUENTE administrador de la tabla de símbolos analizador léxico analizador sintáctico analizador semántico generador de código intermedio optimizador de código generador de código manejador de errores PROGRAMA OBJETO Cada fase transforma al PF de una representación a otra Año 2004 19
ESQUEMA DE BLOQUES DE UN COMPILADOR FUENTE Compilador ANALISIS Scanner Tabla de símbolos Parser SINTESIS Prep. para la Gen. del código OBJETO Gener. del código Año 2004 20
ESTRUCTURA FUNCIONAL DE UN COMPILADOR (de una pasada) SENTENCIA Fuente Explorador Reconocedor Generador Objeto de código Tabla de símbolos Año 2004 21
COMPILACIÓN DE UNA SENTENCIA EJEMPLO Vel = V 0 + Acel Sentencia fuente a compilar V 1 = V 2 + V 3 Resultado del EXPLORADOR <sent> < sent asign> <var> <expre> + <term> V 1 <term> <fact> = V 2 V 1 V 2 V 3 + = LOAD Acel ADD V 0 STORE Vel <fact> + V 3 RECONOCEDOR: Análisis sintáctico: la sentencia es correcta Sentencia en notación polaca (subproducto del reconocedor) Resultado del GEN. DE CÓDIGO (instrucciones para máquina ) Año 2004 22
posicion : = inicial + velocidad * 60 n A. Lex: n A. Sint: n id 1 : = id 2 + id 3 * 60 : = id 1 + id 2 * id 3 A. Seman: 60 : = id 1 + id 2 * id 3 entareal 60 Año 2004 23
ADMINISTRADOR DE LA TABLA DE SÍMBOLOS n n TABLA DE SÍMBOLOS Estructura de datos que contiene un registro por cada identificador, con los campos para los atributos: -- Información sobre la memoria asignada -- tipo -- ámbito -- Si es nombre de procedimiento (número, tipo y método de paso de cada argumento) Permite encontrar rápidamente cada ID y almacenar o consultar datos de ese registro En el Análisis Léxico se detectan los ID y se introducen en la Tabla de Símbolos Las fases restantes introducen información sobre los ID y después la utilizan Año 2004 24
DETECCIÓN E INFORMACIÓN DE ERRORES n n n Cada fase puede encontrar errores y debe tratarlo para continuar con la Compilación, permitiendo detectar más errores Las fases de Análisis Léxico, Sintáctico y Semántico manejan la mayoría de los errores En el Análisis Semántico se detectan errores donde la estructura sintáctica es correcta pero no tiene significado la operación ( Por. ej. sumar dos ID , donde uno es el nombre de una matriz y el otro un nombre de procedimiento) Año 2004 25
GENERACIÓN DE CÓDIGO INTERMEDIO n n n Se genera una representación intermedia explícita del PF La representación intermedia es como un programa para una máquina abstracta Esta representación debe ser fácil de producir y de traducir al programa objeto Una de ellas es el “código intermedio de 3 direcciones” (Cada posición de memoria puede actuar como registro) ( Cada instrucción tiene como máximo 3 operandos ) Ejemplo t 1 : = entareal (60) t 2 : = id 3 + t 1 t 3 : = id 2 + t 2 id 1 : = t 3 Año 2004 26
OPTIMIZACIÓN DE CÓDIGO n n Trata de mejorar el código intermedio para que resulte un código de máquina más rápido de ejecutar En el ejemplo: t 1 : = id 3 * 60. 0 id 1 : = id 2 + t 1 La conversión a real se hace en compilación No necesita t 2 ni t 3. n n Compiladores optimadores : La fase de optimación ocupa una parte significativa del tiempo del compilador Hay optimaciones sencillas que mejoran el tiempo de ejecución del programa sin retardar mucho la compilación Año 2004 27
GENERACIÓN DE CÓDIGO n n La fase final genera código objeto ( en general código de máquina recolalizable o código ensamblador) Se seleccionan las posiciones de memoria para las variables usadas por el programa. Se traduce cada una de las instrucciones intermedias a una secuencia de instrucciones de máquina Un aspecto decisivo es la asignación de variables a registros. En el ejemplo, utilizando los registros 1 y 2: MOVF id 3, R 2 MULF % 60. 0, R 2 MOVF id 2, R 1 ADDF R 2, R 1 MOVF R 1, id 1 Año 2004 28
PROGRAMAS RELACIONADOS CON UN COMPILADOR n PREPROCESADORES (producen la entrada para un comp. ) Procesamiento de Macros Inclusión de archivos Preprocesadores “ racionales” (estruct. de control) Extensiones a lenguajes ( bases de datos) n ENSAMBLADORES Producen código ensamblador que se pasa a un ensamblador para su procesamiento ( versión mnemotécnica del código de máquina: nombres de operaciones y nombres de direcciones de memoria) n ENSAMBLADO DE DOS PASADAS (lecturas del archivo IN) Primera: Identificadores - Tabla de símbolos Segunda: Traduce códigos de operaciones e identificadores El resultado es código de maquina relocalizable n CARGADORES Y EDITORES DE ENLACE Modifica las direcciones relocalizables y ubica en memoria. Año 2004 Forma un solo prog. desde varios archivos relocalizables 29
AGRUPAMIENTO DE FASES EN LA IMPLEMENTACION n ETAPA INICIAL Y ETAPA FINAL Inicial : Fases que dependen del lenguaje fuente Hasta cierta optimación Final : Partes que dependen de la maq. objeto y del leng. intermedio n PASADAS Se agrupan las actividades de varias fases en una misma pasada (lectura de un archivo de entrada y escritura de un archivo de salida) n REDUCCION DEL NUMERO DE PASADAS Pocas pasadas --> Varias fases dentro de una pasada --> Prog. completo en memoria en representación intermedia Fusión de código intermedio y objeto: “ backpatching” Año 2004 30
HERRAMIENTAS PARA CONSTRUCCIÓN DE COMPIL. n n SIST. DE AYUDA PARA ESCRIBIR COMPILADORES Comp. de comp. / Generadores de comp. / Sist. generadores de traductores HERRAMIENTAS GENERALES PARA EL DISEÑO AUTOMÁTICO DE COMPONENTES ESPECÍFICOS DE UN COMP. Utilizan leng. específicos para especificar e implementar la componente Ocultan detalles del algoritmo de generación Producen componentes que se pueden integrar al resto del compilador Año 2004 31
HERRAMIENTAS PARA CONSTRUCCIÓN DE COMPIL. n GENERADORES DE ANALIZADORES SINTACTICOS Producen AS a partir de una Gramática Libre de Contexto Hoy esta es una de la fases más fáciles de aplicar n n n GENERADORES DE ANALIZADORES LEXICOS Producen AL a partir de una especificación en Expres. Regulares. El AL resultante es un Autómata Finito DISPOSITIVOS DE TRADUC. DIRIGIDA POR LA SINTAXIS Producen grupos de rutinas que recorren el árbol de AS generando código intermedio GENERADORES AUTOMÁTICOS DE CÓDIGO Las proposiciones en cod. Int. se reemplazan por plantillas que representan secuencia de instruc. de máquina n DISPOSITIVOS PARA ANALISIS DE FLUJO DE DATOS Inf. sobre como los valores se transmiten de una parte a Año 2004 otra del programa 32
HERRAMIENTAS PARA CONSTRUCCIÓN DE COMPIL. Lex n n n y YACC Herramientas que nos permiten desarrollar componentes o la mayor parte de un compilador Son un recurso invaluable para el profesional y el investigador Existen paquetes freeware Año 2004 33
ALGUNOS TIPOS ESPECIALES DE COMPILADORES n n n COMPILE- LINK- GO Se compilan segmentos por separado y luego se montan todos los objetos producidos en un módulo cargable listo COMPILADOR DE VARIAS PASADAS No es más lento. Ocupa poca memoria. Fácil de mantener COMPILADOR INCREMENTAL ( o interactivo) Se pueden compilar solo las modificaciones AUTOCOMPILADOR Comp. escrito en el propio leng. que traduce. Portabilidad. METACOMPILADOR Programa al que se le especifica el lenguaje para el que se quiere un comp. y produce el comp. como resultado DECOMPILADOR Traduce de código máquina a leng. de alto nivel Año 2004 34
EL LENGUAJE Y LA HERRAMIENTA MODELO LENGUAJE Compilado Fortran, COBOL, C/C++, Pascal Sintaxis rigurosa, velocidad y tamaño Interpretado Lisp, AWK, BASIC, SQL Desempeño lento. Actividades no planeadas. Sintaxis relajadas Pseudocompilado CARACTERISTICAS Java Transportabilidad absoluta, desempeño intermedio. Sintaxis rigurosa Año 2004 35
ASPECTOS ACADEMICOS Y DE INVESTIGACION AREA BENEFICIOS n Lenguaje de prog. Principios para su desarrollo Herramientas para implementación n Inteligencia artificial Interfases de reconocimiento de lenguaje natural n Sistemas operativos Desarrollo de interfases de control y usuario final. Intérpretes de comandos ( shells) n Diseño de interfaces Desarrollo de interf. orientadas a comando y carácter. Voz o escritura n Administración de proyectos inform. Selección de herramientas de desarrollo. Evaluación de costo y beneficios. Año 2004 36