La teora de autmatas y lenguajes formales en

  • Slides: 15
Download presentation
La teoría de autómatas y lenguajes formales, en la práctica J. Troyano, Víctor Díaz,

La teoría de autómatas y lenguajes formales, en la práctica J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E. T. S. Ingeniería Informática Universidad de Sevilla

Contenido • La materia Teoría de Lenguajes Formales y Autómatas (TLFA) • Una apuesta:

Contenido • La materia Teoría de Lenguajes Formales y Autómatas (TLFA) • Una apuesta: Las Cadenas de Markov • Propuesta Didáctica • Conclusiones

Características TLFA • Contenidos jóvenes pero muy consolidados • Notación rigurosa • Bibliografía Materia

Características TLFA • Contenidos jóvenes pero muy consolidados • Notación rigurosa • Bibliografía Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones – – [1972] [1979] [1986] [2001] Aho y Ullman Hopcroft y Ullman Aho, Setti y Ullman Hopcroft, Motwani y Ullman • Doble justificación – Científica: Límites de la computación – Técnica: Compiladores

La Materia TLFA en LSI LFA Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones

La Materia TLFA en LSI LFA Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones Troncal (4. 5 Créditos) 2º Curso Teoría Laboratorio Nociones Básicas Lenguajes Regulares Lenguajes Incontextuales Jerarquía de Chomsky Flex Bison ALFA Obligatoria (4. 5 Créditos) Teoría Extensión de los Autómatas Finitos Límites de los Lenguajes Regulares Límites de los Lenguajes Incontextuales Máquinas de Turing 3º Curso Laboratorio ?

Las cadenas de Markov • Propuestas por A. Markov (aprox. 1900) para averiguar la

Las cadenas de Markov • Propuestas por A. Markov (aprox. 1900) para averiguar la siguiente letra en un texto ruso • Procesos estocásticos discretos con una limitada dependencia temporal entre sucesos Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones (O 1, O 2, . . . , On) • Aplicaciones (Clasificador): – – – – Etiquetado gramatical Identificación de idiomas Desambiguación de significados Reconocimiento de voz Reconocimiento de imágenes Bioinformática. .

Autómatas Finitos a b q 0 q 1 b Materia TLFA Cadenas de Markov

Autómatas Finitos a b q 0 q 1 b Materia TLFA Cadenas de Markov a a b a q 2 Propuesta Didáctica Conclusiones q

Máquinas Secuenciales b q 0 b Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones

Máquinas Secuenciales b q 0 b Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones 0 a a q 1 a q 2 1 b a 0 q / 1

Cadenas de Markov Visibles 0. 3 0. 2 Materia TLFA Cadenas de Markov Propuesta

Cadenas de Markov Visibles 0. 3 0. 2 Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones q 0 q 1 0. 8 0. 5 0. 7 q 2 q

Cadenas de Markov Ocultas b: 0. 7 q 0. 2 q 1 0. 8

Cadenas de Markov Ocultas b: 0. 7 q 0. 2 q 1 0. 8 Cadenas de Markov Propuesta Didáctica 0. 3 q 0 Materia TLFA 0. 5 a: 0. 3 0. 5 0. 7 q 2 b: 1. 0 Conclusiones a: 0. 6 / b: 0. 4 a

Etiquetado gramatical 0. 67 perro NOM . . . DET . . . 0.

Etiquetado gramatical 0. 67 perro NOM . . . DET . . . 0. 08 0. 0013 0. 47 el Materia TLFA 0. 09 0. 002 0. 423 0. 05 la agua VER Cadenas de Markov 0. 0003 0. 00018 . . . Propuesta Didáctica bebe piensa Conclusiones Entrada El perro bebe agua Salida DET NOM VER NOM

Problemática • ¿Cómo obtener un modelo de Markov que se ajuste a las relaciones

Problemática • ¿Cómo obtener un modelo de Markov que se ajuste a las relaciones reales entre etiquetas gramaticales y palabras? – Aprendizaje supervisado en base a las frecuencias relativas calculadas a partir de un corpus etiquetado Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones • Dada una frase sin etiquetar ¿cuál es la etiqueta más probable para cada palabra de la frase según el modelo de Markov? – Algoritmo de Viterbi (Algoritmo de maximización utilizando técnicas de Programación Dinámica)

Arquitectura Materia TLFA Corpus Texto Cadenas de Markov Propuesta Didáctica Entrenamiento (Cálculo de probabilidades)

Arquitectura Materia TLFA Corpus Texto Cadenas de Markov Propuesta Didáctica Entrenamiento (Cálculo de probabilidades) Aplicación (Viterbi) Texto etiquetado Conclusiones Modelo

Planificación y Desarrollo • Duración: 1 hora semanal • Recursos: – Corpus etiquetado –

Planificación y Desarrollo • Duración: 1 hora semanal • Recursos: – Corpus etiquetado – Algoritmo de Viterbi – Lenguaje de manipulación textual Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones • Sesiones: – – – – Introducción al lenguaje Perl Expresiones regulares en Perl Tablas asociativas en Perl Cálculo de frecuencias de etiquetas y palabras a partir del corpus Ejecución y prueba de la implementación del modelo de Markov Obtención del modelo de Markov a partir de las frecuencias Aplicación del modelo a un texto sin etiquetar

Conclusiones • Las cadenas de Markov Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones

Conclusiones • Las cadenas de Markov Materia TLFA Cadenas de Markov Propuesta Didáctica Conclusiones – Una materia muy consolidada – Entronca directamente con TLFA (Extensión Probabilística de las Máquinas secuenciales) – Motivación para el alumno: Nuevas perspectivas de aplicación de los autómatas en otras ingenierías – Flexibilidad y enriquecimiento de prácticas de laboratorio – Una herramienta de actualidad utilizada tanto por empresas como por grupos de investigación – Hay un amplio material gratuito en la red (Tutoriales, Presentaciones, Software)

La teoría de autómatas y lenguajes formales, en la práctica ¡¡ GRACIAS !! J.

La teoría de autómatas y lenguajes formales, en la práctica ¡¡ GRACIAS !! J. Troyano, Víctor Díaz, F. Enríquez y J. Barroso Departamento de Lenguajes y Sistemas Informáticos E. T. S. Ingeniería Informática Universidad de Sevilla