CONCEPTOS GENERALES DE LA LINGSTICA COMPUTACIONAL Ana Mara

  • Slides: 29
Download presentation
CONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño

CONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño

OBJETIVO Exponer los conceptos generales de la disciplina, identificando las relaciones y diferencias con

OBJETIVO Exponer los conceptos generales de la disciplina, identificando las relaciones y diferencias con otras áreas disciplinares que comparten su objeto de estudio.

INTERDISCIPLINARIEDAD Lingüística Informática Objetivo: Generar modelos computacionales que reproduzcan uno o más aspectos del

INTERDISCIPLINARIEDAD Lingüística Informática Objetivo: Generar modelos computacionales que reproduzcan uno o más aspectos del lenguaje humano.

ÁREAS DISCIPLINARES INVOLUCRADAS (1) IA Lingüística teórica LC Lingüística aplicada Industrias de la Lengua

ÁREAS DISCIPLINARES INVOLUCRADAS (1) IA Lingüística teórica LC Lingüística aplicada Industrias de la Lengua La LC es un campo interdisciplinariocuyo objetivo es incorporar en los computadores la habilidad en el manejo del lenguaje humano o natural.

ÁREAS DISCIPLINARES INVOLUCRADAS (2) Informática IA LC • Es la ciencia de hacer máquinas

ÁREAS DISCIPLINARES INVOLUCRADAS (2) Informática IA LC • Es la ciencia de hacer máquinas inteligentes. • Diseña máquinas capaces de comprender el lenguaje, aprender, razonar y tomar decisiones.

ÁREAS DISCIPLINARES INVOLUCRADAS (3) • La lingüística es el estudio científico de la lengua.

ÁREAS DISCIPLINARES INVOLUCRADAS (3) • La lingüística es el estudio científico de la lengua. Como tal, se ocupa de descubrir y entender la naturaleza y las leyes que Lingüística gobiernan el lenguaje. teórica LC • Elabora modelos formales (implementables informáticamente) del lenguaje humano.

FUNDAMENTOS DE LA LC Lingüística aplicada LC • Rama de la lingüística que se

FUNDAMENTOS DE LA LC Lingüística aplicada LC • Rama de la lingüística que se ocupa de los problemas que el lenguaje plantea como medio de relación social y de la cual derivan tres ramas o campos de acción: enseñanza de lengua materna, enseñanza de segunda lengua y enseñanza de lenguas asistida por computador. • Aplica los modelos y métodos de investigación lingüísticos en campos como la enseñanza de idiomas, la traducción, etc.

FUNDAMENTOS DE LA LC LC Industrias de la lengua • Elabora programas informáticos (software)

FUNDAMENTOS DE LA LC LC Industrias de la lengua • Elabora programas informáticos (software) para el mercado como los traductores, procesadores de texto, etc. • Entendida como una actividad de índole fundamentalmente comercial, requiere el desarrollo de la ingeniería lingüística para disponer de las herramientas y técnicas a partir de las que se crean productos que realizan diversas funciones relacionadas con la utilización del lenguaje.

OBJETIVOS DE LA LC Comprobar los modelos lingüísticos y las teorías, diseñando algoritmos y

OBJETIVOS DE LA LC Comprobar los modelos lingüísticos y las teorías, diseñando algoritmos y sistemas que puedan ser evaluados y comprendidos en trabajos de procesamiento de lenguaje natural (PLN). Diferencia entre LC y PLN � LC: usa las máquinas computacionales para investigar o tratar los fenómenos lingüísticos. � PLN: aplicaciones concretas para el procesamiento de textos.

VERTIENTES DE LA LC Dado que la LC abarca muchos objetivos es necesario diferenciar

VERTIENTES DE LA LC Dado que la LC abarca muchos objetivos es necesario diferenciar tres vertientes que delimitan su campo de acción: 1. Informática aplicada a la investigación 2. Implementación de teorías lingüísticas 3. Aplicaciones lingüísticas de la informática

INFORMÁTICA APLICADA A LA INVESTIGACIÓN • Su objetivo es emprender el estudio científico del

INFORMÁTICA APLICADA A LA INVESTIGACIÓN • Su objetivo es emprender el estudio científico del lenguaje por medio ordenadores. • Suele recibir el nombre de Lingüística informática o de Informática aplicada a la lingüística. � Ejemplo: conocer el uso del sufijo –able en inglés moderno temprano por medio de un corpus escrito.

IMPLEMENTACIÓN DE TEORÍAS LINGÜÍSTICAS • Su objetivo es elaborar formalismos lingüísticos que son lenguajes

IMPLEMENTACIÓN DE TEORÍAS LINGÜÍSTICAS • Su objetivo es elaborar formalismos lingüísticos que son lenguajes artificiales diseñados específicamente para representar conocimientos lingüísticos y que pueden ser entendidos por los ordenadores. • Suele recibir el nombre de Lingüística computacional en sentido estricto. � Ejemplo: Wordnet, corpus lingüístico para el inglés

APLICACIONES LINGÜÍSTICAS DE LA INFORMÁTICA • Diseña sistemas informáticos encaminados a la comprensión y

APLICACIONES LINGÜÍSTICAS DE LA INFORMÁTICA • Diseña sistemas informáticos encaminados a la comprensión y generación del lenguaje natural. • Esta vertiente recibe el nombre de Procesamiento del lenguaje natural, Tecnologías de la lengua o Ingeniería lingüística. � Ejemplo: tecnologías del habla, traducción automática, sistemas de extracción de información, etc.

PROGRAMAS PRINCIPALES DESARROLLADOS POR LA LINGÜÍSTICA COMPUTACIONAL Modelos de teorías lingüísticas Enseñanza de lenguas

PROGRAMAS PRINCIPALES DESARROLLADOS POR LA LINGÜÍSTICA COMPUTACIONAL Modelos de teorías lingüísticas Enseñanza de lenguas extranjeras Corrección de ortografía y sintaxis de textos Reconocimiento de voz humana Procesamiento de información Sistemas expertos Traducción automática

ÁREAS DE LA LC Análisis automático de la fonética, la fonología, la morfología, la

ÁREAS DE LA LC Análisis automático de la fonética, la fonología, la morfología, la sintaxis y la pragmática. A partir de las siguientes tareas � Etiquetamiento morfológico o tagging � Análisis sintáctico o parsing � Técnicas de reconocimiento automático de voz � Recuperación inteligente de información � Sistemas de diálogo y sistemas expertos � Traducción automática

ANÁLISIS MORFOLÓFICO Tagging (Etiquetador) Análisis automático de las palabras que componen una frase.

ANÁLISIS MORFOLÓFICO Tagging (Etiquetador) Análisis automático de las palabras que componen una frase.

ANÁLISIS SINTÁCTICO Parsing (Parse: analizar sintácticamente) Análisis automático de una oración. Fase inicial para

ANÁLISIS SINTÁCTICO Parsing (Parse: analizar sintácticamente) Análisis automático de una oración. Fase inicial para la interpretación semántica

ANALIZADORES MORFOSINTÁCTICOS Ejemplos para el español � http: //www. gedlc. ulpgc. es/investigacion/desambigua/mo rfosintactico. htm

ANALIZADORES MORFOSINTÁCTICOS Ejemplos para el español � http: //www. gedlc. ulpgc. es/investigacion/desambigua/mo rfosintactico. htm � http: //www. mystilus. com/Morphosyntactic. Analyzer Analizador para el inglés: http: //www 2. lingsoft. fi/cgibin/engcg/

RECUPERACIÓN INTELIGENTE DE INFORMACIÓN Information Retrieval Almacenamiento y envío digital de datos Técnicas de

RECUPERACIÓN INTELIGENTE DE INFORMACIÓN Information Retrieval Almacenamiento y envío digital de datos Técnicas de extracción de datos contenidos en textos y su transmisión a los usuarios Ejemplos: � Bases de datos � Buscadores de internet

SISTEMAS DE DIÁLOGO Y SISTEMAS EXPERTOS Comunicación entre uno o más usuarios y la

SISTEMAS DE DIÁLOGO Y SISTEMAS EXPERTOS Comunicación entre uno o más usuarios y la computadores Sistemas pregunta-respuesta � Ejemplo: Asistente en la instalación de un programa, compras por internet Sistemas expertos � � Representación de conocimiento Generación automática de textos Software de manipulación de datos: Esto requiere un CORPUS amplio sobre los dominios Ejemplos: � Diagnósticos automatizados de enfermedades

TRADUCCIÓN AUTOMÁTICA Representación intermedia de dos o más códigos linguísticos INTERLINGUA Ejemplos: � http:

TRADUCCIÓN AUTOMÁTICA Representación intermedia de dos o más códigos linguísticos INTERLINGUA Ejemplos: � http: //www. reverso. net/text_translation. aspx? lang=ES � http: //translate. google. es/

LC COMO ÁREA DE CONOCIMIENTO Un programa de formación en lingüística computacional debe contener

LC COMO ÁREA DE CONOCIMIENTO Un programa de formación en lingüística computacional debe contener las siguientes áreas de conocimiento: � Lingüística � Matemática � Informática En cuanto a los conocimientos teóricos � Teorías estructuralistas � Teorías generativistas clásicas � Gramática de casos de Fillmore � Gramática funcional � Lingüística algorítmica

PROBLEMAS ACTUALES EN LA LC La LC trabaja en distintos niveles del lenguaje: �

PROBLEMAS ACTUALES EN LA LC La LC trabaja en distintos niveles del lenguaje: � Fonética/Fonología � Morfología � Sintaxis � Semántica � Pragmática

PROBLEMAS ACTUALES EN LA LC FONÉTICA Y FONOLOGÍA Sistemas de análisis y síntesis del

PROBLEMAS ACTUALES EN LA LC FONÉTICA Y FONOLOGÍA Sistemas de análisis y síntesis del habla Reconocimiento de voz Generación de voz Estos desarrollos se dirigen hacia el interés de diseñar programas para el dictado y reconocimiento automático. No presentan aún desarrollos significativos puesto que no se logra modelar flexiones y variaciones en entonaciones particulares en las lenguas

PROBLEMAS ACTUALES EN LA LC MORFOLOGÍA Análisis y síntesis automático morfológico (sufijos, prefijos, raíces

PROBLEMAS ACTUALES EN LA LC MORFOLOGÍA Análisis y síntesis automático morfológico (sufijos, prefijos, raíces y flexiones) Hace falta la construcción de diccionarios robustos Aunque ha habido grandes desarrollos, se requiere una estandarización efectiva del lenguaje para la marcación

PROBLEMAS ACTUALES EN LA LC SINTAXIS Análisis y sintáctico (parser) Es especialmente difícil automatizar

PROBLEMAS ACTUALES EN LA LC SINTAXIS Análisis y sintáctico (parser) Es especialmente difícil automatizar en español donde no hay un orden fijo de las palabras que componen una oración � Ejemplo: ¿Estuviste en el parque el sábado? ¿El sábado estuviste en la parque? ¿Tu estabas en el parque el sábado?

PROBLEMAS ACTUALES EN LA LC SEMÁNTICA Construcción de redes semánticas donde se presenten conceptos

PROBLEMAS ACTUALES EN LA LC SEMÁNTICA Construcción de redes semánticas donde se presenten conceptos y relaciones entre ellos Problemas: Polisemia � Ejemplo: � Gato (animal felino) Gato (instrumento) Encontrar sentidos y hacer separaciones entre ellos � Lexicografía: construcción de diccionarios generales y especializados Representación de conocimientos en general Elaboración de terminologías especializadas � Ontologías �

PROBLEMAS ACTUALES EN LA LC PRAGMÁTICA Relaciones entre oración y el mundo externo. Como

PROBLEMAS ACTUALES EN LA LC PRAGMÁTICA Relaciones entre oración y el mundo externo. Como ya se tienen muchos problemas en la semántica, es difícil continuar el análisis en el nivel siguiente.

REFERENCIAS Domínguez Burgos, Andrés. Lingüística computacional: un esbozo. Boletín de lingüística, No. 18. pp.

REFERENCIAS Domínguez Burgos, Andrés. Lingüística computacional: un esbozo. Boletín de lingüística, No. 18. pp. 104 -119 Mercado, Heiner (2008). Fundamentos de la LC [presentación de clase] Sidorov, Grigory (2001). Problemas actuales de lingüística computacional. Revista digital universitaria, Vol. 2, No. 1