LINGSTICA COMPUTACIONAL UNIDAD 2 ANLISIS SEMNTICO Ana Mara

  • Slides: 24
Download presentation
LINGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

LINGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

ANÁLISIS SEMÁNTICO El análisis semántico está encaminado a la resolución de problemas con respecto

ANÁLISIS SEMÁNTICO El análisis semántico está encaminado a la resolución de problemas con respecto a los sentidos de las palabras o las expresiones usadas de manera automática Dentro de la LC la semántica pretender estructurar representaciones automáticas del lenguaje natural en máquinas a partir de plantillas de sentido para ejecutar inferencias. Permite expresar significados lingüísticos, enlazar información gramatical con otras clases, procesar significados, validar equivalencias. A partir de clasificaciones y categorizaciones de distintos elementos de la lengua, se generan esquemas conceptuales para realizar inferencias � � Traducción automática Recuperación de información

RELACIONES SEMÁNTICAS Se definen a partir de roles temáticos en donde se representan cada

RELACIONES SEMÁNTICAS Se definen a partir de roles temáticos en donde se representan cada uno de los componentes de la oración. Son graficadas a partir de un marco de casos partiendo de la premisa de que un grupo de estos casos es suficiente para modelar el lenguaje. Estos marcos se han hecho principalmente para los verbos.

CLASIFICACIONES VERBALES Determinar verbos que corresponden al mismo prototipo. LPPO: Lógica de Predicados de

CLASIFICACIONES VERBALES Determinar verbos que corresponden al mismo prototipo. LPPO: Lógica de Predicados de Primer Orden � Parte de la lógica matemática estableciendo una lógica preposicional empleando variables, predicados y cuantificadores. � Se establecen reglas de formación de oraciones y de inferencia que siguen axiomas lógicos. Gramática de casos de Fillmore � Relaciones entre el verbo y demás elementos de la oración a partir de las cuales se establecen roles semánticos.

MODELOS DE ANÁLISIS SEMÁNTICO LÓGICA DE PREDICADOS DE PRIMER ORDEN Sirve para representar el

MODELOS DE ANÁLISIS SEMÁNTICO LÓGICA DE PREDICADOS DE PRIMER ORDEN Sirve para representar el lenguaje de manera formal Hace uso de: Reglas de formación o fórmulas � Reglas de inferencia � Axiomas lógicos � Emplea variables, predicados y cuantificadores (lógica proposicional o lógica simbólica), usando los siguientes símbolos: Negación ( ) Conjunción ( ) Disyunción ( ) Implicación ( ) Coimplicación ( )

MODELOS DE ANÁLISIS SEMÁNTICO LÓGICA DE PREDICADOS DE PRIMER ORDEN

MODELOS DE ANÁLISIS SEMÁNTICO LÓGICA DE PREDICADOS DE PRIMER ORDEN

MODELOS DE ANÁLISIS SEMÁNTICO CÁLCULO DE LAMBA Formalismo matemático, base de la computación. Permite

MODELOS DE ANÁLISIS SEMÁNTICO CÁLCULO DE LAMBA Formalismo matemático, base de la computación. Permite construir fórmulas semánticas a partir de representaciones sintácticas. Unas expresiones X representan un algoritmo y su entrada, la expresión Y está sujeta a una serie de reglas de reescritura.

MODELOS DE ANÁLISIS SEMÁNTICO GRAMÁTICA SINTAGMÁTICA NUCLEAR Representación gráfica matemática de información sintáctica y

MODELOS DE ANÁLISIS SEMÁNTICO GRAMÁTICA SINTAGMÁTICA NUCLEAR Representación gráfica matemática de información sintáctica y semántica. Usa grafos para representar información lingüística como secuencia de características. Incluye principales reglas gramaticales basados en entradas léxicas (palabras o frases) que son marcadas en forma jerárquica. Cada entrada léxica contiene información fonética (PHON) y sintáctico-semántica (SYNSEM).

MODELOS DE ANÁLISIS SEMÁNTICO GRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO

MODELOS DE ANÁLISIS SEMÁNTICO GRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO

MODELOS DE ANÁLISIS SEMÁNTICO GRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO

MODELOS DE ANÁLISIS SEMÁNTICO GRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO

MODELOS DE ANÁLISIS SEMÁNTICO MRS MINIMAL RECURSION SEMANTICS Usa para representaciones en las cuales

MODELOS DE ANÁLISIS SEMÁNTICO MRS MINIMAL RECURSION SEMANTICS Usa para representaciones en las cuales se presenten problemas de ambigüedades. Este modelo parte del enfoque de que una estructura mínima del lenguaje representa y describe léxica y semánticamente la lengua general.

MODELOS DE ANÁLISIS SEMÁNTICO MTT MEANING TEXT THEORY Representa reglas lingüísticas de acuerdo a

MODELOS DE ANÁLISIS SEMÁNTICO MTT MEANING TEXT THEORY Representa reglas lingüísticas de acuerdo a significados específicos en un texto. Usa patrones de manejo para combinar un lexema con otros objetos. Permite representar equivalentes gráficos que son legibles por computador puesto que se basan en redes semánticas. . Este modelo establece una correspondencia entre posibles significados y un conjunto de posibles textos.

AMBIGUACIÓN Y DESAMBIGUACIÓN Ambigüedad: Que puede entenderse de varios modos o admitir distintas interpretaciones

AMBIGUACIÓN Y DESAMBIGUACIÓN Ambigüedad: Que puede entenderse de varios modos o admitir distintas interpretaciones y dar, por consiguiente, motivo a dudas, incertidumbre o confusión. Este es un problema mayor puesto que es difícil representar todas las variables que pueden presentarse en el lenguaje natural. Se presenta cuando ocurren diferentes fenómenos, que podrían resolverse en contexto, pero que es necesario prever en la implementación de herramientas computacionales.

FENÓMENOS DE AMBIGÜEDAD Significados o sentidos de palabras o expresiones de acuerdo a contextos

FENÓMENOS DE AMBIGÜEDAD Significados o sentidos de palabras o expresiones de acuerdo a contextos particulares de conocimiento. Puede presentarse por las siguientes situaciones: � Palabra que tiene más de un significado de acuerdo a la categoría o al tiempo gramatical � Sinonimia Dos o más palabras que representan el mismo concepto � Homonimia Dos o más palabras con la misma forma gráfica y distinto significado según el contexto � Polisemia Una palabra cuyo sentido varía según el contexto

PROBLEMAS EN EL TRATAMIENTO AUTOMÁTICO QUE TIENEN QUE VER CON LA AMBIGÜEDAD Dudas, incertidumbre

PROBLEMAS EN EL TRATAMIENTO AUTOMÁTICO QUE TIENEN QUE VER CON LA AMBIGÜEDAD Dudas, incertidumbre o confusión. En sistemas automáticos de representación de conocimiento es necesario minimizar estos problemas representando los casos más comunes en el lenguaje natural para proveerle a la máquina métodos que le permitan inferir sobre posibles sentidos y decidir las respuestas más adecuadas Otra clasificación de tipos de ambigüedad: � � � Léxica Sintáctica Semántica Textual Pragmática Referencial.

 La desambigüación se realiza principalmente en tareas de: � Traducción automática � Recuperación

La desambigüación se realiza principalmente en tareas de: � Traducción automática � Recuperación de información Solución: determinar automáticamente los sentidos de una palabra de acuerdo a contextos específicos. Para lograr esto se llevan a cabo diferentes métodos que están basados bien sea en el conocimiento, en el corpus o métodos híbridos.

MÉTODOS BASADOS EN CONOCIMIENTO Los métodos basados en conocimiento utilizan herramientas como diccionarios, tesauros,

MÉTODOS BASADOS EN CONOCIMIENTO Los métodos basados en conocimiento utilizan herramientas como diccionarios, tesauros, ontologías. Ayudan a especificar los sentidos de acuerdo a usos particulares de las palabras en contextos específicos (lenguaje natural o lenguaje especializado). El propósito de estas herramientas es proveer de significados, definiciones y ejemplos típicos de uso de las palabras. Ejemplo: Wordnet

MÉTODOS BASADOS EN CORPUS Usan conjuntos de datos que proveen ejemplos de oraciones y

MÉTODOS BASADOS EN CORPUS Usan conjuntos de datos que proveen ejemplos de oraciones y de usos de las palabras de tal forma que puedan utilizarse en algoritmos de aprendizaje automático. Estos métodos están divididos en dos tipos: corpus etiquetado y corpus no etiquetado. Corpus etiquetado: Clasificadores para darle sentido apropiado a una palabra dentro de un contexto determinado. � Se encuentran automáticamente relaciones o patrones entre las palabras y luego evalúan y comparan los sentidos para realizar la desambiguación correcta � Tiene en cuenta: Co-ocurrencia, N-gramas, Colocaciones. � Corpus no etiquetado: � Patrones que se definen para armar grupos de palabras con características comunes que se relacionan de alguna manera.

MÉTODOS COMBINADOS GENERACIÓN AUTOMÁTICA DE ESQUEMAS CONCEPTUALES Permiten la interacción en lenguaje natural entre

MÉTODOS COMBINADOS GENERACIÓN AUTOMÁTICA DE ESQUEMAS CONCEPTUALES Permiten la interacción en lenguaje natural entre el usuario y el computador. Facilitan tareas de recuperación y extracción automática de textos en corpus específicos, así como otros modelos o sistemas de etiquetaje, análisis y desambiguación Algunas herramientas: � � � � Extracción automática de contextos definitorios: http: //swesum. nada. kth. se/index-eng. html Anotaciones semánticas Ayuda en la escritura (corrección) Extracción automática de terminología Indexación automática Data mining textual Patrones y tendencias del discurso

ESQUEMAS PRECONCEPTUALES Representaciones gráficas y textuales que permiten una interpretación cercana a la realidad

ESQUEMAS PRECONCEPTUALES Representaciones gráficas y textuales que permiten una interpretación cercana a la realidad conceptual de un dominio. Identifica las características estructurales y dinámicas de una lengua, ofreciendo a cada elemento una única categoría gramatical, lo que permitiría una mayor precisión de sentidos.

ESQUEMAS PRECONCEPTUALES Identificación Nombre Predicado tiene Objeto Agente 1 Verbo Agente 2

ESQUEMAS PRECONCEPTUALES Identificación Nombre Predicado tiene Objeto Agente 1 Verbo Agente 2

UN-LECEP Lenguaje controlado en español para la especificación de esquemas preconceptuales, generación de plantillas

UN-LECEP Lenguaje controlado en español para la especificación de esquemas preconceptuales, generación de plantillas para la escritura de dichos esquemas.

RETOS… Implementación y desarrollo de esquemas o categorías conceptuales en dominios específicos Aplicaciones que

RETOS… Implementación y desarrollo de esquemas o categorías conceptuales en dominios específicos Aplicaciones que no queden restringidas a la aplicación en otras lenguas. Hace falta más desarrollo y divulgación de aplicaciones en lengua castellana. Construcción de ontologías que faciliten la estructuración y haga una marcación semántica de los documentos en la web a través del uso de términos específicos y la representación de las relaciones conceptuales entre ellos. Utilización de métodos de análisis combinados (estadísticos y cualitativos)

REFERENCIAS http: //www 3. unileon. es/dp/dfh/Milka/LCII/Intro_LCA. pdf http: //rua. es/dspace/bitstream/10045/3346/1/PLN_37_44. p df http: //www.

REFERENCIAS http: //www 3. unileon. es/dp/dfh/Milka/LCII/Intro_LCA. pdf http: //rua. es/dspace/bitstream/10045/3346/1/PLN_37_44. p df http: //www. sepln. org/revista. SEPLN/revista/27/27 articulo 33. pdf http: //ccc. inaoep. mx/~mmontesg/tesis%20 estudiantes/Tesis. M aestria-Aaron. Pancardo. pdf http: //www. revista. unal. edu. co/index. php/formayfuncion/article /view. File/17290/18129 http: //tecnolengua. uma. es/doc 2/resla 98. pdf