Aproximacin de Missing Values utilizando Mycin y Reglas

  • Slides: 15
Download presentation
Aproximación de Missing Values utilizando Mycin y Reglas de asociación Rafael Morales Bueno Jorge

Aproximación de Missing Values utilizando Mycin y Reglas de asociación Rafael Morales Bueno Jorge Wallace Ruiz

Introducción n Tratamiento actual de los Missing Values Técnicas de clasificación n Eliminación del

Introducción n Tratamiento actual de los Missing Values Técnicas de clasificación n Eliminación del conjunto de datos n n Reglas de Asociación Solución Natural a este problema n Modelos simples n

Reglas de Asociación n Supongamos que tenemos un valor desconocido perteneciente al dominio D

Reglas de Asociación n Supongamos que tenemos un valor desconocido perteneciente al dominio D 1 y existe una regla de asociación tal que : e 1 D 2 → e 2 D 1 con una confianza C. Entonces podemos “rellenar” ese valor con e 2 con una confianza C. Mecanismo simple, efectivo y natural. Problemas n n Conjunción y disyunción de reglas de asociación Tiende a reducir la entropía natural del conjunto de datos

Mycin Desarrollado entre 1972 y 1980 en la Universidad de Stanford. n Sistema interactivo

Mycin Desarrollado entre 1972 y 1980 en la Universidad de Stanford. n Sistema interactivo experto que ayudaba a los físicos en la selección de un apropiada terapia antimicrobiana para los pacientes de los hospitales. n Velocidad, accesibidad y facilidad de uso. n Basado en Factores de Certeza (CF) n

Reglas en Mycin n n Factores de Certeza (CF) asociados a reglas y a

Reglas en Mycin n n Factores de Certeza (CF) asociados a reglas y a hechos Si a → b donde: n n a puede ser un hecho simple o un hecho compuesto : b c, a b, … Rango de los CF [-1 , 1] donde n n n CF > 0 indica Confianza CF = 0 indica ignorancia CF < 0 Confianza en lo contrario del hecho

Fórmulas para el cálculo de los CF Ejemplo: n Modus Ponens Incierto E→H E_____

Fórmulas para el cálculo de los CF Ejemplo: n Modus Ponens Incierto E→H E_____ H CF(R 1) = f(CF(E), CF(R 1)) Donde CF (tos) = 0. 9 CF (gripe) = 0. 9 * 0. 6 = 0. 54

Fórmulas para el cálculo de CF (II) Ejemplo: Combinación de evidencia E 1 →

Fórmulas para el cálculo de CF (II) Ejemplo: Combinación de evidencia E 1 → H E 2 → H CF(R 1, R 2)= f(CFR 1(H), CFR 2(H)) n Donde : CF (tos) = 0. 6 CF (gripe) = 0. 9 CF R 1, R 2= 0. 81 + 0. 48 – 0. 48*0. 81

Fórmulas para el cálculo de CF (III) n Antecedentes Compuestos E 1 E 2

Fórmulas para el cálculo de CF (III) n Antecedentes Compuestos E 1 E 2 n E n CF(E 1 E 2) = min (CF(E 1), CF(E 2)) CF(E 1 E 2) = max (CF(E 1), CF(E 2)) CF( E) = - CF(E)

Mycin y Reglas de Asociación n Traducción automática modelo CF ↔ Reglas de asociación

Mycin y Reglas de Asociación n Traducción automática modelo CF ↔ Reglas de asociación n Factor de Certeza en Reglas n Coincide con el valor de confianza de la regla de asociación n Posible inclusión del soporte como parte de la función f n Confianza en hechos n CF = 1 para aquellos valores no desconocidos n Desconfianza en ciertos datos

Mycin y Reglas de Asociación (II) n Algoritmo Escoger entre las reglas de asociación

Mycin y Reglas de Asociación (II) n Algoritmo Escoger entre las reglas de asociación iniciales aquellas en las cuales en el consecuente aparezca un valor perteneciente al dominio del missing value. n Aplicar el modelo Mycin y escoger el valor perteneciente al dominio con mayor CF. n Asignar a ese valor el CF obtenido según el modelo. n Continuar con el siguiente missing value de la tupla. n

Optimizaciones n Verificación de hipótesis n n Si existe una regla de asociación tal

Optimizaciones n Verificación de hipótesis n n Si existe una regla de asociación tal que : e 1 D 2 → e 2 D 1 y a su vez e 2 D 1 → ei Di (siendo ei un valor NO desconocido) entonces podemos ponderar el acierto o fallo en esta predicción. Vuelta atrás n Es posible en algunos casos volver a clasificar missing values ya establecidos si encontramos otro valor con mayor CF a otro nivel.

Ventajas Rapidez n Simplicidad n Modelo más que probado n Razonamiento Natural n

Ventajas Rapidez n Simplicidad n Modelo más que probado n Razonamiento Natural n

Inconvenientes n Modelo Mycin no está bien construido n Tratamiento de la disyunción No

Inconvenientes n Modelo Mycin no está bien construido n Tratamiento de la disyunción No considera correlaciones entre proposiciones n Obtención del conjunto de reglas de asociación n

Bibliografía n n Davis, R. , Buchanan, B. G. and Shortliffe, E. H. ,

Bibliografía n n Davis, R. , Buchanan, B. G. and Shortliffe, E. H. , "Production Systems as a Representation for a Knowledge-based Consultation program", Artificial Intelligence, 8, (1), pp. 1545, 1977. Rule-Based Expert Sytem: The MYCIN Experiment at the Stanford Heuristic Programming Project Pete Chapman (NCR), Julian Clinton (SPSS), Randy Kerber (NCR), Thomas Khabaza (SPSS), Thomas Reinartz (Daimler. Chrysler), Colin Shearer (SPSS) and Rüdiger Wirth (Daimler. Chrysler) - CRISP-DM 1. 0 Fast Algorithms for Mining Association Rules (1994) Rakesh Agrawal, Ramakrishnan Srikant Proc. 20 th Int. Conf. Very Large Data Bases, VLDB

Esquemas

Esquemas