ENFOQUE HBRIDO PARA LA CLASIFICACIN DE ESPECTROS ESTELARES
ENFOQUE HÍBRIDO PARA LA CLASIFICACIÓN DE ESPECTROS ESTELARES MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL UNIVERSIDAD DE A CORUÑA Dept. Tecnologías de la Información y las Comunicaciones & Dept. Ciencias de la Navegación y de la Tierra Alejandra Rodríguez (arodriguezf@udc. es) Carlos Dafonte (dafonte@udc. es) Bernardino Arcay (cibarcay@udc. es) Iciar Carricajo (iciar@udc. es) Minia Manteiga (manteiga@udc. es) 1
OBJETIVOS q Desarrollo de un sistema automático para extracción de parámetros físicos y químicos a partir de espectros estelares Ø Luminosidad Ø Temperatura Efectiva Ø Metalicidad q Clasificación de espectros ópticos de baja resolución en el sistema MK q Integración de varias técnicas de inteligencia artificial en un único sistema híbrido ¨ ¨ ¨ Sistemas Expertos Redes de Neuronas Artificiales Técnicas Estadísticas de Clustering
SELECCIÓN DE DATOS q Conjunto completo y consistente de 258 espectros de catálogos públicos 3500 Å - 7500 Å con resolución de 5 Å Ø Ø q Espectros analizados y corregidos manualmente utilizando técnicas de clustering Ø Ø Ø ü Silva (92), Pickles (98), Jacoby (84) Cubren todos los tipos espectrales y clases de luminosidad 50% Conjunto de entrenamiento 15% Conjunto de validación 35% Conjunto de evaluación Patrones de Entrada ¨ ¨ Espectros completos Parámetros espectrales (bandas moleculares, líneas de absorción y emisión)
SELECCIÓN DE DATOS q 706 espectros en la región del triplete de Calcio 8348 Å -- 9020 Å con resolución de 1. 5 Å Ø Ø Ø q Proyecto GAIA Librería de espectros Cenarro, Gorgas et al, disponible en: http: //www. ucm. es/info/Astrof/ellipt/CATRIPLET. html 60% Conjunto de entrenamiento, 40% Conjunto de evaluación Patrones de Entrada ¨ Parámetros espectrales: líneas de Fe, Ca, H
ESTRUCTURA DEL SISTEMA Análisis Espectros BD Preprocesado + Análisis morfológico Espectro completo Parámetros espectrales: líneas de absorción y emisión, bandas moleculares, etc Clasificación espectral Clasificación Técnicas de IA Sistemas expertos RNAs Técnicas de clustering
ORGANIZACIÓN DE LOS DATOS q Base de datos relacional diseñada para almacenar información sobre estrellas, espectros, imágenes, telescopios, fotometrías, referencias bibliográficas, fases evolutivas, clasificaciones, catálogos, medidas de parámetros, etc. q Proporciona un mecanismo de estructurado y seguro de la información Ø q almacenamiento Sistema Gestor de Base de Datos Postgre. SQL v. 7. 1 Permite recuperar los datos almacenados de forma rápida, cómoda y eficiente Ø Interfaces de acceso y explotación a través de WEB
ACCESO WEB
ANÁLISIS MORFOLÓGICO q Tratamiento del espectro como señal de longitudes de onda y flujo energético q Preprocesado del espectro. Escalado, tratamiento de regiones espectrales vacías, ajuste de la frecuencia de muestreo q Análisis morfológico del espectro. Detección y medida de líneas de absorción/emisión, bandas moleculares, energía espectral q Ø Bandas moleculares: discretas algoritmo basado en integrales Ø Líneas de absorción/emisión: algoritmo basado en la estimación del continuo local Obtención de los parámetros y regiones espectrales necesarios para la clasificación
CLASIFICACIÓN: SISTEMAS EXPERTOS q Permiten reproducir el tipo de razonamiento utilizado por los espectroscopistas para clasificar espectros estelares q Combinación de sistemas de reglas de producción clásicos y sistemas de reglas basados en lógica difusa q Desarrollados en OPS/R 2 q Técnicas Ø Means-End Analysis Ø Max-Product Ø Fuzzy Centroid q Existen zonas de incertidumbre en la clasificación en las que el sistema obtiene varias conclusiones con una probabilidad asociada q Estudio adicional: resultados de los mejores modelos de redes de neuronas
CLASIFICACIÓN: RNAs ü SIMULADOR STUTTGART NEURAL NETWORK (SNNS v. 4. 2) ü Herramienta desarrollada en JAVA para manipular Redes de neuronas con diferentes algoritmos de aprendizaje y arquitecturas: Feed Forward, CPN, SOM, Correlación en Cascada. Posee una interfaz Web para la interacción con el usuarios.
CLASIFICACIÓN: RNAs ü Ejemplo del resultado del entrenamiento
CLASIFICACIÓN: RNAs BACKPROPAGATION RED PATRONES CAPAS OCULTAS Tipo Espectral Parámetros espectrales 10 Tipo Espectral Parámetros espectrales 5 x 5 Tipo Espectral Parámetros espectrales 10 x 10 Tipo Espectral Parámetros espectrales 10 x 5 x 3 Tipo Espectral 659 valores de flujo 100 x 50 x 10 x 3 Luminosidad Parámetros espectrales 10 x 10 Luminosidad 659 valores de flujo 100 x 50 x 10 x 3 KOHONEN ü Mapas de dos dimensiones: 2 x 2, 6 x 6, 12 x 12 and 24 x 24
RBF (Radial Basis Functions) NETWORK INPUT PATTERNS HIDDEN LAYERS Tipo Espectral Parámetros espectrales 16 Tipo Espectral Parámetros espectrales 8 Tipo Espectral Parámetros espectrales 4 Tipo Espectral 659 valores de flujo 124 Luminosidad Parámetros espectrales 8 Luminosidad 659 valores de flujo 124
TÉCNICAS CLUSTERING ü MATLAB v. 6. 5. 1 ü Algoritmos no jerárquicos: ¨ ¨ ¨ K-means Max-min Iso-Data ü Clusters iniciales: 6, 12 ü Análisis de sensibilidad de los parámetros de la clasificación
RESULTADOS ü ü ü 100 espectros de catálogos públicos (Silva, Jacoby, Pickels) 95% BP, RBF, K-means & Isodata Las estrellas más problemáticas: B con líneas de emisión y M ~
RESULTADOS: GAIA ü ü Resultados preliminares para Teff con RNAs Redes entrenadas con índices espectrales: Ca. II, Fe. I, Lineas de Paschen FEED FORWARD MSE Capas ocultas 0, 005 0, 0025 0, 0006 0, 0001 5 0. 43 0. 69 0. 74 10 0. 42 0. 47 0. 70 0. 75 15 0. 46 0. 45 0. 71 0. 78 20 0. 44 0. 43 0. 72 0. 77 25 0. 39 0. 44 0. 68 0. 79 Counter Propagation (CPN) Capas ocultas MSE 0, 005 0, 0025 0, 0006 0, 0001 50 0. 41 0. 42 0. 61 0. 66 100 0. 39 0. 41 0. 61 0. 70 200 0. 43 0. 35 0. 62 0. 65
INTERFAZ DEL SISTEMA
ENFOQUE HÍBRIDO PARA LA CLASIFICACIÓN DE ESPECTROS ESTELARES MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL UNIVERSIDAD DE A CORUÑA Dept. Tecnologías de la Información y las Comunicaciones & Dept. Ciencias de la Navegación y de la Tierra Alejandra Rodríguez (arodriguezf@udc. es) Carlos Dafonte (dafonte@udc. es) Bernardino Arcay (cibarcay@udc. es) Iciar Carricajo (iciar@udc. es) Minia Manteiga (manteiga@udc. es) 18
- Slides: 18