Recuperacin de Informacin MC Beatriz Beltrn Martnez Primavera
Recuperación de Información MC Beatriz Beltrán Martínez Primavera 2015
Primavera 2015 FCC - BUAP • Los sistemas pueden almacenar los datos tanto interna (en la memoria) como externamente (en los dispositivos de almacenamiento). • Internamente, las instrucciones o datos pueden almacenarse por un tiempo en los chips de silicio de la RAM (memoria de acceso aleatorio). • Externamente, los dispositivos de almacenamiento secundarios o auxiliares, los cuales son capaces de conservar la información de manera permanente. MC Beatriz Bletrán Martínez Almacenamiento de Información 2
Primavera 2015 FCC - BUAP • Los sistemas de almacenamiento se han convertido en un aspecto singular y complejo. • La tecnología de almacenamiento actual engloba todo tipo de soportes. • Se tiene, por ejemplo, sistemas WORM, bibliotecas de cintas y bibliotecas virtuales. • En los últimos años, los sistemas SAN y NAS han demostrado su excelente fiabilidad. MC Beatriz Bletrán Martínez Tecnologías de almacenamiento 3
Primavera 2015 FCC - BUAP • Las unidades SAN (Storage Area Network) pueden ser armarios enormes; algunos pueden tener 240 discos duros. Estos grandes sistemas con más de 50 terabytes de capacidad hacen más que sólo activar cientos de discos duros. • Las unidades NAS (Network Attached Storage) son unidades independientes que cuentan con sistemas operativos y de archivos propios y gestionan los discos duros que llevan conectados. MC Beatriz Bletrán Martínez Tecnologías de almacenamiento 4
Primavera 2015 FCC - BUAP • Desde hace bastante tiempo, el almacenamiento a gran escala no ha estado al alcance de la pequeña empresa. Los sistemas de discos duros SAN Serial ATA (SATA) se están convirtiendo en una manera rentable de disfrutar de gran capacidad de almacenamiento. • Otras tecnologías de almacenamiento, como i. SCSI, DAS (Direct Attached Storage), Near-Line Storage (datos adjuntos en soportes extraíbles) y CAS (Content Attached Storage), también proporcionan disponibilidad. MC Beatriz Bletrán Martínez Tecnologías de almacenamiento 5
• Se han generado varias herramientas en tecnología para la recopilación, estructuración, administración, almacenamiento y explotación de estos datos. Primavera 2015 FCC - BUAP • A través de los años las organizaciones privadas como públicas, generan miles de datos en sus actividades diarias. MC Beatriz Bletrán Martínez Sistemas de almacenamiento de Información 6
Primavera 2015 FCC - BUAP • Los sistemas que manejan datos, como Bases de datos, Data-Warehouse, Meta-Dato, Data. Mining, Cloud entre otros, son utilizados para registrar datos, con una estructura lógica, organizada y almacenada para su explotación, la cual puedan usar personas con un perfil predefinido para explotar cierta información y puedan buscar, recuperar y actualizar esta información. MC Beatriz Bletrán Martínez Sistemas de almacenamiento de Información 7
Primavera 2015 FCC - BUAP • Es un conjunto de datos relacionados coherentemente que generan información. • La información esta organizada y almacenada, para su explotación. • Los usuarios puedan buscar, recuperar y actualizar los datos que necesitan, debe responder a consultas formuladas, con una expresión lógica sobre la información. • La identificación de un subconjunto lógico de la base de datos, es decir, una selección de registros que cumplen la condición lógica. MC Beatriz Bletrán Martínez Bases de Datos 8
• Debe entregar la información correcta a la gente indicada en el momento adecuado en el formato correcto. Primavera 2015 FCC - BUAP • Funciona con grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas, llamadas los centros comerciales (Data. Marts), dependientes de los datos. MC Beatriz Bletrán Martínez Data Warehouse 9
Primavera 2015 FCC - BUAP • El Almacén de Datos da respuesta a las necesidades de usuarios conocedores, utilizando Sistemas de ayuda en la decisión (DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer consulta o informes. • Los usuarios finales fácilmente pueden hacer consultas sobre sus Almacenes de Datos sin tocar o afectar la operación del sistema. MC Beatriz Bletrán Martínez Data Warehouse 10
• Metadatos administrativos: Su función es gestionar y administrar los recursos digitales. • Metadatos descriptivos: Su función es representar e identificar los recursos digitales. Primavera 2015 FCC - BUAP • Sus funciones principales son la localización, identificación y descripción de recursos, legibles e interpretables a través de una computadora, algunos metadatos utilizados son: MC Beatriz Bletrán Martínez Meta Datos 11
Primavera 2015 FCC - BUAP • Metadatos para la conservación: para preservar los recursos de información. • Metadatos técnicos: Su función es informar sobre los requerimientos técnicos del hardware o software • Metadatos de uso: su función es informar sobre el nivel de utilización, tipo de usuarios, etc. MC Beatriz Bletrán Martínez Meta Datos 12
Primavera 2015 FCC - BUAP • Su función principal permite transformar la información disponible en conocimiento útil de negocio. • Establece por lo tanto vía clave de explotación del Data Warehouse, dado que es este su entorno natural de trabajo. • Data-Mining es un proceso para extraer información útil a partir de grandes cantidades de datos. • Permite transformar la información disponible en conocimiento útil de negocio. MC Beatriz Bletrán Martínez Data Mining 13
Primavera 2015 FCC - BUAP • Análisis de la Varianza: Diferencias significativas. • Regresión: Define la relación entre variables. • Cuadrado: Reduce el número de variables. • Análisis cluster: Para clasificar una población. • Análisis discriminante: método de clasificación. • Métodos en árboles de decisión, Algoritmos genéticos, Redes neuronales, Lógica difusa, Series temporales. MC Beatriz Bletrán Martínez Data Mining 14
Primavera 2015 FCC - BUAP • La nube es un avance en el suministro de tecnología de la información y los servicios, proporciona acceso bajo demanda a un conjunto compartido de recursos informáticos, de forma dinámica a escala, ofrece interesantes ventajas en costes, rapidez y eficiencia. • Función principal es almacenar datos base de datos como servicio (DBaa. S), específicamente en torno a la información confidencial que se almacena en la nube y sus alrededores. MC Beatriz Bletrán Martínez Cloud 15
Primavera 2015 FCC - BUAP • El término recuperación de información, fue utilizado por primera vez en el año de 1950, por Calvin N. Moores. • Se definió como: “La búsqueda de información en un stock de documentos, efectuada a partir de la especificación de un tema”. • Salton en 1983, define: “La recuperación de la información tiene que ver con la representación, almacenamiento, organización y acceso a los ítem de información”. MC Beatriz Bletrán Martínez Sistemas de Recuperación de Información 16
Primavera 2015 FCC - BUAP • Salton indica que, en principio, no deben existir limitaciones a la naturaleza del objeto informativo y Baeza-Yates incorpora la reflexión siguiente: “La representación y organización debería proveer al usuario un fácil acceso a la información en la que se encuentre interesado. Desafortunadamente, la caracterización de la necesidad informativa de un usuario no es un problema sencillo de resolver”. MC Beatriz Bletrán Martínez Sistemas de Recuperación de Información 17
Recuperación de información Parcial, el mejor Inductiva Posibilístico Estructurado o Natural Imprecisa Insensible Primavera 2015 Recuperación de datos Acierto Exacto Inferencia Algebraica Modelo Determinístico Lenguaje de Fuertemente consulta Estructurado Especificación Precisa consulta Error en la Sensible respuesta FCC - BUAP MC Beatriz Bletrán Martínez Sistemas de Recuperación de Información 18
Documentos Relevantes Recuperación Documentos Primavera 2015 FCC - BUAP Base de Datos Necesidad de Información MC Beatriz Bletrán Martínez Sistemas de Recuperación de Información Documentos no Relevantes 19
Primavera 2015 Descripción Incluye los tres más comúnmente citados: Modelos clásicos booleano, espacio vectorial y probabilístico. Modelos Están basados en la Lógica Fuzzy. alternativos Basados en la Lógica Formal. La Modelos lógicos recuperación de información es un proceso inferencial. Incluyen posibilidades de expansión del Modelos basados alcance de la búsqueda y hacen uso de en la retroalimentación por la relevancia de los interactividad documentos recuperados. Modelos basados Bases de conocimiento, redes neuronales, en la Inteligencia algoritmos genéticos y procesamiento del Artificial lenguaje natural. FCC - BUAP Modelo MC Beatriz Bletrán Martínez Modelos de un SRI 20
Primavera 2015 FCC - BUAP • Desarrollos iniciales: En papiros, en libros, etc. • Recuperación de información en las bibliotecas: Fueron las primeras instituciones en adoptar estos sistemas. • La World Wide Web: La evolución lógica de los SRI ha sido hacia la web, donde han encontrado una alta aplicación práctica y un aumento del número de usuarios, especialmente en el campo de los directorios y motores de búsqueda. MC Beatriz Bletrán Martínez Evolución 21
- Slides: 21