DATA WAREHOUSE EQUIPO 3 1 Alberto Linares faustinos
DATA WAREHOUSE EQUIPO: 3 1. Alberto Linares faustinos 2. Nelson Morales Cordova
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS INTRODUCCIÓN AL CONCEPTO DATA WAREHOUSE CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp Un almacén de datos (del Ingles) Data warehouse, es el centro de la arquitectura para los sistemas de información en la década de los '90. Soporta el procesamiento informático al proveer una plataforma sólida, a partir de los datos históricos para hacer el análisis. Facilita la integración de sistemas de aplicación no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo. Un Data warehouse o almacén de Datos es una colección de datos orientado a temas, integrado, no volátil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales. El ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos los casos. El data warehouse es siempre un almacén de datos transformados y separados físicamente de la aplicación donde se encontraron los datos en el ambiente operacional.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS CARACTERISTICAS DE UN DATA WAREHOUSE Entre las principales se tiene: • Orientado al tema • Integrado • De tiempo variante • No volátil CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
Orientado a Temas UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp http: //www. sqlmax. com/dataw 1. asp
Integración CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS http: //www. sqlmax. com/dataw 1. asp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS De Tiempo Variante http: //www. sqlmax. com/dataw 1. asp CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS No Volátil http: //www. sqlmax. com/dataw 1. asp CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS ESTRUCTURA DEL DATA WAREHOUSE CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp Los data warehouse hay niveles diferentes de esquematización y detalle que lo delimitan. componentes del data warehouse y son: • Detalle de datos actuales • Detalle de datos antiguos • Datos ligeramente resumidos • Datos completamente resumidos • Meta data
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS ESTRUCTURA DEL DATA WAREHOUSE CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp • Detalle de datos actuales. -Refleja las ocurrencias más recientes, las cuales son de gran interés, es voluminoso. • Detalle de datos antiguos. - La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuntemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. • Datos ligeramente resumidos. - La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son: Que la unidad de tiempo se encuentre sobre la esquematización hecha. Qué contenidos (atributos) tendrá la data ligeramente resumida. • Datos completamente resumidos. - Los datos completamente resumidos, estos datos son compactos y fácilmente accesibles.
ESTRUCTURA DEL DATA WAREHOUSE CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS http: //www. sqlmax. com/dataw 1. asp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS ESTRUCTURA DEL DATA WAREHOUSE CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp La metadata. Juega un rol especial y muy importante en la data warehouse y es usada como: • Un directorio para ayudar al analista a ubicar los contenidos del data warehouse. • Una guía para el mapping de datos de cómo se transforma, del ambiente operacional al de data warehouse. • Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS Elementos constituyentes de una Arquitectura Data Warehouse CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp La arquitectura se constituye de un número de partes interconectadas: • • Base de datos operacional / Nivel de base de datos externo Nivel de acceso a la información Nivel de acceso a los datos Nivel de directorio de datos (Metadata) Nivel de gestión de proceso Nivel de mensaje de la aplicación Nivel de data warehouse Nivel de organización de datos
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS Operaciones en un Data Warehouse CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp Los tipos de operaciones que se efectúan dentro de un ambiente data warehousing son: • Sistemas Operacionales • Extracción, Transformación y Carga de los Datos • Metadata • Plataforma del data warehouse • Datos Externos
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS Operaciones en un Data Warehouse http: //www. sqlmax. com/dataw 1. asp CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS TRANSFORMACION DE DATOS http: //www. sqlmax. com/dataw 1. asp CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
FLUJO DE DATOS UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp Al ingresar al data warehouse, la información va al nivel de detalle actual. Se queda allí y se usa hasta que ocurra uno de los tres eventos siguientes: · · · Sea eliminado Sea resumido Sea archivado
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS FLUJO DE DATOS CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp http: //www. sqlmax. com/dataw 1. asp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS • • • BENEFICIOS DE TRABAJAR CON EL DW CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp Reducción de tiempos y costos asociados con la consolidación de datos provenientes de distintas fuentes. Acceso inmediato y flexible a información crítica de la organización resultando esto en ventajas competitivas. Mejoras en la calidad de los datos : consistencia, precisión y documentación. Creación de una infraestructura flexible, capaz de adaptarse rápidamente a los cambios tácticos y estratégicos de negocio. Mayor conocimiento de las necesidades y expectativas de los clientes, pudiendo segmentar el mercado de acuerdo a intenciones de negocios. Decisiones más rápidas. Mejor entendimiento del negocio. Descubrimiento de nuevas oportunidades de negocio. Incremento de productividad y reducción de costos en la disponibilidad de información. Monitoreo del normal desenvolvimiento de las operaciones de la organización. Capacidad de realizar comparaciones y obtener tendencias centrando la atención sobre los verdaderos puntos problemas.
DEBILIDADES Y FORTALEZAS UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS DEBILIDADES • Falta de normalización. • Alto costo. • Reanálisis del modelo de datos, objetos, transacciones, almacenamiento. • Diseño complejo y multidisciplinar. • Cambio dinámico de requerimientos de información. • Administración y mantenimiento. • Sistemas, aplicaciones y almacenamiento específico CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp FORTALEZAS • Integrador de sistemas. • Consistencia. • Accesibilidad. • Disponibilidad. • Menor costo de difusión y formación. • Visión amplia de negocio. • Orientado a la toma de decisiones. • Modelización y simulación. • Información consolidada. • Extracción de información – conocimiento, http: //www. seis. es/seis/inforsalud 2001/cientificas 2/diaz. htm
TABLAS COMPARATIVAS UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS OLTP • Mueve dinero entre cuentas • Número de usuarios mayor • Consulta en segundos • Menor tamaño • Es un sistema • Número mayor de tablas con pocas columnas • Son actualizados día a día • La estructura es muy estable Data Warehouse CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp • Organizado en base de conceptos, clientes, facturas, productos. • Número de usuarios menor. • Consulta en minutos • Gran tamaño • Desnormalizados • El número de tablas es menor, pero mayor el número de columnas. • Son actualizados por periodos. • Sufren cambios según el desarrollo y actualización. http: //exa. unne. edu. ar/depar/areas/informatica/Sistemas. Operativos/Mineria. Datos. Bressa n. htm#Qué%20 es%20 Data%20 Warehousing
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS COSTOS ACTUALIZADOS CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp • Muchos proyectos de data warehouse usan productos como Warehouse Manager de Prism Solutions o Passport de Carleton, para una gama de tareas de gestión de data warehouse, que incluyen: – Extracción de los datos desde las bases de datos operacionales – Preparación de los datos para cargarlos en una base de datos del depósito, – Administración de la metadata. • Estos productos cuestan desde $ 75, 000 a más de $ 200, 000 Dls, dependiendo del tamaño y la complejidad del proyecto y pueden también limpiar, transformar y validar. • http: //www. inei. gob. pe/biblioineipub/bancopub/Inf/Lib 5084/2242. HTM
CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS • • La empresa Enterprise/Integrator ofrece no solamente limpieza de datos, sino también extracción, transformación, carga de datos, repetición, sincronización y administración de la metadata. Es bastante caro (de $130, 000 a $250, 000 Dls), pero se puede ahorrar dinero si elimina la necesidad de otras herramientas de gestión de data warehouse. Arthur Andersen: Las soluciones orientadas al nombre y la dirección pueden costar en cualquier parte desde $30 000 a mas de $200 000 Dls. http: //www. inei. gob. pe/biblioineipub/bancopub/Inf/Lib 5084/2242. HTM • Servicios prestados por Leviminod Consultora Consultoría Diseño Data Warehouse / Data mart Diseño Modelo de Datos (Data Model) Análisis y estudio de herramientas. Capacitación a usuario y presentaciones Programación Soporte Técnico (Windows NT, MS-SQL Server, etc. ) http: //www. calvache. com/cya_datawarehouse. htm
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS DIAGRAMA DE FUNCIONAMIENTO DE UN DATA WAREHOUSE http: //www. um. es/eempresa/angel/ppt/datawarehouse. htm CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS DEMOSTRACIÓN DEL USO DE UN DATA WAREHOUSE http: //www. monografias. com/trabajos 6/dawa. shtml CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS OTRO EJEMPLO DEL USO DEL DATA WAREHOUSE http: //www. sqlmax. com/dataw 1. asp CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
USO DE UN SISTEMA OPERACIONAL UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS (Este sistema es operado por secciones, siendo de menor tamaño y volátil), por lo tanto no es un DW Procesamiento Manual http: //www. sqlmax. com/dataw 1. asp CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
EMPRESAS QUE USAN EL DATA UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS WAREHOUSE Los sectores donde principalmente se ha implantado data warehouse son los siguientes: Empresas de telecomunicaciones. Jazztel, Vodafone, France Telecom. . . Empresas de transporte. British Airways, Union Pacific, Air France, etc. Empresas de fabricación de bienes de consumo masivo. Coca-Cola, Adidas, Nike, 3 M, Bosh Siemens, Entidades Financieras. BBVA, Caja Madrid, Caja Extremadura Comercio Minorista. Corte Inglés, Cortefiel, Eroski. Y otras mas como: Wal*Mart, Kmart, Sears, Meijer, Kohl's Department Stores, American Stores (Jewel/OSCO/Lucky/Savon/ACME/Super. Saver), Mervyn's, Buttrey Food & Drug, QVC Home Shopping, Canadian Tyre, WH Smith Books (Gran Bretaña), Great Universal (GB), Supermercados Casino (Francia), Migrosgenossenschaftsbund (Suiza), Otto Versand (Alemania). Procter & Gamble, Hallmark, Maybelline, Helene Curtis, Owens Corning Glass, Karsten Ping Golf Clubs, Walt Disney, Whirlpool. http: //www. monografias. com/trabajos 6/dawa. shtml CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp
TUTORIALES UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp http: //www. preciomania. com/search_getprod. php/masterid=/isbn=9780201760330
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS CONCLUSIÓN CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp • El DW es un proceso, no un producto • Es un conjunto de procesos y acciones, orientados a un tema, integrados y no volátiles que sirve para la toma de decisiones de la gerencia. • E data warehouse a pesar de su alto costo, sigue funcionando y brindando credibilidad a la información que provee a los usuarios.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS • • • BIBLIOGRAFIA CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp • • • Laudon Keneth C. , Laudon Jane P. , Sistemas de Información Gerencial (8ª ed. ) México, Pearson Educación, (2004) http: //www. dwinfocenter. org/casefor. html http: //datawarehouse. ittoolbox. com/ http: //exa. unne. edu. ar/depar/areas/informatica/Sistemas. Operativos/Mineria. Datos. Br essan. htm http: //www. monografias. com/trabajos 17/data-warehouse. shtml http: //www. inei. gob. pe/biblioineipub/bancopub/Inf/Lib 5084/214. HTM http: //www. monografias. com/trabajos 11/basda. shtml#d Ralph Kimball, Laua Reeves, Margy Ross, Warren. . The Data Warehouse Lifecycle Toolkit http: //www. navactiva. com/web/es/atic/aseso/desarrollo/asesor 1/2005/33153. php http: //www. monografias. com/trabajos 6/dawa. shtml http: //www. calvache. com/cya_datawarehouse. htm • http: //www. sqlmax. com/dataw 1. asp • •
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MORELOS GLOSARIO CENTRO DE INVESTIGACIÓN EN INGENIERÍA Y CIENCIAS APLICADAS CIICAp OLTP (On-Line Transaction Processing) Son aplicaciones que definen el comportamiento habitual de un entorno operacional de gestión y ejecutan las operaciones del día a día. EIS/DSS Sistemas de Información Ejecutivos (EIS), Los sistemas DSS/EIS están orientados al análisis y al reporte de la información existente en los Datawarehouse. Estos sistemas no se limitan a proporcionar informes estáticos sino que a partir de ellos se puede dinámicamente ascender y descender a través de jerarquías predefinidas, rotar los ejes del análisis, incorporar funcionalidades como botones, alertas, listas desplegables. . . http: //www. progres. com. ar/businessint_2. asp
- Slides: 31