TI en las Organizaciones Grupo TION C 20

  • Slides: 33
Download presentation
TI en las Organizaciones Grupo TION C 20 – Fundamentos de BI: Bases de

TI en las Organizaciones Grupo TION C 20 – Fundamentos de BI: Bases de Datos, Data Warehouse Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Management En la actualidad la información (datos) es uno de los activos más

Data Management En la actualidad la información (datos) es uno de los activos más importantes de la organización Relevante Acertada Disponible - Oportuna Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Problemas del enfoque tradicional de datos Grupo de investigación: Tecnologías de Información, Organizaciones y

Problemas del enfoque tradicional de datos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Problemas del enfoque tradicional de datos Redundancia e Inconsistencia de datos • La redundancia

Problemas del enfoque tradicional de datos Redundancia e Inconsistencia de datos • La redundancia de datos se da cuando la misma información se encuentra en diferentes sitios (Sistemas) de la organización • La redundancia de datos produce inconsistencia de datos, es decir, cuando un mismo atributo tiene diferentes valores en diferentes sistemas • Se puede presentar también por los diferentes sistemas de codificación usados para representar valores: “Extra Large” Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Problemas del enfoque tradicional de datos Dependencia Aplicación - Datos • Existe un acoplamiento

Problemas del enfoque tradicional de datos Dependencia Aplicación - Datos • Existe un acoplamiento entre la información y los sistemas específicos que la mantienen y la actualizan Cambios en las aplicaciones implican cambios en la información (Viceversa) 5 dígitos 9 dígitos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Problemas del enfoque tradicional de datos Falta de Flexibilidad • No se tiene la

Problemas del enfoque tradicional de datos Falta de Flexibilidad • No se tiene la posibilidad de realizar reportes ad – hoc por los costos de recuperar y consolidar la información. Falta de Seguridad • Debido a la falta de gestión de datos, el acceso y distribución de información no está controlado. Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Problemas del enfoque tradicional de datos Poca disponibilidad y dificultades de transferencia • Al

Problemas del enfoque tradicional de datos Poca disponibilidad y dificultades de transferencia • Al estar dispersa la información (con mala gestión de información) es prácticamente imposible compartir información o garantizar disponibilidad Cómo se solucionan todos estos problemas? Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Conceptos claves Conjunto de archivos relacionados Conjunto de record del mismo tipo Conjunto de

Conceptos claves Conjunto de archivos relacionados Conjunto de record del mismo tipo Conjunto de campos relacionados Conjunto de caracteres (significado) 8 Bits – Representan un carácter Unidad más pequeña de info Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Bases de Datos - SMBD Bases de Datos: Colección de datos organizados para servir

Bases de Datos - SMBD Bases de Datos: Colección de datos organizados para servir diferentes aplicaciones de manera eficiente mediante la centralización y control de datos redundantes. Sistemas Manejadores de Base de Datos: es un software que permite a una organización, centralizar sus datos, gestionarlos eficientemente y proveer a las aplicaciones acceso a la información almacenada. El SMDB actúa como una interfaz entre las aplicaciones y los datos físicos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Bases de Datos - SMBD En un enfoque tradicional el programador debía especificar el

Bases de Datos - SMBD En un enfoque tradicional el programador debía especificar el tamaño y el formato de cada entidad de datos que se este utilizando en el programa, así como identificar donde están localizados. Con un SMBD se libera al programador o al usuario final de la tarea de entender como está estructurada y localizada la información Vista Lógica y Vista Física Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Bases de Datos - SMBD Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Bases de Datos - SMBD Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Relacionales Actualmente es el tipo de base de datos

Tipos de Bases de Datos Relacionales Actualmente es el tipo de base de datos más popular y utilizada en el contexto organizacional. Representan la información a través de tablas y relaciones entre estas Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Cómo sería el modelo entidad relación de Facebook? Grupo

Tipos de Bases de Datos Cómo sería el modelo entidad relación de Facebook? Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Tipos de Bases de Datos Orientadas a Objetos Nacen por la necesidad de almacenar

Tipos de Bases de Datos Orientadas a Objetos Nacen por la necesidad de almacenar información no estructurada Fotos, Videos, Voz Los OODBMS han tenido gran acogida por su habilidad de manejar componentes multimedia de aplicaciones web Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Bases de Datos para el apoyo a la decisión Las bases de datos son

Bases de Datos para el apoyo a la decisión Las bases de datos son normalmente utilizadas para realizar las transacciones diarias (operativas) de las organización Pago a proveedores, procesamiento de ordenes, pago a empleados, etc. Data Mining Las organizaciones también necesitan bases de datos para realizar análisis, mejorar la eficiencia y tomar decisiones. Data Warehouse Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Warehouse Suponga que una organización desea información concisa y confiable de las operaciones,

Data Warehouse Suponga que una organización desea información concisa y confiable de las operaciones, tendencias y cambios a lo largo de toda la compañía. Difícil debido a: Generalmente la información está separada en diferentes sistemas. Las bases de datos guardan sólo el estado actual de la información Las operaciones y el día a día están soportados por las bases de datos convencionales Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Qué es un Data Warehouse? “Es una base de datos que almacena y gestiona

Qué es un Data Warehouse? “Es una base de datos que almacena y gestiona datos actuales e históricos de potencial interés para la toma de decisiones” En un DW se consolida y estandariza información de diferentes bases de datos operacionales, para que pueda ser utilizada por toda la empresa para la toma de decisiones Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Qué es un Data Warehouse? • Un DW hace accesible la información a quien

Qué es un Data Warehouse? • Un DW hace accesible la información a quien la necesite, pero estos no pueden alterarla. • Un DW permite un amplio rango de consultas ad hoc a través de herramientas analíticas, standardized query tools y facilidades para reportes gráficos y visuales Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Qué es un Data Warehouse? Fecha de nacimiento Edad Grupo de investigación: Tecnologías de

Qué es un Data Warehouse? Fecha de nacimiento Edad Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Qué es un Data Warehouse? Utilizan una gigantesca bodega de datos (DW) que almacena

Qué es un Data Warehouse? Utilizan una gigantesca bodega de datos (DW) que almacena 3 años de historial de compras de más de 195 millones de clientes en USA La base de datos de clientes más grande del mundo Determinan patrones de compra y preferencias de cada usuario En tiempo real determina que cupones van a ser entregados al cliente en el momento de una compra Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Qué es un Data Marts? Las empresas pueden construir bodegas de datos corporativas que

Qué es un Data Marts? Las empresas pueden construir bodegas de datos corporativas que sirven a toda la organización. O pueden adicionalmente construir “bodegas más pequeñas” llamadas Data Marts Un Data Marts es un subconjunto de un DW enfocado o especializado en un área de negocio: • Ventas POS, Online • Producción • Abastecimiento Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

“Herramientas” para Inteligencia de Negocios Análisis Multidimensional Data Mining OLAP Grupo de investigación: Tecnologías

“Herramientas” para Inteligencia de Negocios Análisis Multidimensional Data Mining OLAP Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Online Analytical Processing (OLAP) Suponga que su compañía vende diferentes productos Tuercas, Pernos, Arandelas

Online Analytical Processing (OLAP) Suponga que su compañía vende diferentes productos Tuercas, Pernos, Arandelas y Tornillos Los vende en diferentes regiones Oriental, Occidental y Central Cuantos tornillos se vendieron en el último trimestre? Consulta en base de datos Operacional Cuantos tornillos se vendieron por región y cuál es la relación con los pronósticos de ventas? OLAP Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Online Analytical Processing (OLAP) OLAP soporta análisis multidimensional de datos, permitiendo a los usuarios

Online Analytical Processing (OLAP) OLAP soporta análisis multidimensional de datos, permitiendo a los usuarios ver la misma información desde diferentes perspectivas En nuestra compañía, el producto, el precio, el costo, la región y el periodo de tiempo, representan dimensiones diferentes. Permite consultas Ad-Hoc en tiempos muy cortos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Mining La minería de datos proporciona información detallada sobre los datos corporativos que

Data Mining La minería de datos proporciona información detallada sobre los datos corporativos que no pueden ser obtenidos con OLAP La minería de datos encuentra patrones y relaciones ocultos de los datos en grandes bodegas de datos. Adicionalmente, infiere reglas que pueden predecir comportamiento futuro Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Mining Los tipos de información que se puede obtener de la minería de

Data Mining Los tipos de información que se puede obtener de la minería de datos son: Asociaciones, Secuencialidad, Clasificaciones, Clustering y pronósticos Asociaciones: Ocurrencias relacionadas a un mismo evento. 65 % de las veces 85 % de las veces si hay promoción Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Mining Secuencialidad: Eventos relacionados en el tiempo Con la compra de una casa,

Data Mining Secuencialidad: Eventos relacionados en el tiempo Con la compra de una casa, 65% de las veces se compra una nueva nevera dentro de las siguientes 2 semanas Y 45% de las veces se compra un nuevo horno dentro del siguiente mes Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Mining Clasificación: Reconoce patrones que describen el grupo al cual pertenece un individuo

Data Mining Clasificación: Reconoce patrones que describen el grupo al cual pertenece un individuo a través del análisis de los individuos ya clasificados e infiriendo reglas A través de la clasificación se pueden encontrar aquellos clientes rentables que son propensos a salir de la compañía Información útil para la toma de decisiones Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Mining Clustering: Trabaja de manera similar a la clasificación, pero aquí los grupos

Data Mining Clustering: Trabaja de manera similar a la clasificación, pero aquí los grupos y sus características no están definidos. A través de clustering los bancos pueden segmentar sus clientes basados en ingresos tipos de inversión y factores demográficos Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Data Mining Pronósticos: Parte de la información actual encontrando patrones y prediciendo comportamiento. Planeación

Data Mining Pronósticos: Parte de la información actual encontrando patrones y prediciendo comportamiento. Planeación de ventas Grupo de investigación: Tecnologías de Información, Organizaciones y Negocios

Un último ejemplo Pañales y cervezas: • Finales de los 90 en Walmart. •

Un último ejemplo Pañales y cervezas: • Finales de los 90 en Walmart. • Desarrollo de proyecto de minería de datos sobre su bodega de datos. Resultados iniciales no muy alentadores: • Quien compra crema dental también compra cepillos de dientes • Quien compra Whisky Dy. C también compra Coca cola Resultados interesantes • Correlación entre quien compra pañales y cervezas • Varones entre 25 y 35 años compraban estos productos conjuntamente los viernes por la tarde. ¿Como explicarlo? las madres mandaban a los papás a comprar los pañales y de paso como es viernes pues aprovechan y compran las cervezas. Los pañales son un producto voluminoso. de investigación: Tecnologías de ¿Qué hacer con esa información? 10% y 15% de aumento ventas. Grupo Información, Organizaciones y Negocios