UNIVERSIDAD DE LAS FUERZAS ARMADAS ESPE TESIS DE

  • Slides: 41
Download presentation
UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE TESIS DE GRADO RICARDO MIGUEL DÍAZ RAZO

UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE TESIS DE GRADO RICARDO MIGUEL DÍAZ RAZO JULIO 2015 1

ANÁLISIS Y ESTRUCTURACIÓN DE LA INFORMACIÓN HIDROCARBURÍFERA NACIONAL Y GEOESPACIAL PARA EL DISEÑO Y

ANÁLISIS Y ESTRUCTURACIÓN DE LA INFORMACIÓN HIDROCARBURÍFERA NACIONAL Y GEOESPACIAL PARA EL DISEÑO Y CONSTRUCCIÓN DE UN DATA WAREHOUSE PARA LA TOMA DE DECISIONES SOCIO-AMBIENTALES DEL PROGRAMA DE REPARACIÓN AMBIENTAL Y SOCIAL – PRAS 2

AGENDA 3 1. Planteamiento del Problema: Situación Actual 2. Justificación 3. Objetivos 4. Inteligencia

AGENDA 3 1. Planteamiento del Problema: Situación Actual 2. Justificación 3. Objetivos 4. Inteligencia de Negocios 5. Metodología 6. Desarrollo del Proyecto 7. Conclusiones y Recomendaciones

PLANTEAMIENTO DEL PROBLEMA 4 El Programa de Reparación Ambiental y Social - PRAS almacena

PLANTEAMIENTO DEL PROBLEMA 4 El Programa de Reparación Ambiental y Social - PRAS almacena información Hidrocarburífera y de Gestión Social del País en archivos semiestructurados y georeferenciados, lo cuál dificulta el cruce de información para el análisis y elaboración de reportes para su personal Directivo y Estadístico

SITUACIÓN ACTUAL 15 días Shapefiles 5 Excel Análisis, Estructuración y Depuración de Información Presentación

SITUACIÓN ACTUAL 15 días Shapefiles 5 Excel Análisis, Estructuración y Depuración de Información Presentación de Resultados

JUSTIFICACIÓN Shapefiles ET L Staging EDW Data Marts Cubos de Información Presentación de Resultados

JUSTIFICACIÓN Shapefiles ET L Staging EDW Data Marts Cubos de Información Presentación de Resultados 1 -3 Minutos 6

OBJETIVOS GENERAL Dieñar una solución tecnológica para la toma de decisiones socio- ambientales del

OBJETIVOS GENERAL Dieñar una solución tecnológica para la toma de decisiones socio- ambientales del Programa de Reparación Ambiental y Social – PRAS. 7

OBJETIVOS ESPECÍFICOS 8 Organizar, estandarizar y estructurar la información del PRAS registrada en archivos

OBJETIVOS ESPECÍFICOS 8 Organizar, estandarizar y estructurar la información del PRAS registrada en archivos semiestructurados. Implementar el Data Warehouse para la integración de la información Hidrocarburífera y de Gestión Social existente. Generar procesos de extracción, transformación y carga para poblar el Data Warehouse. Visualizar información georeferenciada en tableros de control.

INTELIGENCIA DE NEGOCIOS Genera Conocimiento Procesamiento Datos 9 Información Estratégica Toma de Decisiones

INTELIGENCIA DE NEGOCIOS Genera Conocimiento Procesamiento Datos 9 Información Estratégica Toma de Decisiones

HERRAMIENTAS MÓDULO DESCRIPCIÓN Consultar, limpiar e integrar los datos donde quiera que se encuentren

HERRAMIENTAS MÓDULO DESCRIPCIÓN Consultar, limpiar e integrar los datos donde quiera que se encuentren (ETL). PENTAHO DATA INTEGRATION Es un sistema de base de datos relacional “orientada Acceder a los datos y entregar información a la a objetos” (diseñada para trabajar en conjunción con Plataforma de Inteligencia de Negocios, las soluciones que organización en todos sus niveles. lenguajes de programación orientados a objetos Pentaho pretende ofrecer se componen fundamentalmente de una PENTAHO REPORTING como Java, C#, Visual Basic. NET y C++). infraestructura de herramientas de análisis e informes, integrado Explorar y analizar variables de manera con un motor de workflow de procesos de negocio. interactiva con una respuesta rápida. PENTAHO ANALYSIS Obtener una visibilidad inmediata del estado del PENTAHO DASHBOARD negocio a través de las métricas y KPI’s. Descubrir patrones ocultos y los indicadores de PENTAHO DATA MINING 10 desempeño futuro

DW DM DM BOTTOM-UP METODOLOGíA DM EDW DM RALPH KIMBALL 11 TOP-DOWN BILL INMON

DW DM DM BOTTOM-UP METODOLOGíA DM EDW DM RALPH KIMBALL 11 TOP-DOWN BILL INMON ENFOQUE HORIZONTAL

METODOLOGíA ENFOQUE HORIZONTAL ¿Es importante la secuencia? GRADO DE COHESIÓN La separación de un

METODOLOGíA ENFOQUE HORIZONTAL ¿Es importante la secuencia? GRADO DE COHESIÓN La separación de un todo en partes más pequeñas que DATOS puedan ser diseñadas, y modificadas de SI probadas Funcional manera sencilla y lo más independientemente posible del ¿El módulo realiza una resto. función particular del problema? NO ¿Cómo están relacionadas las actividades del módulo? FLUJO DE CONTROL ¿Es importante la secuencia? SI Secuencial NO Comunicacional SI Procedural NO Temporal SI Lógica NADA ¿Es importante la secuencia? NO Coincidental 12

METODOLOGíA E N F O Q U E V E R T I C

METODOLOGíA E N F O Q U E V E R T I C A L 13 NIVEL DE GRANULARIDAD Obtener el último nivel jerárquico de cada dimensión con el mínimo nivel de detalle necesario para el análisis de información

METODOLOGíA 2. - Limpieza y Calidad de Datos EDW Archivos Staging Semiestructurados 14 3

METODOLOGíA 2. - Limpieza y Calidad de Datos EDW Archivos Staging Semiestructurados 14 3 FN Data Warehouse 3. - Almacen de Datos 4. - Modelo Data Marts 5. - Presentación 1. - Levantamiento y Análisis de Información Cubos de Información Capa de Presentación

DESARROLLO DEL PROYECTO FASE 1: LEVANTAMIENTO DE INFORMACIÓN 15

DESARROLLO DEL PROYECTO FASE 1: LEVANTAMIENTO DE INFORMACIÓN 15

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN Identificar los procesos del negocio. Requerimientos

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN Identificar los procesos del negocio. Requerimientos del proceso del negocio Ver en qué área protegida se encuentra cada infraestructura hidrocarburífera. Seguimiento, monitoreo y Determinar las infraestructuras que existen dentro de los diferentes territorios indígenas que hay en el país. evaluación de la Infraestructura Hidrocarburífera. Identificar en qué localidad se encuentra la mayor parte de infraestructuras estatales y no estatales. Ejecución de acciones previas y/o complementarias para la Gestión Identificar los estados de los pozos que existen actualmente. Social de la Reparación Integral Identificar los tipos de estaciones que existen actualmente. 16

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN SE INDENTIFICÓ: Indicadores. Nivel de Granularidad.

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN SE INDENTIFICÓ: Indicadores. Nivel de Granularidad. MÓDULO • Infraestructura Gestión Social Infraestructura 17 • • • GRANULARIDAD Número de Conflictos por: Número de infraestructuras por • Fecha nombre, sector censal, micro cuenca, área protegida, bloque petrolero, • Tipo de Acciones campo petrolero, territorio indígena, • Actores Involucrados estado pozo, tipo estación, tipo estatal • Agravantes y fecha. • Localidad Número de eventos por detalle, sector censal, micro cuenca, área protegida, Número de Estaciones bloque petrolero, campo petrolero, Número de Pozos territorio indígena, tipo, actor Número de Plataformas beneficiario, tipo documento, ámbito agravante figura y fecha.

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN SE INDENTIFICÓ: Grado de Cohesión. Funcional

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN SE INDENTIFICÓ: Grado de Cohesión. Funcional SI ¿El módulo realiza una función particular del problema? NO 18 ¿Cómo están relacionadas las actividades del módulo?

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN SE INDENTIFICÓ: El Punto de Equilibrio

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN SE INDENTIFICÓ: El Punto de Equilibrio entre nivel de granularidad y grado de cohesión. INFRAESTRUCTURA Ámbito Agravante Figura Fecha Estado Pozo Tipo Nombre Territorio Indigena Nombre Micro Cuenca Bloque Petrolero Tipo Estatal Actor Área Protegida Sector Censal. Beneficiario Detalle Sector Censal Área Protegida 19 Sector Censal Micro Cuenca Área Protegida Bloque Petrolero Campo Petrolero Territorio Indígena Documento Estado Pozo Campo Petrolero X Micro Cuenca Bloque Petrolero Tipo Campo Petrolero INFRAESTRUCTURA Ámbito Agravante Figura PUNTO DE EQUILIBRI Bloque Petrolero O Detalle Micro Cuenca Tipo Estación GESTIÓN SOCIAL Área Protegida Tipo GESTIÓN SOCIAL X Territorio Indigena X Fecha X X X Tipo Estación Actor Beneficiario Tipo Estatal Tipo Documento Fecha X

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN Estado Pozo Tipo Estación SE INDENTIFICÓ:

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN Estado Pozo Tipo Estación SE INDENTIFICÓ: 20 Modelo de Punto de Equilbrio. INFRAESTRUCTU RA Nombre GESTIÓN SOCIAL PUNTO DE EQUILIBRIO Detalle Sector Censal X Micro Cuenca X Área Protegida X Bloque Petrolero X Campo Petrolero X Territorio Indígena X Estado Pozo Tipo Estación Actor Beneficiario Tipo Estatal Tipo Documento Fecha X Ámbito Agravante Figura Nombre Tipo Estatal Infraestructura Sector Censal Micro Cuenca Tipo Actor Beneficiario Área Protegida Bloque Petrolero Campo Petrolero Territorio Indígena Tipo Documento Gestión Social Detalle Ámbito Agravante Figura Fecha

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN INFRAESTRUCTURA GESTIÓN SOCIAL SE INDENTIFICÓ: Dimensiones

DESARROLLO DEL PROYECTO LEVANTAMIENTO Y ANÁLISIS DE INFORMACIÓN INFRAESTRUCTURA GESTIÓN SOCIAL SE INDENTIFICÓ: Dimensiones y Medidas DIMENSIÓN Área Protegida Bloque Petrolero Campo Petrolero Dimensiones Cuenca Hidrográfica Gestión Social Estado Pozo Localidad Estatal Territorio Indígena Infraestructura Tiempo Localidad Actor Beneficiario Ámbito Agravante Figura Territorio Indígena Medidas 21 Medidas Tiempo. Tipo Documento Tipo Estación Número de Eventos Número de Infraestructuras

DESARROLLO DEL PROYECTO ANÁLISIS DE DRILL DOWN Y DRILL UP Infraestructura Área Protegida Nombre

DESARROLLO DEL PROYECTO ANÁLISIS DE DRILL DOWN Y DRILL UP Infraestructura Área Protegida Nombre Área Protegida Bloque Petrolero Nombre Bloque Petrolero Campo Petrolero Nombre Campo Petrolero Cuenca Hidrográfica Estado Pozo Cuenca Sub. Cuenca Microcuenca Nombre Estado Pozo Estatal Tipo Estatal Infraestructura Localidad Nombre Territorio Indígena Tiempo Tipo Provincia Nombre Cantón Mes Parroquia Día Zona Censal Sector Censal 22 Territorio Indígena Año Tipo Estación Nombre Tipo Estación

DESARROLLO DEL PROYECTO DRILL ACROSS Área Protegida Bloque Petrolero Número Infraestructura Territorio Indígena Localidad

DESARROLLO DEL PROYECTO DRILL ACROSS Área Protegida Bloque Petrolero Número Infraestructura Territorio Indígena Localidad Campo Petrolero Número Eventos Tiempo Cuenca Hidrográfica 23

DESARROLLO DEL PROYECTO FASE 2: LIMPIEZA Y CALIDAD DE DATOS 24

DESARROLLO DEL PROYECTO FASE 2: LIMPIEZA Y CALIDAD DE DATOS 24

DESARROLLO DEL PROYECTO -76. 95082010287325 -0. 1987667112888951) POINT (950947. 705527 9977974. 95604) WSG 84:

DESARROLLO DEL PROYECTO -76. 95082010287325 -0. 1987667112888951) POINT (950947. 705527 9977974. 95604) WSG 84: EPSG: 3260 25 STAGING POINT (-76. 95082010287325 -0. 1987667112888951) -76, 95082010287325; -0, 1987667112888951 WGS 84 EPSG: 4326

DESARROLLO DEL PROYECTO ENTERPRISE DATA WAREHOUSE BOSQUES Y VEGETACIÃ�N PROTECTORES 26 BOSQUES Y VEGETACIÓN

DESARROLLO DEL PROYECTO ENTERPRISE DATA WAREHOUSE BOSQUES Y VEGETACIÃ�N PROTECTORES 26 BOSQUES Y VEGETACIÓN PROTECTORES

DESARROLLO DEL PROYECTO ENTERPRISE DATA WAREHOUSE - ESQUEMA RELACIONAL 27

DESARROLLO DEL PROYECTO ENTERPRISE DATA WAREHOUSE - ESQUEMA RELACIONAL 27

DESARROLLO DEL PROYECTO FASE 3: ALMACÉN DE DATOS 28

DESARROLLO DEL PROYECTO FASE 3: ALMACÉN DE DATOS 28

DESARROLLO DEL PROYECTO DATA MARTS - DIMENSIONES AMO-DAIMI-GINTA-IRO 29 S K 1 CAMPO AMO-DAIMI-GINTA-IRO

DESARROLLO DEL PROYECTO DATA MARTS - DIMENSIONES AMO-DAIMI-GINTA-IRO 29 S K 1 CAMPO AMO-DAIMI-GINTA-IRO

DESARROLLO DEL PROYECTO DATA MARTS - TABLA DE HECHOS PARALIZACIÓN; 2010/01/31; ONG 30 S

DESARROLLO DEL PROYECTO DATA MARTS - TABLA DE HECHOS PARALIZACIÓN; 2010/01/31; ONG 30 S K 1 TIPO PARALIZACIÓN sk sk #

DESARROLLO DEL PROYECTO DATA MARTS - ESQUEMA EN ESTRELLA 31

DESARROLLO DEL PROYECTO DATA MARTS - ESQUEMA EN ESTRELLA 31

DESARROLLO DEL PROYECTO FASE 4: MODELO 32

DESARROLLO DEL PROYECTO FASE 4: MODELO 32

DESARROLLO DEL PROYECTO MODELO Dimensiones Únicas Dimensiones Compartidas Medida 33

DESARROLLO DEL PROYECTO MODELO Dimensiones Únicas Dimensiones Compartidas Medida 33

DESARROLLO DEL PROYECTO FASE 5: PRESENTACIÓN 34

DESARROLLO DEL PROYECTO FASE 5: PRESENTACIÓN 34

DESARROLLO DEL PROYECTO TABLEROS DE CONTROL 35

DESARROLLO DEL PROYECTO TABLEROS DE CONTROL 35

RESULTADOS PUBLIC 36 HN GS

RESULTADOS PUBLIC 36 HN GS

RESULTADOS SISTEMA DE INTELIGENCIA DE NEGOCIOS 37

RESULTADOS SISTEMA DE INTELIGENCIA DE NEGOCIOS 37

CONCLUSIONES El data warehouse construido basado en una metodología híbrida, además de la correcta

CONCLUSIONES El data warehouse construido basado en una metodología híbrida, además de la correcta definición del nivel granularidad y grado de cohesión, ha permitido solventar los requerimientos inicialmente planteados, permitiendo la simplificación del acceso a la información y la presentación de informes avanzados. 38

CONCLUSIONES La implantación del sistema de inteligencia de negocios “Pentaho” ha sido útil para

CONCLUSIONES La implantación del sistema de inteligencia de negocios “Pentaho” ha sido útil para observar el gran aporte dentro de la organización, por ser un sistema potente y asequible convirtiendose en la base para futuras implementaciones. El desarrollo de la solución ha permitido demostrar las capacidades de visualización de información, destacando enormemente los informes a nivel geográfico. 39

RECOMENDACIONES Para asegurar una gestión eficaz de la información dentro de la institución se

RECOMENDACIONES Para asegurar una gestión eficaz de la información dentro de la institución se debe construir un EDW en tercera forma normal para asegurar un posterior crecimiento, además de tener en consideración las metodologías y establecimiento del nivel de detalle que requiere el desarrollo. Para una mejor comprensión y mantenimiento del sistema de inteligencia de negocios, debido a su curva media de aprendizaje, se recomienda que las personas parte de alta gerencia y usuarios finales sean capacitadas en el uso funcional y técnico en la herramienta para certificar su uso eficiente. 40

RECOMENDACIONES Es recomendable la utilización de herramientas open source para llevar a cabo el

RECOMENDACIONES Es recomendable la utilización de herramientas open source para llevar a cabo el desarrollo de este tipo de proyectos, destinando un tiempo adecuado para el levantamiento de requerimientos para el total cumplimiento de los productos desarrollados, reutilizando lo ya existente y desarrollando o parametrizando lo que no exista en la aplicación. 41