VICERRECTORADO DE INVESTIGACIN INNOVACIN Y TRANSFERENCIA TECNOLGICA DEPARTAMENTO

  • Slides: 51
Download presentation
VICERRECTORADO DE INVESTIGACIÓN, INNOVACIÓN Y TRANSFERENCIA TECNOLÓGICA DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN

VICERRECTORADO DE INVESTIGACIÓN, INNOVACIÓN Y TRANSFERENCIA TECNOLÓGICA DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN

SLR APLICANDO TEXT MINING PARA LA ADOPCIÓN DE SOFTWARE DE BUSINESS INTELLIGENCE EN EL

SLR APLICANDO TEXT MINING PARA LA ADOPCIÓN DE SOFTWARE DE BUSINESS INTELLIGENCE EN EL ÁREA DE INVESTIGACIÓN DE LA UNACH

contact us_ awesome@gmail. com 3

contact us_ awesome@gmail. com 3

CAPÍTULO 01 INTRODUCCIÓN contact us_ awesome@gmail. com 4

CAPÍTULO 01 INTRODUCCIÓN contact us_ awesome@gmail. com 4

 contact us_ awesome@gmail. com 5

contact us_ awesome@gmail. com 5

General El objetivo central de esta investigación es, realizar una revisión sistemática de literatura

General El objetivo central de esta investigación es, realizar una revisión sistemática de literatura (SLR) aplicando text mining para la optimización del proceso de una SLR de forma tradicional en la adopción de software de Business Intelligence para el área de investigación de la UNACH. contact us_ awesome@gmail. com 6

CAPÍTULO 02 MARCO TEÓRICO contact us_ awesome@gmail. com 7

CAPÍTULO 02 MARCO TEÓRICO contact us_ awesome@gmail. com 7

Ninguno de estos estudios se ha enfocado en la adopción de software de Business

Ninguno de estos estudios se ha enfocado en la adopción de software de Business Intelligence con una revisión sistemática de literatura aplicando técnicas de text mining 01 No presentan la utilización de text mining en la creación de las cadenas de búsqueda Utilizan diferentes herramientas de software para text mining Presentan un protocolo de revisión diferente No presentan la utilización de text mining en la depuración de estudios contact us_ awesome@gmail. com 8

“Una SLR es un medio para evaluar e interpretar toda la investigación pertinente disponible

“Una SLR es un medio para evaluar e interpretar toda la investigación pertinente disponible a una pregunta de investigación, área temática o fenómeno de interés” (Kitchenham & Charters, 2007, p. 7). La minería de texto se define como la extracción automática de información previamente desconocida y potencialmente útil a partir de texto” (Sahadevan, Hofmann-Apitius, & Schellander, 2012, p. 1) Es una herramienta que puede analizar y procesar los datos existentes de la empresa y convertirlos en conocimiento” (Lv, Xie, Wang, & Cheng, 2012, p. 1) contact us_ awesome@gmail. com 9

contact us_ awesome@gmail. com 10

contact us_ awesome@gmail. com 10

CAPÍTULO 03 METODOLOGÍA DE INVESTIGACIÓN contact us_ awesome@gmail. com 11

CAPÍTULO 03 METODOLOGÍA DE INVESTIGACIÓN contact us_ awesome@gmail. com 11

contact us_ awesome@gmail. com 12

contact us_ awesome@gmail. com 12

Hipótesis Nula (H 0): No existe diferencia entre los promedios de tiempo al realizar

Hipótesis Nula (H 0): No existe diferencia entre los promedios de tiempo al realizar la SLR con el procedimiento tradicional y con la SLR aplicando text mining. Hipótesis Alternativa (H 1): El promedio del tiempo al realizar la SLR con el procedimiento tradicional es mayor al promedio de tiempo de la SLR aplicando text mining. Comparación de medias independientes. Prueba de hipótesis estadística será la distribución de probabilidad T-Student Alfa de 0, 05 que representa al margen de error tolerado para esta investigación, confiabilidad del 95%. contact us_ awesome@gmail. com 13

CAPÍTULO 04 REVISIÓN SISTEMÁTICA DE LITERATURA contact us_ awesome@gmail. com 14

CAPÍTULO 04 REVISIÓN SISTEMÁTICA DE LITERATURA contact us_ awesome@gmail. com 14

Basado en “Conceptualización e Infraestructura para la Investigación Experimental en Ingeniería del Software” (Fonseca

Basado en “Conceptualización e Infraestructura para la Investigación Experimental en Ingeniería del Software” (Fonseca Carrera, 2014), y complementado por la “Guidelines for performing Systematic Literature Reviews in Software Engineering” (Kitchenham & Charters, 2007), contact us_ awesome@gmail. com 15

RQ 1. ¿Cuáles son las herramientas de Business Intelligence más utilizadas? RQ 2. ¿Cuáles

RQ 1. ¿Cuáles son las herramientas de Business Intelligence más utilizadas? RQ 2. ¿Cuáles son las herramientas de Business Intelligence más populares? RQ 3. ¿En qué tipo de industrias o sectores son más utilizados los Sistemas de Business Intelligence? RQ 4. ¿Cuál es el procedimiento para la realización de una revisión sistemática de literatura (SLR)? contact us_ awesome@gmail. com 16

INCLUSIÓN trabajos de cincos años atrás a la fecha de revisión libros, capítulos de

INCLUSIÓN trabajos de cincos años atrás a la fecha de revisión libros, capítulos de libros, artículos y ponencias que especifiquen: el sector de aplicación, la herramienta utilizada bases de datos para la búsqueda de trabajos relacionados: SCOPUS, Science Direct, IEEE XPlore y EBSCO EXCLUSIÓN registros que especifiquen el nombre del evento o el área de conocimiento del congreso, en lugar del título del trabajo de investigación. análisis comparativos con resultados resumidos similares a este estudio trabajos que indiquen un aporte técnico o metodológico en el cuál no se pueda determinar una herramienta de BI aplicada a un estudio en particular Trabajos contenido en idiomas diferentes al inglés o español los artículos que posean un aviso de retracción contact us_ awesome@gmail. com 17

Se han tomado 8 artículos para el grupo de control 2 por investigador de

Se han tomado 8 artículos para el grupo de control 2 por investigador de la base de datos SCOPUS contact us_ awesome@gmail. com 18

contact us_ awesome@gmail. com 19

contact us_ awesome@gmail. com 19

1. Realizar una lista de palabras encontradas. 2. Contar el número de veces que

1. Realizar una lista de palabras encontradas. 2. Contar el número de veces que se repite una palabra por trabajo. 3. Realizar un ranking con las primeras 10 palabras encontradas, en orden del número de veces que aparecen en los trabajos. 4. Verificar el número de palabras que son comunes entre los diferentes trabajos. 5. Obtener un listado de palabras para la creación de las cadenas de búsqueda. Palabra N° de Estudios BUSINESS INTELLIGENCE 6 DECISION 4 SYSTEMS 3 BI 3 STUDY 3 COMPANY 2 ANALYSIS 2 DATA 3 INFORMATION 2 contact us_ awesome@gmail. com 20

Investigador Cadena de Búsqueda Estudios del Grupo de Control Investigador 1 (BUSINESS INTELLIGENCE OR

Investigador Cadena de Búsqueda Estudios del Grupo de Control Investigador 1 (BUSINESS INTELLIGENCE OR BI) AND (SYSTEMS OR SYSTEM OR EC 2, EC 4, EC 5, SOLUTIONS OR SOFTWARE) AND (DATA OR INFORMATION) AND EC 7 (COMPANY OR COMPANIES) Investigador 2 (BUSINESS INTELLIGENCE OR BI) AND (SYSTEMS OR SYSTEM OR EC 2, EC 3, EC 4, SOLUTIONS OR SOFTWARE) AND (DATA OR INFORMATION) AND EC 7 (COMPANY OR COMPANIES) AND (STUDY) Investigador 3 (BUSINESS INTELLIGENCE OR BI) AND (SYSTEMS OR SYSTEM OR EC 1, EC 4 SOLUTIONS OR SOFTWARE) AND (COMPANY OR COMPANIES) AND (STUDY) AND (ADOPTION) Investigador 4 (BUSINESS INTELLIGENCE OR BI) AND (SYSTEMS OR SYSTEM OR EC 1, EC 2, EC 3, SOLUTIONS OR SOFTWARE) AND (COMPANY OR COMPANIES) AND EC 4, EC 7, EC 8 (STUDY) AND (DECISION) contact us_ awesome@gmail. com 21

contact us_ awesome@gmail. com 22

contact us_ awesome@gmail. com 22

Depuración de la base de datos Scopus contact us_ awesome@gmail. com 23

Depuración de la base de datos Scopus contact us_ awesome@gmail. com 23

contact us_ awesome@gmail. com 24

contact us_ awesome@gmail. com 24

Elección individual de estudios. Validación cruzada. Listado de estudios seleccionados contact us_ awesome@gmail. com

Elección individual de estudios. Validación cruzada. Listado de estudios seleccionados contact us_ awesome@gmail. com 25

Unificación de estudios Obtención y estudio de artículos Listado de estudios primarios 407 trabajos

Unificación de estudios Obtención y estudio de artículos Listado de estudios primarios 407 trabajos de 436 estudios totales contact us_ awesome@gmail. com 26

Estudios Nº Candidatos 1083 Depurados 1028 Seleccionados 436 Recuperados 407 Primarios 367 contact us_

Estudios Nº Candidatos 1083 Depurados 1028 Seleccionados 436 Recuperados 407 Primarios 367 contact us_ awesome@gmail. com 27

Estudio detallado de artículos Aplicando Text Mining -Listado de 170 herramientas de BI -Diccionario

Estudio detallado de artículos Aplicando Text Mining -Listado de 170 herramientas de BI -Diccionario con 265 reglas para obtener los sectores de aplicación de BI contact us_ awesome@gmail. com 28

RQ 1. ¿Cuáles son las herramientas de Business Intelligence más utilizadas? contact us_ awesome@gmail.

RQ 1. ¿Cuáles son las herramientas de Business Intelligence más utilizadas? contact us_ awesome@gmail. com 29

RQ 2. ¿Cuáles son las herramientas de Business Intelligence más populares? contact us_ awesome@gmail.

RQ 2. ¿Cuáles son las herramientas de Business Intelligence más populares? contact us_ awesome@gmail. com 30

RQ 3. ¿En qué tipo de industrias o sectores son más utilizados los Sistemas

RQ 3. ¿En qué tipo de industrias o sectores son más utilizados los Sistemas de Business Intelligence? contact us_ awesome@gmail. com 31

RQ 3. ¿En qué tipo de industrias o sectores son más utilizados los Sistemas

RQ 3. ¿En qué tipo de industrias o sectores son más utilizados los Sistemas de Business Intelligence? contact us_ awesome@gmail. com 32

RQ 4. ¿Cuál es el procedimiento para la realización de una revisión sistemática de

RQ 4. ¿Cuál es el procedimiento para la realización de una revisión sistemática de literatura (SLR) aplicando minería de texto para la adopción de Software de Business Intelligence? contact us_ awesome@gmail. com 33

CAPÍTULO 05 RESULTADOS DE LA INVESTIGACÍÓN contact us_ awesome@gmail. com 34

CAPÍTULO 05 RESULTADOS DE LA INVESTIGACÍÓN contact us_ awesome@gmail. com 34

contact us_ awesome@gmail. com 35

contact us_ awesome@gmail. com 35

contact us_ awesome@gmail. com 36

contact us_ awesome@gmail. com 36

Tiempo total en horas de la SLR 100 76. 603 48. 465 50 0

Tiempo total en horas de la SLR 100 76. 603 48. 465 50 0 Total de tiempo SLR Tiempo Text Mining Tiempo tradicional contact us_ awesome@gmail. com 37

Revisión en texto no estructurado Diccionario de palabras creado Agrupación Jerárquica de palabras Escalamiento

Revisión en texto no estructurado Diccionario de palabras creado Agrupación Jerárquica de palabras Escalamiento multidimensional de palabras Calidad de información Agrupamiento de información Extracción de información contact us_ awesome@gmail. com 38

Algoritmos y técnicas insuficientes para el pensamiento humano No es completamente automático contact us_

Algoritmos y técnicas insuficientes para el pensamiento humano No es completamente automático contact us_ awesome@gmail. com 39

Se utiliza el valor superior (Sig. Bilateral) que es igual a 0, 001, el

Se utiliza el valor superior (Sig. Bilateral) que es igual a 0, 001, el mismo que es menor a alfa de 0, 05 aceptando la hipótesis alternativa (H 1) “El promedio del tiempo al realizar la SLR con el procedimiento tradicional es mayor al promedio de tiempo de la SLR aplicando text mining”. contact us_ awesome@gmail. com 40

CAPÍTULO 06 IMPLEMENTACIÓN DE LA SOLUCIÓN DE BI contact us_ awesome@gmail. com 41

CAPÍTULO 06 IMPLEMENTACIÓN DE LA SOLUCIÓN DE BI contact us_ awesome@gmail. com 41

contact us_ awesome@gmail. com 42

contact us_ awesome@gmail. com 42

Misión “La Universidad Nacional de Chimborazo es una institución de educación superior, que en

Misión “La Universidad Nacional de Chimborazo es una institución de educación superior, que en el marco de una autonomía responsable y de rendición social de cuentas, forma profesionales emprendedores, con Sus ejes estratégicos son bases científicas y axiológicas, que contribuyen en la solución de los Gestión y administración, Docencia y formación de recursos humanos, “La Universidad Nacional de Chimborazo será una institución Investigación científica y tecnológica, líder en el Sistema de Educación Superior, comprometida con el Vinculación con la colectividad e progreso sustentable y sostenible de la sociedad, con sujeción al Plan Inversión pública. problemas del país” (Universidad Nacional de Chimborazo, 2013, p. 2). Visión Nacional de Desarrollo y Régimen del Buen Vivir” (Universidad Nacional de Chimborazo, 2013, p. 2). contact us_ awesome@gmail. com 43

contact us_ awesome@gmail. com 44

contact us_ awesome@gmail. com 44

contact us_ awesome@gmail. com 45

contact us_ awesome@gmail. com 45

contact us_ awesome@gmail. com 46

contact us_ awesome@gmail. com 46

contact us_ awesome@gmail. com 47

contact us_ awesome@gmail. com 47

CAPÍTULO 07 contact us_ awesome@gmail. com 48

CAPÍTULO 07 contact us_ awesome@gmail. com 48

la revisión de texto no estructurado, análisis de contenido, escalamiento multidimensional de palabras, revisión

la revisión de texto no estructurado, análisis de contenido, escalamiento multidimensional de palabras, revisión de calidad y clasificación de información. Diccionarios de herramientas de BI clasificar el contenido de los trabajos científicos por cada herramienta y para la revisión por parte de los investigadores del corpus del texto devuelto. SLR responde: La herramienta más utilizada y más popular de los casos analizados. Las industrias de Tecnologías de Información y Empresas de Fabricación son los sectores que ocupan más BI. Se plantea un procedimiento hibrido para llevar a cabo la SLR. Optimización de tiempo de la SLR con text mining, estadísticamente significativa con un valor de 0, 001 el mismo que es menor a alfa de 0, 050. contact us_ awesome@gmail. com 49

Para la implementación de la solución de BI se utiliza la metodología Kimball, SQL

Para la implementación de la solución de BI se utiliza la metodología Kimball, SQL Server para la base de datos de Staging y para el Data Mart de Publicaciones Científicas, Integration Services y Power BI para la visualización de los Dashboards. contact us_ awesome@gmail. com 50

- Diccionario rico en palabras - Planteamiento cíclico de palabras - Particularizar a un

- Diccionario rico en palabras - Planteamiento cíclico de palabras - Particularizar a un sector específico SLR - Participantes voluntarios, capacitar a los mismos, o contratar personal. - Utilizar herramientas que hayan sido utilizadas con frecuencia. Implementación de BI - Compra de licencias contact us_ awesome@gmail. com 51