ESCUELA POLITCNICA DEL EJERCITO DEPARTAMENTO DE CIENCIAS DE

  • Slides: 53
Download presentation
ESCUELA POLITÉCNICA DEL EJERCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN Tesis previo a la

ESCUELA POLITÉCNICA DEL EJERCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN Tesis previo a la obtención del título de Magíster en Gestión de Sistemas de Información e Inteligencia de Negocios.

TEMA: “ANÁLISIS DE TENDENCIAS Y DESCUBRIMIENTO DE PATRONES DE COMPORTAMIENTO DE DEMANDAS JUDICIALES PARA

TEMA: “ANÁLISIS DE TENDENCIAS Y DESCUBRIMIENTO DE PATRONES DE COMPORTAMIENTO DE DEMANDAS JUDICIALES PARA EL CONSEJO DE LA JUDICATURA UTILIZANDO ALGORITMOS Y TÉCNICAS DE MINERÍA DE DATOS. ” AUTOR: WILFREDO MARTEL SOCOLA DIRECTOR DE TESIS: REVISOR: Ing. PEDRO ECHEVERRÍA Ing. CÉSAR VILLACÍS SANGOLQUÍ, 01 DE FEBRERO DEL 2017

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

INTRODUCCIÓN Información Ventajas Conocimiento

INTRODUCCIÓN Información Ventajas Conocimiento

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

ANTECEDENTES DE LA FUNCIÓN JUDICIAL Nacimiento de la Función Judicial 1983 Conformada por cortes

ANTECEDENTES DE LA FUNCIÓN JUDICIAL Nacimiento de la Función Judicial 1983 Conformada por cortes y tribunales de justicia. Visión. - hacer de la justicia ecuatoriana un sinónimo de calidad y confianza. Misión. - Contribuir a la paz social del país mediante el servicio de una justicia efectiva. El plan piloto inicia en : Guayaquil, Quito, Cuenca, Riobamba entre otras. Automatización Judicial 2001 2002 Hoy en día, el Sistema judicial e. SATJE es utilizado a nivel nacional. 1. Sorteos 2. Medidas cautelares 3. Ordenes y boletas 4. Pensiones Alimenticias 5. Gestión de procesos judiciales 6. Entre otros. A nivel nacional Hoy Se desarrollan muchas herramientas para facilitar Las actividades de los usuarios. Evoluciona a e. SATJE

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

Situación problemática 1 2 Si demando a mi esposo por alimentos ¿cuánto tiempo me

Situación problemática 1 2 Si demando a mi esposo por alimentos ¿cuánto tiempo me llevará el proceso judicial? Si el proceso es muy largo significa que tendré que pagar mucho dinero el abogado. 3 Mejor desistiré del proceso porque no tengo mucho dinero para pagar el abogado. 4 Como odio los procesos judiciales.

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

Desarrollar un modelo predictivo mediante el análisis de tendencias y patrones de duración de

Desarrollar un modelo predictivo mediante el análisis de tendencias y patrones de duración de las demandas judiciales para determinar el tiempo promedio de duración de un juicio en la ciudad de Quito-Ecuador en el año 2015 -2016. Objetivo específicos Ob jet ivo Ge n er al Objetivos 1 cia n e t s i a ex tre los l r a c i Verif lación en e re os d r t s de la i g os re judiciales i p o r p sos e c o r los p 015. 2 o ñ del a 4 Validar el modelo obtenido. 3 Determ i de los nar las tend en pr utiliza ocesos judic cias nd ia registr o el historia les ld os judicia de los proc e es les del año 20 os 15. 2 Desarrollar un modelo predictivo de la duración promedio de un juicio a través del análisis de patrones de los procesos judiciales del año 2015. 5 amente la t c e r r o c r a c li p A RISP-DM metodología C llo del para el desarro vestigación. in e d o t c e y o r p

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

ASPECTOS GENERALES 1 Antecedentes Situación problemática 3 Objetivos 2

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

n ió c u l So Como parte de la solución, con el proyecto

n ió c u l So Como parte de la solución, con el proyecto del modelo predictivo de causas procesales se busca mejorar el servicio a la ciudadanía porque a través de el, los ciudadanos podrán determinar el tiempo promedio de duración de un juicio. Además, el análisis de tendencia de los procesos judiciales (que son objetivos secundarios) determinará los meses de mayor concentración de Materias demanda y con esto se podrá mejorar el servicio que ofrece la función judicial para el bienestar de todos los ecuatorianos. May cred or ibilid ad r o j e M o i c i v r se No impunidad Mayor confianza

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de los datos Modelado Evaluación Implantación 04 05 06

Comprensión del negocio Esta fase es de extrema importancia debido a que el explorador

Comprensión del negocio Esta fase es de extrema importancia debido a que el explorador debe mentalizar y comprender el negocio para poder definir junto con la empresa los objetivos de la minería de datos. Los objetivos deben ser medibles y alcanzables a corto plazo porque eso busca una empresa, resolver sus problemas en el menor tiempo posible. Ver

Comprensión del negocio Verificar la relación de los registros que contiene el sistema judicial

Comprensión del negocio Verificar la relación de los registros que contiene el sistema judicial en la materia familia niñez y adolescencia en el año 2015. Desarrollar un modelo predictivo de la duración promedio de un juicio en el año 2015, en materia de familia niñez y adolescencia. Determinar las tendencias de los procesos judiciales en el año 2015, en materia de familia niñez y adolescencia.

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de los datos Modelado Evaluación Implantación 04 05 06

En esta fase se debe recolectar los datos que sean de utilidad para nuestra

En esta fase se debe recolectar los datos que sean de utilidad para nuestra investigación. r a t c e l Reco iniciales datos Explorar los datos s o l r i b i r c s e D datos Verificar la calidad d e los datos COMPRENSIÓN DE LOS DATOS

RECOLECCIÓN Y DESCRIPCIÓN DE LOS DATOS a t c e l Recormación info Describe

RECOLECCIÓN Y DESCRIPCIÓN DE LOS DATOS a t c e l Recormación info Describe los datos R l u s e o d ta

En esta fase se debe recolectar los datos que sean de utilidad para nuestra

En esta fase se debe recolectar los datos que sean de utilidad para nuestra investigación. r a t c e l Reco iniciales datos Explorar los datos s o l r i b i r c s e D datos Verificar la calidad d e los datos COMPRENSIÓN DE LOS DATOS

EXPLORACIÓN DE LOS DATOS Se sumerge dentro de los datos y a través de

EXPLORACIÓN DE LOS DATOS Se sumerge dentro de los datos y a través de herramientas de minería como R se realiza una radiografía de los datos con el fin de detectar anomalías. Histograma general de los datos Juicios resueltos por mes

EXPLORACIÓN DE LOS DATOS Cantidad de juicios resueltos por día

EXPLORACIÓN DE LOS DATOS Cantidad de juicios resueltos por día

EXPLORACIÓN DE LOS DATOS Juicios resueltos por meses ¿Para qué me sirve saber eso?

EXPLORACIÓN DE LOS DATOS Juicios resueltos por meses ¿Para qué me sirve saber eso?

En esta fase se debe recolectar los datos que sean de utilidad para nuestra

En esta fase se debe recolectar los datos que sean de utilidad para nuestra investigación. r a t c e l Reco iniciales datos Explorar los datos s o l r i b i r c s e D datos Verificar la calidad d e los datos COMPRENSIÓN DE LOS DATOS

VERIFICACIÓN DE LA CALIDAD DE LOS DATOS ¿Qué significa los puntos fuera del intervalo?

VERIFICACIÓN DE LA CALIDAD DE LOS DATOS ¿Qué significa los puntos fuera del intervalo?

VERIFICACIÓN DE LA CALIDAD DE LOS DATOS ¿Qué significa los puntos fuera del intervalo?

VERIFICACIÓN DE LA CALIDAD DE LOS DATOS ¿Qué significa los puntos fuera del intervalo?

VERIFICACIÓN DE LA CALIDAD DE LOS DATOS Se encontró 2% de los datos atípicos

VERIFICACIÓN DE LA CALIDAD DE LOS DATOS Se encontró 2% de los datos atípicos

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de los datos Modelado Evaluación Implantación 04 05 06

Modelado a l e d n ó i c c e l Se e

Modelado a l e d n ó i c c e l Se e d a c i técn lado n ó e i d c o a m Gener prueba de la los para los mode Constr del mo ucción delado PASOS Evaluación modelado del

Modelado SELECCIÓN DE LA TÉCNICA DE MODELADO Para nuestro propósito se seleccionaron los dos

Modelado SELECCIÓN DE LA TÉCNICA DE MODELADO Para nuestro propósito se seleccionaron los dos modelos que se exponen, a continuación: MODELO LINEAL 01 02 MODELO DE MAQUINA DE SOPORTE

Modelado a l e d n ó i c c e l Se e

Modelado a l e d n ó i c c e l Se e d a c i técn lado n ó e i d c o a m Gener prueba de la los para los mode Constr del mo ucción delado PASOS Evaluación modelado del

Modelado GENERACIÓN DE LA PRUEBA PARA LOS MODELOS OBTENIDOS Para medir el error de

Modelado GENERACIÓN DE LA PRUEBA PARA LOS MODELOS OBTENIDOS Para medir el error de variaciones del modelado utilizaremos el MAE (Error absoluto medio) y RMSE (Error cuadrático medio) Información a ser analizada. 100% de los datos tanto para pruebas y entrenamiento.

Modelado a l e d n ó i c c e l Se e

Modelado a l e d n ó i c c e l Se e d a c i técn lado n ó e i d c o a m Gener prueba de la los para los mode Constr del mo ucción delado PASOS Evaluación modelado del

Modelado CONSTRUCCIÓN DEL MODELADO Verificar la existencia de la relación entre los propios registros

Modelado CONSTRUCCIÓN DEL MODELADO Verificar la existencia de la relación entre los propios registros de los procesos judiciales del año 2015 en materia de familia niñez y adolescencia. Desarrollar un modelo predictivo de la duración promedio de un juicio a través del análisis de patrones de los procesos judiciales del año 2015 en materia de familia niñez y adolescencia. 02 Objetivo 1 01 Determinar las tendencias de los procesos judiciales utilizando el historial de registros de los procesos judiciales del año 2015 en materia de familia niñez y adolescencia. 02 Objetivo 3

Objetivo 1 Verificar la existencia de la relación entre los propios registros de los

Objetivo 1 Verificar la existencia de la relación entre los propios registros de los procesos judiciales del año 2015 en materia de familia niñez y adolescencia. Los tipos de acción de mayor concentración son los de negrita. Se evidencia que a partir del mes de julio se incrementa la concentración de procesos judiciales.

Objetivo 2 Desarrollar un modelo predictivo de la duración promedio de un juicio a

Objetivo 2 Desarrollar un modelo predictivo de la duración promedio de un juicio a través del análisis de patrones de los procesos judiciales del año 2015 en materia de familia niñez y adolescencia. Modelo Lineal MAE = 7. 65 RMSE = 8. 48 MAE = 2. 51 RMSE = 3. 43 Modelo de Máquina de Soporte

Objetivo 3 Determinar las tendencias de los procesos judiciales utilizando el historial de registros

Objetivo 3 Determinar las tendencias de los procesos judiciales utilizando el historial de registros de los procesos judiciales del año 2015 en materia de familia niñez y adolescencia. MAE = 1742 RMSE = 1964 Modelo Lineal MAE = 899 RMSE = 1197 Modelo de Máquina de Soporte

Modelado a l e d n ó i c c e l Se e

Modelado a l e d n ó i c c e l Se e d a c i técn lado n ó e i d c o a m Gener prueba de la los para los mode Constr del mo ucción delado Evaluación modelado del PASOS

Evaluación Por lo tanto, el modelo seleccionado es SVM. En los modelos obtenidos se

Evaluación Por lo tanto, el modelo seleccionado es SVM. En los modelos obtenidos se observa que el SVM tiene un MAE Y RMSE mucho menor que el LM. Error absoluto Medio(MAE) Error Cuadrático Medio(RMSE) SVM LM Modelo 2 2. 52 7. 66 3. 44 8. 48 Modelo 3 899. 53 1742. 45 1197. 8 1964. 51

Modelado a l e d n ó i c c e l Se e

Modelado a l e d n ó i c c e l Se e d a c i técn lado n ó e i d c o a m Gener prueba de la los para los mode Constr del mo ucción delado Evaluación modelado del PASOS

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de los datos Modelado Evaluación Implantación 04 05 06

Implantación Ver más Tener un servidor a parte para el entrenamiento de los modelos.

Implantación Ver más Tener un servidor a parte para el entrenamiento de los modelos. Guardar el modelo entrenado. Tener instalado el programa R. Replica de las tablas. Realizar un aplicativo REST para llamar a los modelos de predicción.

Planear la Monitorización y Mantenimiento Replica BD transaccional 01 Detener análisis de R 03

Planear la Monitorización y Mantenimiento Replica BD transaccional 01 Detener análisis de R 03 Copias mensuales 02 04 Guardar predicciones

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de

Metodología CRISP-DM 01 Comprensión del negocio. 02 Comprensión de los datos 03 Preparación de los datos Modelado Evaluación Implantación 04 05 06

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

CONTENIDO Conclusiones Recomendaciones Metodología y 5 Introducción 1 Aspectos Generales 4 2 3 Solución

Conclusiones • La metodología CRISP-DM es una guía muy detallada que permite llevar el

Conclusiones • La metodología CRISP-DM es una guía muy detallada que permite llevar el control y alcanzar de los objetivos de la minería de datos. • El programa R es una herramienta estadística muy poderosa para la exploración y análisis de los datos. • Durante la exploración de datos se encontró una forma muy óptima de encontrar los datos atípicos que es mediante los diagramas de cajas. Ver más • La corrección de los datos atípicos permitió tener predicciones más acertadas a la realidad. • La limpieza de datos y selección de los mismos son de mucha importancia para las predicciones. • Los histogramas empleados para la exploración de los datos fueron de mucha utilidad para determinar el tiempo promedio de proceso judicial en la materia familia niñez y adolescencia.

Conclusiones • Se descubrió que los tipos de acciones con mayor demanda en la

Conclusiones • Se descubrió que los tipos de acciones con mayor demanda en la materia familia niñez y adolescencia son: contencioso general, deprecatorio, especial, ordinario y verbal sumario. • Se llegó a la conclusión que el modelo SVM es el que mayor se ajustó a nuestro análisis permitiendo ser seleccionado para las predicciones. • Se pudo determinar la tendencia de los procesos judiciales a través de los modelos SVM y LM en la materia familia niñez y adolescencia. • Se pudo determinar el tiempo promedio para la finalización de un proceso judicial en la materia familia niñez y adolescencia. • Durante la investigación se llegó a la conclusión que encontrar un modelo matemático para representar el comportamiento de la tendencia de los datos estaba muy alejado de la realidad. • Así mismo, también se observó que los meses que experimentan menor demanda son de enero hasta mayo del 2015 luego la demanda aumenta y se mantiene hasta finales de año. Ver más

Recomendaciones • Se aconseja que la persona que manipule los modelos debe ser capacitada

Recomendaciones • Se aconseja que la persona que manipule los modelos debe ser capacitada en el tema para evitar una mala interpretación del modelo. • Se recomienda utilizar una conexión directa a una copia de la base de datos o data warehouse debido al constante cambio de los datos o manipulación de la información. • Se recomienda ajustar los modelos en caso de ser necesario. • Se recomienda usar los modelos SVM para las predicciones porque son los más precisos. • Si se desea implementar este servicios para aplicativos web es necesario crear un servicio rest para el consumo del modelo. • Para examinar grandes cantidades de información en el orden de terabytes es necesario tener equipos con una gran cantidad de RAM y un enorme poder de procesamiento.

Referencias ü Barrientos, F. , & Ríos, S. (2013). Aplicación de minería de datos

Referencias ü Barrientos, F. , & Ríos, S. (2013). Aplicación de minería de datos para predecir fuga de clientes en la industria de las telecomunicaciones. ü Revista de Ingenieria de Sistemas, 75 -77. ü Barrios, M. (2010). Modelo del Negocio. Americana. ü Brito, P. (2010). Objetivos de Negocio y Procesos de Minería de Datos Basados en Sistemas Inteligentes. Argentina. ü C, S. (2000). el modelo CRISP-DM: el nuevo plan para la minería de datos. The Journal of Data Warehousing. ü CEI. (2010). Manual Básico para Elaborar Plan de Negocio para PYMEs. Nicaragua. ü F. , T. M. (2004). Estadística. Mexico: Pearson Educación. ü Fayyad, U. , & Haussler, D. S. (1996). Mining Scientific Data. Communications of the ACM, 51 -57. ü Fayyad, U. , Piatetsky-Shapiro, G. , Smyth, P. , & Uthurusamy, R. (1996). Advances in knowledge and data mining. Cambridge (Massachussets): AAAI/MIT Press. . ü Folgueiras Bertomeu, P. (2010). Métodos y técnicas de recogida y análisis de. Argentina: Universidad de Barcelona. ü Función Judicial. (12 de 03 de 2016). Obtenido de http: //www. funcionjudicial. gob. ec/index. php ü Función Judicial(Antecedentes). (13 de 03 de 2016). Obtenido de http: //www. funcionjudicial. gob. ec/www/pdf/informatica/PLANESTRATEGICOOPERATIVODNI-CJ. pdf ü Galán Cortina, V. (2015). APLICACIÓN DE LA METODOLOGÍA CRISP-DM A UN PROYECTO DE MINERÍA DE DATOS EN EL ENTORNO UNIVERSITARIO. Madrid: Escuela Politécnica Superior Ingeniería en Informática. ü Revista Judicial de Derecho. (13 de 03 de 2016). Obtenido de http: //www. derechoecuador. com/articulos/detalle/archive/doctrinas/funcionjudicial/2005/11/24/que-es-la-funcion- ü Rigeiro. (2012). Procesamiento y análisis de los Datos. ü Rodas, J. (2001). Un Ejercicio de análisis utilizando rough sets en un dominio de educación superior mediante el proceso KDD. ü Barcelona: Departamento de Lenjuages y Sistemas Informáticos, Universidad Politécnica de Cataluña. judicial

Referencias ü Rojas, D. O. (2010). Metodología para el Desarrollo de Proyectos en Minería

Referencias ü Rojas, D. O. (2010). Metodología para el Desarrollo de Proyectos en Minería de Datos CRISP-DM. Costa Rica. ü Rokach, L. , & Maimon, O. (2008). Data mining with decision trees: theory and applications. World Scientific. ü Romeau Guallart, P. (2010). Minería de Datos Aplicada Al Análisis del Tratamiento Informativo de la Drogadicción. Moncada: CEU ü Gommez Díaz, H. , & Cerón Reyes, M. d. (2010). Minería de datos. ü Grossman, R. L. , Hornik, M. , & G. , M. (2012). Data mining standars initiatives. Communications of ACM, 59 -61. ü IBM. (2012). Manual CRISP-DM de. IBM SPSS Modeler. Estados Unidos. ü José Hernández Orallo, M. J. (2004). Introducción a la Minería de Datos. Ed. Pearson Educación. ü K-Means, s. f. (16 de 04 de 2016). Obtenido de wikipedia: https: //es. wikipedia. org/wiki/K-means ü Llavona Arregui, J. L. (2010). Terminología de Estadística y Minería de Datos en Lengua Inglesa. Madrid, España: ISBN. ü Moine, J. M. , Haedo, A. S. , & & Gordillo, S. (2012). Estudio Corporativo de los Datos. Argentina: UTN Rosario. ü Molero Castillo, G. G. (2008). Desarrollo de un Modelo basado en técnicas de Minería de Datos para clasificar zona climatológicamente similares en el estado de Michoacán. México: Universidad Nacional Autónoma de México. ü Moral Peláez, I. (2012). Modelos de regresión: Llineal Simple y Regresión Logogística. España. ü Peralta Cochancela, D. E. (2009). Proyecto de Minería de Datos para el Annálisis del Comportamiento de los Clientes de Telecomunicaciones. Cuenca: Universidad Politecnica Salesiana Sede Cuenca. ü Pete Chapman, J. C. (2000). CRISP-DM 1. 0, Step-by-step Data Mining Guide. ü Red Neuronal, s. f. (16 de 05 de 2016). Obtenido de wikipedia: https: //es. wikipedia. org/wiki/Red_neuronal ü Reglas de Asociación, s. f. (12 de 04 de 2016). Obtenido de wikipedia: https: //es. wikipedia. org/wiki/Reglas_de_asociaci%C 3%B 3 n ü Regresión Lineal, s. f. (20 de 05 de 2016). Obtenido de wikipedia: https: //es. wikipedia. org/wiki/An%C 3%A 1 lisis_de_la_regresi%C 3%B 3 n

Gracias Excelente día

Gracias Excelente día