SISTEMAS DE INFORMACIN MDULO DE TECNOLOGA DE INFORMACIN

  • Slides: 123
Download presentation
SISTEMAS DE INFORMACIÓN MÓDULO DE TECNOLOGÍA DE INFORMACIÓN (TI)

SISTEMAS DE INFORMACIÓN MÓDULO DE TECNOLOGÍA DE INFORMACIÓN (TI)

SISTEMAS DE INFORMACION ( SI ) BASES DE DATOS TECNOLOGIA DE INFORMACION ( TI

SISTEMAS DE INFORMACION ( SI ) BASES DE DATOS TECNOLOGIA DE INFORMACION ( TI ) HARDWARE SOFTWARE COMUNICACIONES

Tecnología de Información CAPITULO 6°: ADMINISTRACIÓN DE DATOS MBA SERGIO ORTEGA Material revisado para

Tecnología de Información CAPITULO 6°: ADMINISTRACIÓN DE DATOS MBA SERGIO ORTEGA Material revisado para la cursada 2009

CAPITULO 6°: ADMINISTRACIÓN DE DATOS • 6. 1. Almacenamientos externos en general: conceptos básicos;

CAPITULO 6°: ADMINISTRACIÓN DE DATOS • 6. 1. Almacenamientos externos en general: conceptos básicos; técnicas de organización; aspectos físicos y lógicos. • 6. 2. Bases de datos: conceptos básicos; clasificaciones; aspectos físicos y lógicos; principales componentes. Ventajas y aportes a las necesidades de los procesos de negocios. • 6. 3. Nuevas arquitecturas de bases de datos. Evolución. Bases multidimensionales. De Objetos. Bases de datos en la web. • 6. 4. Manejo de datos. Lenguajes de definición y consulta. • 6. 5. Estructuras lógicas de datos. Técnicas de formalización: diagramas de entidad relación (DER); esquemas; diccionarios de datos. • 6. 6. Aportes a la administración del conocimiento. Tendencias. • 6. 7. Técnicas de resguardo y seguridad en archivos tradicionales y en bases de datos.

BIBLIOGRAFIA • Básica: Laudon & Laudon, Sistemas de Información Gerencial. Organización y tecnología de

BIBLIOGRAFIA • Básica: Laudon & Laudon, Sistemas de Información Gerencial. Organización y tecnología de la empresa conectada en red. Sexta Edición. Prentice Hall, México 2002. – Capítulo 8: pág. 226/256 Laudon & Laudon, Sistemas de Información Gerencial. Administración de la Empresa Digital. Octava Edición. Prentice Hall, México 2004. – Capítulo 7: pág. 218/247 • Apunte de Cátedra: .

- Conceptos

- Conceptos

Dato e Información • Dato: Codificación cualitativa y/o cuantitativa de un hecho. • Información:

Dato e Información • Dato: Codificación cualitativa y/o cuantitativa de un hecho. • Información: Resultado de procesar datos mediante algoritmos lógico-matemáticos. • Proceso de Datos: Secuencia de operaciones matemáticas (algoritmo) a la que se someten los datos para transformarlos en información. • Algoritmo: Secuencia definida, ordenada y finita de operaciones que permite hallar la solución a un problema.

Ej. de Dato: La presencia o ausencia de un alumno en la clase(i)

Ej. de Dato: La presencia o ausencia de un alumno en la clase(i)

Ej. de Información: Porcentaje de asistencia de cada alumno(i) Algoritmo: Tomar un alumno y

Ej. de Información: Porcentaje de asistencia de cada alumno(i) Algoritmo: Tomar un alumno y contar las clases en que estuvo presente y dividir el resultado por la cantidad de clases dictadas y multiplicar el resultado por 100

Ej. de Información: Porcentaje de asistencia de en clase(i) Algoritmo: Tomar alumno por alumno

Ej. de Información: Porcentaje de asistencia de en clase(i) Algoritmo: Tomar alumno por alumno y contar clase por clase si estuvo presente. Luego dividir el resultado de cada clase por la cantidad de alumnos del curso y multiplicar ese resultado por 100

Proceso administrativo de tratamiento de datos 1. Captura de datos: • • Medición del

Proceso administrativo de tratamiento de datos 1. Captura de datos: • • Medición del hecho, evento o transacción Codificación cualitativa y*o cuantitativa Registración (analógica o digital) Almacenamiento en soportes primarios o secundarios 2. Recuperación de información: • • • Selección de un conjunto de datos almacenados Procesamiento bajo la lógica de algún algoritmo Presentación (reporte gráfico y/o escrito)

Soportes de almacenamiento de datos • Primarios: Medios naturales de registro escrito manual o

Soportes de almacenamiento de datos • Primarios: Medios naturales de registro escrito manual o mecanizado en: – comprobantes, – documentos, – planillas, etc. • Secundarios: Medios artificiales de registro mediante dispositivos tecnológicos especializados (hardware) – discos magnéticos u ópticos, – cintas magnéticas – memorias, etc. organizados en forma de archivos o bases de datos

Archivos de almacenamiento de datos Agrupación de registros homogéneos, dónde: • Registro: es una

Archivos de almacenamiento de datos Agrupación de registros homogéneos, dónde: • Registro: es una agrupación de campos • Campo: es una agrupación de caracteres (también conocido como ficheros) Los que pueden ser accedidos de forma: • Secuencial: Recorrido de los registros uno tras otro y en el orden físico en el que están guardados, hasta encontrar el buscado. • Secuencial indizado: Recorrido secuencial de un índice que almacena la dirección (o una sección) en la que se encuentra el registro buscado. Ej: en una guía telefónica, índice de localidad y apellidos desde/hasta • Directo: acceso a un registro determinado sin necesidad de recorridos.

Archivos de almacenamiento de datos Archivo o Fichero: Conjunto de registros Registro: Conjunto de

Archivos de almacenamiento de datos Archivo o Fichero: Conjunto de registros Registro: Conjunto de campos Campo: Conjunto de caracteres

Archivos de almacenamiento de datos Ambiente Tradicional Software Hardware SIST. OPERATIVO SIST. APLICACION ARCH.

Archivos de almacenamiento de datos Ambiente Tradicional Software Hardware SIST. OPERATIVO SIST. APLICACION ARCH. DE DATOS

Archivos de almacenamiento de datos Organización Tradicional Sistema de Ventas Sistema de Producción Sistema

Archivos de almacenamiento de datos Organización Tradicional Sistema de Ventas Sistema de Producción Sistema de Administr. Sistema de Almacenes Arch. de Ventas Arch. de Producción Arch. de Administr. Arch. de Almacenes

Archivos de almacenamiento de datos Problemas • Redundancia: Datos repetidos en diferentes ficheros •

Archivos de almacenamiento de datos Problemas • Redundancia: Datos repetidos en diferentes ficheros • Inconsistencia: Datos incoherentes con su significado (por ej. Fecha) • Incongruencia: Datos relacionados incompletos (registrar asistencia de alumnos no matriculados) • Inaccesibilidad: Construcción de programas para visualizar datos • Fragmentación: Almacenamiento datos relacionados en múltiples ficheros (ej: cabecera de factura y renglones) • Atomicidad de actualización: Ficheros parcialmente actualizados ante fallos (ej cabecera de factura y renglones) • Concurrencia: Accesos simultáneos de varios usuarios requiere implementar bloqueos frente a acciones de grabación y borrado • Seguridad: No provee un esquema de perfiles de usuarios en el que pueda predefinirse los permisos de acción sobre los ficheros.

- Bases de Datos

- Bases de Datos

Base de Datos Definición de James Martin Colección de datos interrelacionados almacenados sin redundancias

Base de Datos Definición de James Martin Colección de datos interrelacionados almacenados sin redundancias perjudiciales o innecesarias, su finalidad es servir a una aplicación o más, de la mejor manera posible; los datos se almacenan de modo que resulten independientes de los programas que los usan; se emplean métodos bien determinados para incluir datos nuevos y para modificar o extraer los datos almacenados

Base de Datos Ambiente Actual Software SIST. OPERATIVO D B M S SIST. APLICACION

Base de Datos Ambiente Actual Software SIST. OPERATIVO D B M S SIST. APLICACION Hardware BASE DE DATOS

Base de Datos Organización Actual Sistema de Ventas Sistema de Producción Sistema de Administr.

Base de Datos Organización Actual Sistema de Ventas Sistema de Producción Sistema de Administr. Sistema de Almacenes Sistema de Administración de Bases de Datos (DBMS) BASE DE DATOS

Base de Datos Problemas que intenta solucionar • Almacenar datos y las relaciones de

Base de Datos Problemas que intenta solucionar • Almacenar datos y las relaciones de estos con otros datos • Almacenar los datos una sola vez de forma independiente a su tratamiento • Ofrecer recursos para mantener la integridad de los datos que se almacenan

Base de Datos Sistema de Administración de Bases de Datos Es una colección de

Base de Datos Sistema de Administración de Bases de Datos Es una colección de programas que facilitan los procesos de definición (arquitectura) y manipulación de archivos (tablas) relacionados, grabando, eliminando, modificando, visualizando y extrayendo datos de ellos.

Historia de Bases de Datos • A comienzos del 60 se observan los primeros

Historia de Bases de Datos • A comienzos del 60 se observan los primeros intentos de construir un Sistema de Administración de Almacenamiento de Datos con el propósito de que los maneje de manera clara, sencilla y ordenada, para que posteriormente se conviertan en información relevante. • Para poder construir un Sistema de Administración de Bases de Datos se necesita primero concebir un Modelo. • La evolución de los modelos iniciales son: – Jerárquico – Red – Relacional

Modelos de Base de Datos Modelo Jerárquico: Se dice que comienza a mediados de

Modelos de Base de Datos Modelo Jerárquico: Se dice que comienza a mediados de los 60 con el proyecto Apolo (hombre a la luna), para gestionar la inmensa cantidad de datos que requería el mismo. La encargada NAA (North American Aviation), desarrolló el software GUAM (General Update Access Method) basado en el concepto árbol, para poder unir varias piezas pequeñas en una pieza más grande, y así sucesivamente hasta ensamblar el producto final. A mediados de los 60, NAA se une con IBM para perfeccionar a GUAM en el conocido software IMS (Information Management System). Almacena datos enlazando (con direcciones físicas) los registros (nodos) en forma de árbol donde un nodo padre de datos puede tener varios nodos hijos.

Modelos de Base de Datos Modelo Red: A mediados de los 60 General Electric

Modelos de Base de Datos Modelo Red: A mediados de los 60 General Electric desarrolló IDS (Integrated Data Store, dirigido por uno de los pioneros en los sistemas de bases de datos, Charles Bachmann, para satisfacer la necesidad de representar relaciones entre datos, más complejas de las que se podían modelar con los sistemas jerárquicos y en parte, para imponer un estándar de bases de datos. A tal fin CODASYL (Conference on Data Systems Languages), integrado por representantes del gobierno de EEUU y de las empresas, formaron al grupo DBTG (Data Base Task Group), con el objetivo de definir las especificaciones estándar que permitieran la creación de bases de datos y el manejo de los mismos. En 1971 se presentó el informe final, aunque éste no fue formalmente aceptado por ANSI (American National Standards Institute). Almacena datos enlazando (con direcciones físicas) los registros (nodos) en forma de árbol donde un nodo padre de datos puede tener varios nodos hijos y un nodo hijo puede tener varios nodos padres.

Modelos de Base de Datos Modelo Relacional: Desarrollo de comienzos del 70 por Edgar

Modelos de Base de Datos Modelo Relacional: Desarrollo de comienzos del 70 por Edgar F. Codd para IBM, que concitó rápidamente la atención de los medios académicos, basado en la teoría matemática de conjuntos y consta de las siguientes características: Representación tabular: simple y fácil de implementar. Normalización: conjunto de restricciones evitan almacenar datos redundantes. Operadores poderosos: Manipulación de datos con el concepto del Algebra y Cálculo Relacional. Almacena datos en tablas enlazando (lógicamente) los registros entre tablas a través de un mismo atributo de enlace que se repiten en ambas tablas

- Modelo Relacional

- Modelo Relacional

Modelo Relacional de Base de Datos Tabla (Relación): Conjunto de objetos, hechos o conceptos

Modelo Relacional de Base de Datos Tabla (Relación): Conjunto de objetos, hechos o conceptos almacenados en filas (Tuplas) Fila (Tupla): Conjunto de columnas (atributos) de un objeto, hecho o concepto Columna (Atributo): Característica de un objeto, hecho o concepto. Se clasifican en: • Identificativos (clave única que no se repite nunca. Ej: DNI) • Descriptivos (Ej: Apellido y Nombre, Dirección, … ect. ) Dominio: Universo de posibles valores que puede adoptar un atributo (Ej: Estado Civil: {Soltero, Casado, Viudo, Separado, Divorciado}) Estructura de Tabla: Conjunto de descripciones que definen los tipos de datos en el que se almacenaran los valores heterogéneos de atributos

Modelo Relacional de Base de Datos Estructura de Tabla

Modelo Relacional de Base de Datos Estructura de Tabla

Modelo Relacional de Base de Datos • Normalización: Proceso de análisis de la naturaleza

Modelo Relacional de Base de Datos • Normalización: Proceso de análisis de la naturaleza de los atributos y de las relaciones entre ellos para determinar en que tabla se almacena cada uno de ellos para evitar redundancias. – Codd propuso 3 reglas iniciales – Luego distintos investigadores del modelo aportaron 4 reglas más • Arquitectura de Base de Datos (Esquema): Conjunto de tablas (relaciones) resultantes de aplicar las reglas del análisis de normalización • Vista: Tabla virtual que se genera con la extracción de atributos de varias tablas

Modelo Relacional de Base de Datos Normalización Primera Regla Normal: Identifica la existencia de

Modelo Relacional de Base de Datos Normalización Primera Regla Normal: Identifica la existencia de atributos para los diferentes objetos, hechos o conceptos desde 0 a n y se los separa en otra tabla (EJ: Objeto Empleado con Atributos Hijos se crean dos tablas Empleados e Hijos de Empleados)

Modelo Relacional de Base de Datos Normalización Segunda Regla Normal: Identifica la existencia de

Modelo Relacional de Base de Datos Normalización Segunda Regla Normal: Identifica la existencia de atributos de un objeto, hecho o concepto que se asocian a otros que a su vez están relacionados entre sí. (EJ: Hecho Factura y Atributos Productos se crean dos tablas Renglones de Facturas y Lista de Productos)

Modelo Relacional de Base de Datos Normalización Tercera Regla Normal: Identifica existencia de atributos

Modelo Relacional de Base de Datos Normalización Tercera Regla Normal: Identifica existencia de atributos de un objeto, hecho o concepto que se referencian con otros que a su vez están relacionados entre sí. (EJ: Objeto Empleado y Atributos Localidad se crean dos tablas Empleados y Localidades)

Modelo Relacional de Base de Datos • Los desarrollos de DBMS´s con los modelo

Modelo Relacional de Base de Datos • Los desarrollos de DBMS´s con los modelo Jerárquico y Red provocaban errores de funcionamiento frente a la necesidad de empleo de mecanismos complejos para vincular registros mediante direcciones físicas. • El modelo Relacional permitió desarrollar DBMS´s exitosos porque se vinculaban lógicamente registros de diferentes tablas, mediante la utilización de los mecanismos de almacenamientos conocidos. • Estas vinculaciones lógicas, permiten estructurar datos tanto en jerarquías como en redes.

Modelo Relacional de Base de Datos Ventajas: Facilidad con el que se pueden diseñar

Modelo Relacional de Base de Datos Ventajas: Facilidad con el que se pueden diseñar Tablas para almacenar datos eliminando redundancias Desventajas: Complicación en la manipulación de Tablas cuando una aplicación posee demasiadas de ellas

- DBMS

- DBMS

Sistema de Administración de Bases de Datos (DBMS) Colección de programas que facilitan los

Sistema de Administración de Bases de Datos (DBMS) Colección de programas que facilitan los procesos de definición (arquitectura) y manipulación de archivos (tablas) relacionados, grabando, eliminando, modificando, visualizando y extrayendo datos de ellos.

Estructura de un DBMS Relacional Hardware Administrador de Base de Datos Desarrollador de Aplicaciones

Estructura de un DBMS Relacional Hardware Administrador de Base de Datos Desarrollador de Aplicaciones Software DBMS Interprete DDL Interprete PL Trigger Usuario de Aplicaciones Usuario Casual SISTEMA OPERATIVO Procesador PL Interprete SQL Gestor de BD Administrador de Archivos de Datos Archivos de Diccionario de Datos

Servicios de un DBMS Relacional • • • PL: Lenguaje de Procedimientos DDL: Lenguaje

Servicios de un DBMS Relacional • • • PL: Lenguaje de Procedimientos DDL: Lenguaje de Descripción de Datos SQL: Lenguaje de Consultas Trigger: Procedimientos Almacenados ODBC: Conexión Abierta a Bases de Datos Arquitectura Cliente – Servidor

Servicios de un DBMS Relacional PL: Lenguaje de Procedimientos Se utiliza para redactar la

Servicios de un DBMS Relacional PL: Lenguaje de Procedimientos Se utiliza para redactar la lógica de los procesos a ejecutarse (interfaces de aplicaciones): • para almacenar datos en la base de datos a partir de las entradas de datos • para extraer los datos de las mismas, procesarlos y generar reportes.

Servicios de un DBMS Relacional DDL: Lenguaje de descripción de datos Se utiliza para

Servicios de un DBMS Relacional DDL: Lenguaje de descripción de datos Se utiliza para definir todos los atributos y las propiedades de cada tabla, especialmente: – diseños de fila, – definiciones de columna, – columnas de clave (y, a veces, metodología de claves), – ubicaciones de archivos y – estrategia de almacenamiento.

Servicios de un DBMS Relacional SQL: Lenguaje Estructurado de Consultas Se utiliza para efectuar

Servicios de un DBMS Relacional SQL: Lenguaje Estructurado de Consultas Se utiliza para efectuar y programar consultas a las bases de datos combinando los datos de las diferentes tablas. Es una evolución del lenguaje SEQUEL de D. D. Chamberlin y R. F. Boyce (1974) implementado por primera vez por IBM en su Base de Datos Relacional System R. Versiones: SQL 1 o SQL 86: Estandarizada en 1986 por ISO (International Standards Organization) y ANSI (American National Standards Institute). SQL 2 o SQL– 92 SQL 3: Incluye conceptos de orientación a objetos.

Servicios de un DBMS Relacional Trigger: Disparador de procedimientos almacenados Conjunto de comandos y

Servicios de un DBMS Relacional Trigger: Disparador de procedimientos almacenados Conjunto de comandos y o funciones permitidas que el usuario define para que éstas se ejecuten cuando se cumpla una condición establecida al realizar una operación de inserción, actualización o borrado de datos.

Servicios de un DBMS Relacional ODBC: Conectividad Abierta de Bases de Datos • Interfaz

Servicios de un DBMS Relacional ODBC: Conectividad Abierta de Bases de Datos • Interfaz de programación de aplicaciones (API) de Microsoft. • Define un conjunto estándar de rutinas con las que una aplicación puede tener acceso a datos de orígenes remotos. • Drivers intermediario que facilita la comunicación entre DBMS de diseño y de gestión de recursos de forma diferente.

Servicios de un DBMS Relacional Arquitectura Cliente – Servidor Sistema de dos estratos dónde:

Servicios de un DBMS Relacional Arquitectura Cliente – Servidor Sistema de dos estratos dónde: • el puesto cliente ejecuta una aplicación en un equipo local que envía peticiones de acciones sobre datos a un puesto servidor • el puesto servidor ejecuta un DBMS que recibe peticiones sobre datos de varios puestos clientes y las procesa

Actores con los DBMS Relacional • Administradores de Bases de Datos: Tiene conocimiento de

Actores con los DBMS Relacional • Administradores de Bases de Datos: Tiene conocimiento de las necesidades de información de la organización, para lo que: – – Diseña una Arquitectura de Base de Datos apropiada Asigna derechos de acceso a los usuarios Realiza especificaciones de integridad de datos Planifica las modificaciones y/o cambios a la Arquitectura • Usuarios de Bases de Datos – Programadores de Aplicaciones: Construyen interfaces para almacenar datos y para generar informes rutinarios – Usuarios de las Aplicaciones: Utilizan interfaces programadas para ingresar datos y generar reportes de rutina – Usuarios Especiales: Realizan consultas no previstas mediante una interfaz especial que provee el DBMS

- Tendencias de los DBMS

- Tendencias de los DBMS

Fortalezas generadoras de ventajas competitivas de los DBMS • • • Seguridad y Auditoría

Fortalezas generadoras de ventajas competitivas de los DBMS • • • Seguridad y Auditoría Confiabilidad Distribución Performance Datos Distribuídos Tecnología de Objetos Backups Data Warehousing Bases Documentales Consultas Difusas

DBMS: Seguridad y Auditoría • Seguridad: privilegios a nivel usuario y grupo • Facilidades

DBMS: Seguridad y Auditoría • Seguridad: privilegios a nivel usuario y grupo • Facilidades de Auditoria: – Registro de las acciones realizadas por los usuarios sobre los objetos para realizar seguimiento – Máscaras de auditoría (generales o por usuario) que definen los eventos a auditar – Separación de roles de administración _require _exclude usuario Registros _default _user masks de Audit File o Event Log

DBMS: Confiabilidad Alta Disponibilidad En servicio En espera Motor 1 Motor 2 mirroring Log

DBMS: Confiabilidad Alta Disponibilidad En servicio En espera Motor 1 Motor 2 mirroring Log 1 Data Set 1, 2 Log 2 Data Set 3, 4 FAIL OVER Fuera de servicio Motor 1 Log 1 Data Set 1, 2 En servicio Motor 2 Log 2 Data Set 3, 4 Espejado (mirroring) / Replicación Tecnología que permite configurar dos servidores de Bases de Datos uno principal en servicio y otro secundario de resguardo en espera (stand by). Ambos actualizan los datos simultáneamente, y en caso de que el principal falle (failover) se produce una permutación automática asumiendo la responsabilidad de servicio el segundo servidor, quedando el primero fuera de servicio hasta su reparación.

DBMS: Distribución Servicio de administración de envíos de datos mediante una arquitectura publicación –

DBMS: Distribución Servicio de administración de envíos de datos mediante una arquitectura publicación – suscripción, a través de definiciones de publicitantes y suscriptores. Casa Central Administración centralizada y automatizada ACA Enterprise Replication

DBMS: Performance Escalabilidad Capacidad desarrollada a un mismo motor de base de datos para

DBMS: Performance Escalabilidad Capacidad desarrollada a un mismo motor de base de datos para que Massively Parallel funcione y se conecte con distintas configuraciones de sistemas Cluster operativos y plataformas de hardware SMP Workgroups Desktops u. Advance Decision u. Extended Parallel u u Workgroup Developer u. Advance Decision u. Universal Data Support

DBMS: Bases de Datos Distribuidas (BDD) Sucursal 1 RED Sucursal 3 Sucursal 2 Sucursal

DBMS: Bases de Datos Distribuidas (BDD) Sucursal 1 RED Sucursal 3 Sucursal 2 Sucursal N Conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones.

DBMS: Objetos • Ofrece facilidades para que el usuario pueda crear sus propios tipos

DBMS: Objetos • Ofrece facilidades para que el usuario pueda crear sus propios tipos de datos y los métodos de tratamiento de los mismos • Pueden existir dos tipos de DBMS – Relacional con Orientación a Objetos – Orientado a Objeto Puro

DBMS: Data Warehouse • Almacén de datos donde se copian las transacciones de la

DBMS: Data Warehouse • Almacén de datos donde se copian las transacciones de la Base de Datos Transaccional, con una estructura orientada a la toma de decisiones o para el análisis de datos

DBMS: Duplicaciones y Restauraciones • Componentes de duplicación preventiva de datos a otros medios

DBMS: Duplicaciones y Restauraciones • Componentes de duplicación preventiva de datos a otros medios de resguardo; y restauración de los mismos ante fallas o destrucción del soporte de almacenamiento principal en línea. • Tipos de duplicaciones: – COMPLETO: Copia todos las tablas seleccionados. – INCREMENTAL: Copia sólo las tablas que han cambiado desde la primer copia COMPLETA realizada. – DIFERENCIAL: Copia sólo las tablas que han cambiado desde la última copia DIFERENCIAL realizada.

DBMS: Duplicaciones y Restauraciones COMPLETO

DBMS: Duplicaciones y Restauraciones COMPLETO

DBMS: Duplicaciones y Restauraciones DIFERENCIAL

DBMS: Duplicaciones y Restauraciones DIFERENCIAL

DBMS: Duplicaciones y Restauraciones INCREMENTAL

DBMS: Duplicaciones y Restauraciones INCREMENTAL

DBMS: Documentales Según el contenido se clasifican: • Texto completo: permiten el acceso al

DBMS: Documentales Según el contenido se clasifican: • Texto completo: permiten el acceso al propio documento en formato electrónico • Referenciales: Sólo contienen la información fundamental para describir y permitir la localización de los documentos, impresos o electrónicos Según la cobertura temática se clasifican: • Multidisciplinares: cobertura temática amplia, abarcan varias disciplinas o áreas temáticas. • Especializadas: recogen información de un área temática concreta.

DBMS: Consultas Difusas • Fuzzy SQL: Extensión del SQL que permite el tratamiento difuso

DBMS: Consultas Difusas • Fuzzy SQL: Extensión del SQL que permite el tratamiento difuso usando la lógica creada por Lofti A. Zadeh. • Las ventajas más importantes son las de: – Realizar consultas con Condiciones Difusas: Provee más respuestas que las consultas clásicas, puesto que éstas suelen ser demasiado restrictivas. – Obtener Resultados Difusos: Por cada elemento recuperado, se consigue una medida de cumplimiento sobre las condiciones establecidas, como: • no cumple estrictamente las condiciones impuestas en la consulta • cumple dichas condiciones de forma parcial

- Desarrollo de Software Sistemas de Aplicación

- Desarrollo de Software Sistemas de Aplicación

¿Comprar o Desarrollar? Analisis de Necesidades Diseño del Requerimiento ¿Comprar o Desarrollar? Adquisición del

¿Comprar o Desarrollar? Analisis de Necesidades Diseño del Requerimiento ¿Comprar o Desarrollar? Adquisición del Construcción del Sistema PROYECTO Prueba Instalación Entrega

Actividades en el Desarrollo de Sistemas Externas: Clientes y Proveedores De Transición: • Nuevos

Actividades en el Desarrollo de Sistemas Externas: Clientes y Proveedores De Transición: • Nuevos Procedimientos • Beneficios para la Empresa • Instalación Física Internas: • Roles y Responsabilidades • Personas y Habilidades • Entorno, Cultura y Estilo Especificación “del negocio” Inicio del Proyecto Especificación “del sistema” Análisis de las Necesidades Revisiones Trabajos Técnicos • Diseño técnico • Construcción del Sistema • Integración y verificación Actividades del Negocio Empresa en Marcha Pruebas de Validez Entrega del Sistema Actividades Probado Técnicas

Desarrollo de Software Sistemas de Aplicación Para producir Sistemas de Aplicación hay que tener:

Desarrollo de Software Sistemas de Aplicación Para producir Sistemas de Aplicación hay que tener: – Metodología: Secuencia de etapas y actividades que a llevar a delante por uno o varios actores. – Herramientas y Técnicas: Recursos reales o conceptuales para desarrollar las tareas de cada etapa y obtener el resultado esperado Existen varias metodologías como resultado de la evolución de la experiencia

Desarrollo de Software Sistemas de Aplicación Metodología clásica o tradicional Etapa Herramientas / Técnicas

Desarrollo de Software Sistemas de Aplicación Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas Entrevistas - Cuestionarios Análisis de Sistemas Diagrama de Flujo de Datos Diseño de Sistemas Modelo Entidad-Relación Producción Prueba Puesta en marcha Mantenimiento

Análisis de Sistemas • Análisis: Distinción y separación de las partes de un todo

Análisis de Sistemas • Análisis: Distinción y separación de las partes de un todo hasta llegar a conocer sus principios o elementos. Puede representase mediante un Modelo. • Modelo: Esquema teórico que representa los aspectos esenciales de una realidad compleja para facilitar su comprensión y estudio de acuerdo a ciertos criterios. Es necesariamente una simplificación de la realidad.

Análisis de Sistemas Ambiente Sistema Modelo Contextual Modelo de Comportamiento

Análisis de Sistemas Ambiente Sistema Modelo Contextual Modelo de Comportamiento

Análisis Estructurado de Sistemas • Técnica de modelación gráfica que describe una visión lógica

Análisis Estructurado de Sistemas • Técnica de modelación gráfica que describe una visión lógica de un Sistema para que el usuario pueda conocer las características antes de su implementación. • Utiliza un método efectivo de partición (división – separación). • Una herramienta conocida (entre otras) es el Diagrama de Flujo de Datos (versión de Chris Gane y Chris Searson, versión de Yourdon y versión de De Marco)

Diagramas de Flujo de Datos (DFD) • Técnica de Análisis Estructurado. • Grafica el

Diagramas de Flujo de Datos (DFD) • Técnica de Análisis Estructurado. • Grafica el flujo de datos que ocurre dentro de un Sistema, sin considerar aspectos físicos ni flujos de control (no hay iteraciones) • Se centra en el estudio de los procesos de transformación de datos que realizan los sistemas.

Diagramas de Flujo de Datos (DFD) Símbolos Entidad Externa Flujo de datos Proceso Almacén

Diagramas de Flujo de Datos (DFD) Símbolos Entidad Externa Flujo de datos Proceso Almacén de datos Versión de Chris Gane & Chris Searson

Convenciones en los DFD Entidad Externa • Representa un conjunto de actores del medio

Convenciones en los DFD Entidad Externa • Representa un conjunto de actores del medio ambiente a los que se le dan y/o de los que se recibe (fuente o destino de datos). • Debe nombrarse con una descripción de sujeto que la identifique. • Por Ej. : Banco, Proveedor, Estado, Cliente, Alumno, etc. Entidad: Colectividad considerada como unidad que se trata de la misma manera

Convenciones en los DFD Flujo de datos Entre una Entidad y un Proceso: •

Convenciones en los DFD Flujo de datos Entre una Entidad y un Proceso: • Representa el movimiento de datos de un punto (origen) hacia otro (destino). • Debe nombrarse en singular representando al conjunto de datos que fluye (nunca nombres iguales) Entre un Proceso y un Archivo: • Representa el conjunto de datos que debe almacenarse o que debe recuperarse. • No se los nombra

Convenciones en los DFD Proceso • Representa una transformación de flujos de datos entrantes

Convenciones en los DFD Proceso • Representa una transformación de flujos de datos entrantes en flujos de datos salientes • Debe existir al menos una entrada y una salida • Debe nombrarse representativamente a las tareas a realizar • Por Ej. : Para el proceso de emisión de nómina de alumnos inscritos en un curso • Nombre bueno: Emitir nómina de inscritos del curso • Nombre malo: Generación de listado alumnos

Convenciones en los DFD Almacén de datos • Indica un depósito de datos en

Convenciones en los DFD Almacén de datos • Indica un depósito de datos en el que se agregan y se acceden • Debe nombrarse de forma representativa al conjunto de datos o clase, y debe estar en plural y no estar codificado • No contiene ninguna especificación física de la implementación del almacenamiento

Descomposición Jerárquica en DFD • Cada DFD se puede descomponerse a su vez en

Descomposición Jerárquica en DFD • Cada DFD se puede descomponerse a su vez en varios DFDs uno por cada proceso • Según el grado de detalle se definen • DFD de contexto • DFD de descomposición

DFD de Contexto Flujo Datos 1 Entidad A Flujo Datos 4 Flujo Datos 2

DFD de Contexto Flujo Datos 1 Entidad A Flujo Datos 4 Flujo Datos 2 SI Entidad B Flujo Datos 3 Es la primera aproximación al análisis de un sistema, nos entrega una visión general y básica del SI (como caja negra) y sus interrelaciones con el contexto. Consiste en: 1. Identificar entidades externas 2. Identificar hechos, eventos, transacciones, peticiones/respuestas por cada entidad

DFD 1º descomposición SI Flujo Datos 1 Proceso 2 Flujo Datos 2 Tabla 1

DFD 1º descomposición SI Flujo Datos 1 Proceso 2 Flujo Datos 2 Tabla 1 Entidad B Tabla 2 Entidad A Tabla 3 Flujo Datos 4 Proceso 3 Flujo Datos 3 Cada proceso debe ser analizado para determinar los datos que transforma

Diccionario de Datos (DD) • • • Describe la composición de los paquetes de

Diccionario de Datos (DD) • • • Describe la composición de los paquetes de datos a almacenar. Especifica los valores de las unidades de información en los flujos de datos y en los almacenes de datos. Se implementa por una notación específica universal (metadato). Metadato: No tiene definición única. La más difundida de es que son «datos sobre los datos» .

Desarrollo de Software Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas

Desarrollo de Software Metodología clásica o tradicional Etapa Herramientas / Técnicas Estudio de Sistemas Entrevistas - Cuestionarios Análisis de Sistemas Diagrama de Flujo de Datos Diseño de Sistemas Modelo Entidad-Relación Producción Prueba Puesta en marcha Mantenimiento

Diseño de Sistemas • Diseño de Arquitectura de Base de Datos • Diseño de

Diseño de Sistemas • Diseño de Arquitectura de Base de Datos • Diseño de Arquitectura de Software de Aplicación y de las interfaces en función de los roles de los usuarios

Diseño de Bases de Datos Se descompone en tres Modelos: • diseño lógico (externo):

Diseño de Bases de Datos Se descompone en tres Modelos: • diseño lógico (externo): Vista parcial de datos de interés para un Vista 1 sector a través de las aplicaciones. • diseño conceptual: Arquitectura de toda la base de datos para una comunidad de usuarios, en la que se ocultan los detalles físicos de almacenamiento. • diseño físico (interno): Estructura física de almacenamiento de la base de datos. Vista 2 Vista n Nivel conceptual Nivel físico Propuesta del comité ANSI-SPARC en 1975 ANSI (American National Standard Institute) SPARC (Standards Planning and Requirements Committee)

Diseño de Bases de Datos Objetivo: Separar los programas de aplicación de la base

Diseño de Bases de Datos Objetivo: Separar los programas de aplicación de la base de datos física. Nivel Físico Nivel Conceptual Almacenamiento Físico Definen dos tipos de independencia: Vista n Interfaz n Vista 2 Interfaz 2 Vista 1 Interfaz 1 Lógica: Capacidad de modificar el esquema conceptual sin tener que alterar los esquemas externo e interno. Física: Capacidad de modificar el esquema interno sin tener que alterar los esquemas conceptual y externo.

Diseño Conceptual • Proceso para construir el modelo de la información utilizada en una

Diseño Conceptual • Proceso para construir el modelo de la información utilizada en una organización • Es el primer paso en el diseño de una base de datos. • El método más utilizado es el conocido como Modelo Entidad-Relación

Modelo Entidad-Relación • Es el modelo más utilizado para el diseño conceptual de bases

Modelo Entidad-Relación • Es el modelo más utilizado para el diseño conceptual de bases de datos. • Introducido por Peter Chen en 1976. • Está formado por un conjunto de conceptos que permiten describir la realidad mediante un conjunto de representaciones gráficas y lingüísticas.

Modelo Entidad-Relación Entidad • Cualquier tipo de cosa, persona, concepto abstracto o suceso sobre

Modelo Entidad-Relación Entidad • Cualquier tipo de cosa, persona, concepto abstracto o suceso sobre el que se recoge información • Ej. : empleados, clientes, empresas, productos, plan de cuentas, etc. Entidad: Colectividad considerada como unidad que se trata de la misma manera

Modelo Entidad-Relación • Asociación entre dos o más entidades. • Nombrar descriptivamente la función.

Modelo Entidad-Relación • Asociación entre dos o más entidades. • Nombrar descriptivamente la función. • Tipos: – Relaciones 1 -1: Ej: MATRIMONIO es relación entre (1) integrante de la entidad HOMBRE con (1) de la entidad MUJER. – Relaciones 1 -n: Ej: TRABAJAR-EN es la relación de (1) integrante de la entidad EMPERSA y (n) de la entidad TRABAJADOR. – Relaciones n-n: Ej: MATRICULACION es la relación entre (n) integrantes de la entidad ALUMNO y (n) de la entidad MATERIA.

Modelo Entidad-Relación Atributo • Características de una entidad o relación. • Pueden ser: Simple

Modelo Entidad-Relación Atributo • Características de una entidad o relación. • Pueden ser: Simple (Ej: Documento) o Compuesto (Ej: Dirección: Calle, Nro, Piso) • Se distinguen 2 tipos: – Desciptivo: de las carácterísticas de un objeto, cosa, concepto o suceso dentro de una entidad o relación. – Identificativo (o clave): Su valor no se repite dentro de la entidad o relación por lo que sirve para recuperar los atributos desciptivos Dominio: todos los valores posibles que puede tomar un atributo

Modelo Entidad-Relación Atributos

Modelo Entidad-Relación Atributos

Modelo Entidad-Relación Entidades

Modelo Entidad-Relación Entidades

Modelo Entidad-Relación Relaciones

Modelo Entidad-Relación Relaciones

Metodología de diseño conceptual Tareas a realizar examinando los DFD´s previos: • Identificar las

Metodología de diseño conceptual Tareas a realizar examinando los DFD´s previos: • Identificar las entidades. • Identificar las relaciones. • Identificar los atributos y asociarlos a entidades y relaciones. • Determinar los dominios de los atributos. • Determinar los identificadores. • Dibujar el diagrama entidad-relación. • Revisar el esquema conceptual local con el usuario.

- Inteligencia de Negocios

- Inteligencia de Negocios

¿ Cuál es el Contexto de los Negocios Actuales ? • • Competencia total

¿ Cuál es el Contexto de los Negocios Actuales ? • • Competencia total Necesidad de conocer al cliente Importancia de las alianzas estratégicas Mercado exigente de lo mejor, más barato y más rápido • Reacción a los cambios del negocio • Ahogados en Datos y sedientos de Información

¿ Cuales son las necesidades del hombre de negocios ? Disponer de la correcta

¿ Cuales son las necesidades del hombre de negocios ? Disponer de la correcta información – para la persona adecuada – en el momento justo y – en forma correcta, para tomar el conjunto de decisiones que permitan adquirir ventajas competitivas.

¿ Cuales son las necesidades del hombre de negocios ? INFORMACIÓN TÁCTICA ¿POR QUE

¿ Cuales son las necesidades del hombre de negocios ? INFORMACIÓN TÁCTICA ¿POR QUE HA PASADO? No considera el tiempo ¿PORQUE PUEDE PASAR? ANÁLISIS ESTÁTICO ¿QUE HA PASADO? ANÁLISIS DINÁMICO ¿QUE PUEDE PASAR? INFORMACIÓN ESTRATÉGICA

¿Qué es Inteligencia de Negocios? Utilización de herramientas de manipulación de datos con facilidades

¿Qué es Inteligencia de Negocios? Utilización de herramientas de manipulación de datos con facilidades de: • Extracción automatizada de un conjunto específico de datos almacenados en el sistema transaccional. • Depuración de los datos extraídos ante las inconsistencias detectadas sobre reglas de negocio. • Transformación de los datos depurados en las fuentes oficiales de información para toma de decisiones o para obtener indicadores. • Extructuración de la información generada en bases de datos especiales. • Explotación de las bases de datos generadas con herramientas – – Generadores de Reportes Sistemas de Análisis Multidimensional Sistemas de Apoyo a la Toma de Decisiones Sistemas de Información Ejecutiva

Concepto de Data Warehouse Colección o depósito de datos actuales e históricos, montados sobre

Concepto de Data Warehouse Colección o depósito de datos actuales e históricos, montados sobre una plataforma sólida, que facilita su integración para el procesamiento analítico sobre una amplia perspectiva de tiempo.

Concepto de Data Warehouse Base de Datos Operacional Data Warehouse Datos Operacionales Datos del

Concepto de Data Warehouse Base de Datos Operacional Data Warehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto Actual + histórico Detallada + más resumida Cambia continuamente Estable

Alcance del Data Warehouse • Éxito táctico: Brindar un rápido beneficio al negocio •

Alcance del Data Warehouse • Éxito táctico: Brindar un rápido beneficio al negocio • Éxito estratégico: Expandir permanentemente el Data Warehouse

Principales características de un DW • • Orientado a temas Integrado De tiempo variante

Principales características de un DW • • Orientado a temas Integrado De tiempo variante No volátil

Principales características de un DW Orientado a Temas • La información se organiza alrededor

Principales características de un DW Orientado a Temas • La información se organiza alrededor de sujetos tales como cliente, vendedor, producto y actividad. Por ejemplo: – para un fabricante: clientes, productos, proveedores y vendedores; – para universidad: estudiantes, clases y profesores; – para un hospital: pacientes, personal médico, medicamentos. • Influye en el diseño de la estructura clave de las bases de datos.

Principales características de un DW De Tiempo Variante • La información representa a los

Principales características de un DW De Tiempo Variante • La información representa a los datos sobre un horizonte largo de tiempo (5 a 10 años). • La estructura clave contiene implícita o explícitamente un elemento de tiempo (día, semana, mes, trimestre, semestre, año, etc). • Una vez registradas correctamente las vistas instantáneas, no pueden ser actualizados.

Principales características de un DW Integrado Se expresa de varias formas: – convenciones de

Principales características de un DW Integrado Se expresa de varias formas: – convenciones de nombres consistentes – medida uniforme de variables – codificación de estructuras consistentes – atributos físicos de los datos consistentes, fuentes múltiples, etc.

Principales características de un DW No Volátil • La información es útil sólo cuando

Principales características de un DW No Volátil • La información es útil sólo cuando es estable a través del tiempo. • Hay dos operaciones básicas luego de la carga inicial de datos en el momento de creación de la base de datos de información: – Agregado periódico de datos desde la base de datos transaccional, aumentado su horizonte de tiempo – Acceso a los mismos

¿ Qué es la Arquitectura de un DW ? Es la representación de: –

¿ Qué es la Arquitectura de un DW ? Es la representación de: – la estructura total de datos; • • • Detalle de datos actuales Detalle de datos antiguos Datos ligeramente resumidos Datos completamente resumidos Metadatos – los proceso de transformación de la fuente de datos desde la base de datos transaccional a la base de datos informacional – la estructura de la presentación de informes y los algoritmos para calcular los indicadores,

Usos del DW Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos

Usos del DW Uso de Base de Datos Operacionales Uso de Data Warehouse Muchos usuarios concurrentes Pocos usuarios concurrentes Consultas predefinidas y actualizables Consultas complejas, frecuentemente no anticipadas. Cantidades pequeñas de datos detallados Cantidades grandes de datos detallados Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos

Aplicaciones de DW • Análisis de ventas • Marketing • Control de calidad y

Aplicaciones de DW • Análisis de ventas • Marketing • Control de calidad y Performance de ventas • Seguimiento de garantías • Administración de riesgo crediticio • Análisis de tendencias • Rentabilidad de líneas de productos

Pasos para la Construcción de un DW 1. Definir el alcance: • • •

Pasos para la Construcción de un DW 1. Definir el alcance: • • • Identificar las características del negocio y los requerimientos de información Identificar los departamentos importantes y obtener soporte de los integrantes Desarrollar las preguntas del alto nivel del negocio y priorizarlas 2. Modelar la arquitectura sólida de la Base de Datos Informacional 3. Ensamblar los datos 4. Transformar la fuente de datos 5. Distribuir los datos donde y cuando se necesiten

Software de Bases de Datos para DW Funciones adicionales de los DBMS: • OLAP:

Software de Bases de Datos para DW Funciones adicionales de los DBMS: • OLAP: Procesamiento para Análisis de Datos en Línea – – – Extraer datos Rotar y pivotear resultados Calcular y comparar Cambiar la visión Maximizar o minimizar detalles Observar rankings y excepciones • Mutidimensionalidad: Modelo orientado al soporte en la toma de decisiones, con eficiente almacenamiento de datos que supera al relacional con: – – – Funciones de serie de tiempo Comparación de períodos Análisis de excepciones Comparaciones y rankings Pronósticos basados en modelos

DW

DW

Data Marts • Son DWs de alcance limitados, construidos rápidamente para soportar líneas de

Data Marts • Son DWs de alcance limitados, construidos rápidamente para soportar líneas de negocio simple o pequeños reservorios de datos específicos para distintos departamentos de la empresa: – – RRHH Finanzas Atención a clientes Producción • Representan una estrategia que es particularmente apropiada cuando el Data Warehouse central crece muy rápidamente y los distintos departamentos requieren sólo una pequeña porción de los datos contenidos en él.

De Data Warehouse a Data Marts Fuente 1 Datos Warehouse Fuente 2 Fuente 3

De Data Warehouse a Data Marts Fuente 1 Datos Warehouse Fuente 2 Fuente 3 Ventas Mart Finanzas Mart Servicio al Cliente Mart

De Data Marts a Data Warehouse Fuente 1 Ventas Mart Fuente 2 Finanzas Mart

De Data Marts a Data Warehouse Fuente 1 Ventas Mart Fuente 2 Finanzas Mart Fuente 3 Servicio al Cliente Mart Data Warehouse

Esquema de Inteligencia de Negocios

Esquema de Inteligencia de Negocios

Herramienta para Inteligencia de Negocios

Herramienta para Inteligencia de Negocios

Herramienta para Inteligencia de Negocios

Herramienta para Inteligencia de Negocios

Data Mining (Minería) Actividad: • Dedicada a la búsqueda de correlaciones entre datos y

Data Mining (Minería) Actividad: • Dedicada a la búsqueda de correlaciones entre datos y a la construcción de modelos predictivos a partir de ellos. • Realizada en base a técnicas de: análisis estadístico, análisis clúster, análisis discriminante, etc. • Con metodología estructurada de: – – – Muestreo Exploración Manipulación Modelización Valoración

Big Data - Concepto Tratamiento y análisis de enormes repositorios de datos, desproporcionadamente grandes,

Big Data - Concepto Tratamiento y análisis de enormes repositorios de datos, desproporcionadamente grandes, con variados formatos, estructurados, medianamente estructurados y desestructurados, que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales

Infraestructura Big Data

Infraestructura Big Data

Herramientas de Big Data

Herramientas de Big Data

Data

Data