CONTECSI 2007 Sistemas Distribuidos Presente y Futuro M
CONTECSI 2007 Sistemas Distribuidos: Presente y Futuro M. C. Juan Carlos Olivares Rojas León, Guanajuato, México, 27 de Septiembre de 2007
Agenda Introducción Definiciones básicas Investigación ITM Tendencias Conclusiones
Estado Actual de Cómputo
ENIAC
Supercomputadora
Evolución de la Computación • 50’s-70’s: “Una computadora múltiples usuarios” • 80’s-90’s: “Una computadora un usuario” • 2000’s: “Un usuario múltiples computadoras” • Actualmente la información es totalmente distribuida, aunque los datos centralizados se siguen utilizando.
Agenda Introducción Definiciones básicas Investigación ITM Tendencias Conclusiones
¿Qué es un Sistema Distribuido? • “Es una colección de computadoras independientes que aparecen ante los usuarios del sistema como una única computadora” (Principio de transparencia) • ¿Qué es un sistema? – Componentes de Hardware (Procesadores, mecanismos de interconexión) – Componentes Software (programación de sistemas y aplicaciones)
Arquitecturas de cómputo • Taxonomía de Flynn: – SISD (Single Instruction Single Data) Procesador único. – SIMD (Single Instruction Multiple Data). Procesadores vectoriales (multimedia) – MISD (Multipe Instruction Single Data). No implementada – MIMD (Multiple Instruction Multiple Data). Cómputo distribuido
Cómputo Distribuido • La distribución del cómputo puede realizarse de diversas formas de acuerdo a su grado de acoplamiento en: • Fuertemente acopladas: Multiprocesadores (memoria compartida). UMA (Uniform Memory Acces) • Débilmente acopladas: Multicomputadoras (memoria privada). NUMA (Non Uniform Memory Access)
Sistemas multiprocesadores CPU 1 CPU 2 … CPU n N 1 Memoria Tarjeta madre … Nn CPU Memoria Tarjeta madre Modelo de n procesadores Modelo de n núcleos
Cómputo de Alto Desempeño http: //www. top 500. org/ Blue Gene
Sistemas multicomputadoras • Están basados en el modelo cliente/servidor • Este modelo se basa en un protocolo solicitud – respuesta. El cliente envía una solicitud de cierto servicio al servidor, el servidor realiza el trabajo y regresa el resultado de la operación. • La principal ventaja de este protocolo es su sencillez, únicamente se necesita la ubicación del servidor.
Sistemas Distribuidos Cliente 1 Solicitud Cliente . Servidor Respuesta Cliente n Modelo Cliente/Servidor Tradicional Cliente . Servidor Proxy en el lado cliente Modelo Cliente/Servidor Concurrente Proxy en el lado servidor Modelo Cliente/Servidor de n capas Cliente
Sistemas Distribuidos • P 2 P (Peer to Peer) los procesos son totalmente descentralizados, funcionan como clientes y servidores a la vez, existen diversas arquitecturas. • Cluster es una agrupación de computadoras intercomunicadas entre sí a través de un nodo central y cuyo objetivo es realizar una tarea específica. • Grid computing es muy parecido a P 2 P y al cluster.
Sistemas Distribuidos • Grid computing se parece al cluster en que consisten en una asociación de computadoras con la única diferencia de que no existe un nodo centralizador. Está característica lo asemeja a P 2 P. • La idea del grid es que el poder de cómputo siempre esté presente a semejanza de la red eléctrica. • Esto a dado pie al software bajo demanda.
Sistemas Distribuidos C 0 Coordinador C 2 C 1 … C 1 Cn C 2 P 2 P Cn Cluster Simétrico Grid computing Asimétrico Planificador CPU Memoria Disco C 1 CPU Memoria DISCO C 2 Planificador. . . CPU MEMORIA Disco Cn
Evolución de Sistemas Distribuidos Esquema básico de Arpanet en 1969 Amoeba
Cómputo paralelo • ¿Es el cómputo paralelo un sistema distribuido? • Sí y No. Depende de la implementación. • Los objetivos de la programación en paralelo son: • Reducir el tiempo de procesamiento utilizado por un algoritmo convencional • Reducir la complejidad del algoritmo
Paralelismo A B C D A P 1 B P 2 C P 3 D P 4 A B C D P 1 P 2 C D Homoparalelismo P 3 P 4 Hetereoparalelismo
Paralelismo • El problema del paralelismo radica en que muchos algoritmos no pueden paralelizarse (son seriales o secuenciales). • Existen dos tecnologías principales para realizar paralelismo: • PVM (Parallel Virtual Machine) • MPI (Message Passing Interface)
Sistema de Red vs. Distribuido • Un Sistema de Red es totalmente autónomo en su administración (local) mientras que las decisiones en un Sistema Distribuido son globales. • La mejor forma de tener una aplicación distribuida es a través del sistema operativo. • Ejemplos de SOD: Amoeba, Mach, Chorus, Sprite, Plan 9
Plan 9
Áreas de los SD • Redes de computadoras (Internet e intranet). • Sistemas operativos distribuidos. • Sistemas multimedia distribuidos. • Cómputo paralelo. • Bases de datos distribuidas.
Áreas de los SD • Sistemas de tiempo real distribuidos. • Cómputo Móvil y ubicuo. • Comercio Electrónico. • Sistemas Distribuidos Inteligentes.
Ventajas de los SD • Compartir información y otros recursos. • Economizar el rendimiento (procesamiento y almacenamiento). • Crecimiento incremental. • Alta disponibilidad • Confiabilidad (tolerancia a fallos)
Desventajas de los SD • Administración más compleja (requerimientos de mayores controles de procesamiento y acceso). • Costos. • Interconexión de componentes. • Fallas de propagación.
Fallas en Sistemas Distribuidos
Desventajas de los SD • Localización, recuperación y coordinación de recursos (sistema de nombre: DNS, JNDI). • No se tiene disponibilidad de una memoria global y un reloj global. • Seriabilización (Marshalling). • Se requiere de sincronización para actualizar el estado del sistema.
Sincronización
Desventaja de los SD • Concurrencia. • Seguridad. • Tiempo de respuesta limitado debido a las comunicaciones (ancho de banda). • Se requiere más capacidad y mejores formas de almacenamiento (NFS, Coda, GFS).
Técnicas de Especificación Formal Red de Petri que representa la cena de 5 filósofos comensales
Tecnologías Distribuidas • Sockets (API Berkeley, Win. Socks) C, Java, C#, etc. • RPC (Remote Procedure Call) C • RMI (Remote Method Invocation) Java • DCOM (Distributed Component Object Model) Propietario de Microsoft
Tecnologías Distribuidas • CORBA (Common Object Request Broker Architecture): C, C++, Java, etc, • . NET Remoting C#, C++, J#, etc. • Servicios Web (SOA), XML (SOAP, WSDL, UDDI) • Agentes móviles (JADE) • Código Móvil (Applets, Active. X)
Agenda Introducción Definiciones básicas Investigación ITM Tendencias Conclusiones
Investigación
Investigación
Investigación
Investigación
Investigación
Investigación
Agenda Introducción Definiciones básicas Investigación ITM Tendencias Conclusiones
Pronóstico IDC 2007 1. 2. 3. 4. 5. 6. 7. 8. 9. Virtualización Grid Computing Arquitectura orientada a servicios (SOA) Enterprise Information Management (EIM) Código abierto Acceso a la información Ajax Mashup Composite Model Computación Distribuida en el Ambiente (del inglés, Pervasive Computing) 10. Recolección inteligente de datos.
Pronóstico Gartner 2007 1. Código abierto 2. Virtualización 3. Registro de servicios y repositorios 4. Suites para la gestión de procesos de negocios 5. Enterprise Information Management 6. Cómputo ubicuo 7. Acceso a la información 8. Web 2. 0 – AJAX Rich Clients 9. Web 2. 0 - Mashup Composite Model 10. Inteligencia colectiva y comunidades
Otras Tendencias • Web Semántica (¿Web 3. 0? ) • WOA (Web Oriented Architectures). • Hardware: buses y redes de alta velocidad (infiniband), ahorro energético. • Domótica.
Web semántica
Conclusiones ¿Área de mayor crecimiento? Sistemas Distribuidos ¿Área de mayor demanda? Sistemas Distribuidos ¿Área que ofrece mayores expectativas? Sistemas Distribuidos ¿Área que hay que estudiar? Sistemas Distribuidos
¿Preguntas? Email: jcolivar@itmorelia. edu. mx MSN: juancarlosolivares@hotmail. com Web: http: //antares. itmorelia. edu. mx/~ jcolivar/
- Slides: 48