Alta Disponibilidad con Microsoft Cluster Server MSCS David
Alta Disponibilidad con Microsoft Cluster Server (MSCS) David Cervigón Luna Microsoft IT Pro Evangelist davidce@microsoft. com http: //blogs. technet. com/davidcervigon
Agenda Ø Introducción Ø Arquitectura de MSCS Ø Administración de MSCS Ø Ejemplo práctico: Exchange 2003 en Cluster Ø Solución de problemas en MSCS Ø DEMOS
Introducción
Escalabilidad y Alta Disponibilidad Ø Ambas dirigidas a garantizar los niveles de servicio (SLAs) Ø Escalabilidad § Garantizar el servicio ante incrementos sustanciales en la demanda de los mismos. § Facilitar la rápida implementación de nuevos servicios sobre infraestructura existente. Ø Alta Disponibilidad § Tolerancia a fallos (hw/sw) § Desastres (naturales, accidentes, etc. ) § Facilitar las operaciones de mantenimiento (backup, Actualizaciones de sw/hw, logísticas, etc. )
Usos de Microsoft Cluster Server Ø Servidores conectados a sistemas de almacenamiento compartidos que son capaces de asumir de forma inmediata la carga de trabajo de otro en caso de fallo Ø Los escenarios más utilizados son aquellos en los que se quiere: § Obtener tolerancia a fallos en servicios que almacenan información importante en disco y/o registro § Aplicaciones que deban mantener el estado entre peticiones sucesivas. Ø Ideal para servicios back-end. § Bases de datos: SQL, Oracle, etc. § Buzones de correo (Exchange 2000 – 2003) § Aplicaciones LOB (SAP, etc. ) § Ficheros e Impresoras § DHCP y/o WINS § Virtual Server
Antes de instalar un Cluster Server Ø Software Windows Server 2003 Enterprise Edition o Data. Center Edition en todos los nodos § Resolución de nombres (DNS, WINS) § Miembros de un dominio § Cuentas de servicio miembros del domino § • • • Ø Derechos de Administrador local NO derechos de Administrador del dominio Ojo con los cambios de contraseña Hardware HCL § Hardware idéntico en todos los nodos participantes idéntico § Ø Red Al menos dos interfaces de red § Direccionamiento IP estático § Ø Almacenamiento compartido SCSI o Fiber Channel (HCL) § NTFS, >500 MB §
Tolerancia a fallos de Cluster Server Escalabilidad: Hasta 8 nodos Server Cluster Active Passive Server Virtual Server Address Cluster Storage Devices Active Server
Servidores Virtuales Ø Una máquina real de cara a los clientes § Representada por: Una o varias IPs • Nombre de red • Otros recursos y servicios o Discos o DHCP, WINS o BBDD (SQL, buzones Exchange) o Ficheros y/o impresoras o Etc. • Ø El servidor virtual “vive” en algunos de los nodos reales (físicos) que conforman el cluster Ø Un Cluster puede albergar mas de un servidor virtual
Arquitectura
Arquitectura y Componentes Event Log Replication Membership Manager Failover Manager Resource DLLs Checkpoint Manager Global Update Manager Cluster Service Backup/Restore Manager Resource Monitors Node Manager Log Manager Database Manager Windows File System Windows Registry
Arquitectura: Database Manager Ø Propósito § Mantiene la base de datos de configuración del cluster § Maneja la información acerca de todas las entidades físicas y lógicas del cluster § Coopera con otras instancias del Database Manager presentes en el cluster Ø Interacción con otros componentes § Ofrece servicios al Failover Manager y al Node Manager § Los cambios se escriben el en registro y en el recurso del quorum § Los cambios son replicados por el Global Update Manager § Implementa APIs usadas por las DLLs de recursos
Arquitectura: Node Manager Ø Propósito § Se ejecuta en cada nodo § Mantiene una lista local con todos los nodos presentes en el cluster § Envía los mensajes de heartbeat para detectar fallos en otros nodos (UDP 3345). § Agrega nuevos nodos y expulsa nodos existentes Ø Tras detectar un fallo en un nodo: § Envía un mensaje para que se inicie un “regroup event” § El servicio de cluster evita las operaciones de escritura en disco hasta que el estado de la pertenencia al cluster de los miembros se estabiliza § Mueve los grupos de recursos del nodo que ha fallado a un nodo activo
Arquitectura: Failover Manager Ø Propósito § Arranca y para recursos § Gestiona las dependencias entre recursos § Determina que nodos poseen que recursos Ø Failover y Failback § Suceden por causa de un fallo, pero también se pueden iniciar manualmente § Los grupos de recursos se mueven a un nodo disponible § La recuperación de una situación de fallo requiere estabilizar el estado de los recursos del nodo que han fallado § Los nodos negocian la propiedad de los recursos a recuperar § El proceso de Failback puede transferir la propiedad de los grupos al nodo una vez recuperado, si así se especifica en la configuración del grupo.
Arquitectura: Checkpoint y Log Manager Ø Checkpoint Manager § Verifica las entradas del registro cuando un recurso se pone online. § Escribe datos de checkpoint en el quorum cuando un recurso se pone offline § Replica información del registro específica de la aplicación Ø Log Manager § Interactúa con el Checkpoint Manager para asegurar que el recurso del quorum tiene la información actualizada. § Permite que los cambios de configuración se lleven a cabo incluso si algunos de los nodos están caídos § Los nodos recuperados pueden actualizar su información obsoleta desde el recurso del quorum
Arquitectura: Otros Managers Ø Global Update Manager § Replica los cambios en la base de datos del cluster a todos los nodos que lo forman Ø Backup/Restore Manager § Ofrece la funcionalidad para hacer backup y restaurar la base de datos del cluster § Opera junto con el Failover Manager y el Database Manager Ø Eventlog Replication Manager § Replica los visores de sucesos locales a toso los nodos del cluster Ø Membership Manager § Mantiene una vista consistente del estado de todos los nodos del cluster
Arquitectura: Monitores de Recursos y DLLs de Recursos Ø Usados por MSCS para manejar los recursos clusterizados. § Ponen los recursos online § Gestiona las interacciones con otros recursos § Monitorizan la salud de los recursos Ø DLLs de recursos disponibles para: § Recursos comunes (discos, carpetas compartidas, etc. ) § Aplicaciones Cluster-aware § Aplicaciones genéricas no cluster-aware Ø Los procesos del Resource Monitor hacen hosting de las DLLs de recursos § Se ejecutan separadamente del servicio de cluster
Arquitectura: El recurso del Quorum Compartido por todos los nodos Ø Ofrece una configuración consistente del cluster Ø Asegura que un recurso es manejado exclusivamente por un único nodo Ø Quorum log Ø § Mantiene la información de la configuración del cluster Ø Tipos de Quorum § Standard. Única base de datos de configuración almacenada en un disco de la cabina compartida (SCSI o Fibra) § Majority Node-Set § Se crea si no hay discos compartidos disponibles para almacenar el Quorum en el momento en que se crea el cluster. § El Quorum log se copia en el disco de sistema de cada nodo. § El recurso Majority Node-Set asegura la consistencia de la información replicándose a los quorums locales § Un cambio se considera completo si se ha llevado a cabo en mas de la mitad de los nodos. Los nodos no pueden poseer recursos a menos que pertenezcan a esta mayoría.
Administración
Instalando un Cluster Server Paso Nodo 1 Nodo 2 Cabina Comentarios Configurar la red y la cuenta de dominio Encendido Apagada Configurar los discos en Nodo 1 Encendido Apagado Encendida Apagar los nodos, encender la cabina, configurarla y arrancar el Nodo 1 Verificar los discos en Nodo 2 Apagado Encendida Apagar el Nodo 1 y encender el Nodo 2 Configurar Nodo 1 Encendido Apagado Encendida Apagar todos los nodos. Encender el Nodo 1 Configurar Nodo 2 Encendido Encendida Encender el Nodo 2 Configuración de los servicios Encendido Encendida Probar que todo funciona como se espera Apagar la cabina, encender los nodos
Componentes de MSCS Ø Cluster Service (Clussvc. exe) § C: WindowsCluster Ø Cluster Database (Clus. DB) § C: WindowsCluster § HKLMCluster § Replicada en y a través del Quorum Ø Cluster Disk driver (Clusdisk. sys) § HKLMSystemCurrent. Control. SetServicesClusdisk • • ParametersSignatures ParametersAvailable. Disks Ø Cluster Network Driver (Clusnet. sys) § HKLMSystemCurrent. Control. SetServicesClus. Net Ø Resource monitor y DLLs de recursos (resrcmon. exe) § C: WindowsCluster
Creación de Grupos y Recursos Ø Ø Cada grupo suele estar asociado al menos a un disco físico. No poner diferentes servidores virtuales en el mismo grupo. Se puede hacer manualmente o por la instalación de un servicio cluster-aware Decidir los parámetros de cada recursos. § Ejecutar en un monitor de recursos independiente § Dependencias entre recursos. • • Un nombre de una IP Un share de un nombre, de una IP y de un disco § Si un fallo individual afecta o no al grupo § Umbral y periodo: Cuantas veces y en cuento tiempo se intentará recuperar el recurso § Chequeo de salud del recurso • • Looks. Alive Is. Alive
DEMO: DHCP en Cluster
Ejemplo práctico: Exchange Server 2003
Requerimientos: Ø Windows 2000 (SP 3 + 329938 o SP 4) § Advanced Server: • 2 nodos Activo/Pasivo • 2 nodos Activo/Activo § Datacenter Server: • 2 nodos Activo/Activo • Hasta 4 nodos en Activo/Pasivo Ø Windows Server 2003 (Enterprise o Datacenter) § 2 nodos en Activo/Activo § Hasta 8 nodos en Activo/Pasivo Ø RECOMENDACIÓN: Activo/Pasivo es el mejor modelo § Limite: N-1 nodos activos siendo N el numero de nodos Ø En un modelo Activo/Activo (nº de EVS > nº nodos) § Menos de 1900 conexiones MAPI concurrentes § CPU < 40%
Dependencias entre los recursos Ø Cuanto más plana, failovers más rápidos Exchange 2000 Exchange 2003 System Attendant Routing Engine Information Store MTA MS Search IMAP 4 SMTP System Attendant IMAP 4 Information Store SMTP MS Search HTTP POP 3 MTA Routing Engine
Modelos Activo/Pasivo con 8 nodos 7+1 4+4 6+2
Permisos de la cuenta de servicio de Cluster Ø Exchange 2000 • Administrador Local en cada nodo Administrador (en la organización si es el primero, o en el Grupo Administrativo) Ø Exchange 2003 • Admimistrador local en cada nodo • No requiere permisos en la organización de Exchange
Cómo crear un Exchange 2003 Virtual Server en cluster Instalar los nodos y configurar el servicio de cluster Ø Instalar MSDTC en cada nodo del cluster. Ø Instalar Exchange Server 2003 en cada nodo del cluster Ø § La instalación es cluster-aware § Copia binarios y registra DLLs de recursos específicas de Exchange Ø Crear el EVS: § En un grupo separado § Uno o varios discos compartidos (según modelo del almacenamiento) § Al menos una IP § Un Nombre de Red § Un recurso de Exchange System Attendant • Ø En Exchange Server 2003, generara los demás recursos necesarios Eliminar el EVS: “Quitar Servidor Virtual de Exchange” en: § El recurso Exchange System Attendant
Diseño del Almacenamiento en el EVS Ø Ø 4 grupos de almacenamiento como máximo por EVS y Nodo (ojo en configuraciones Activo/Activo) 5 bases de datos por grupo de almacenamiento Separar bases de datos y logs en diferentes discos para cada EVS El número máximo de unidades de Windows Server 2003 es 24 § Solo se soportan 23 discos compartidos Ø Pueden usarse Volume Mount Points § Que sean únicos para evitar conflictos con otros discos en el nodo o en el cluster § No crearlos entre discos compartidos y discos locales ni con el Quorum § No crearlos entre discos pertenecientes a diferentes grupos § Establecer correctamente las dependencias entre los discos
Diseño Front-End / Back-End Ø Designar los servidores de Front-End Crear los servidores virtuales HTTP en el Administrador del Sistema (Exchange) § Balancearlos con NLB, si es necesario § Ø Agregar servidores virtuales HTTP en el EVS del cluster que correspondan a los de los frontales Agregando servidores virtuales HTTP § Agregando Directorios virtuales § Ø Mucha más información en: § http: //www. microsoft. com/technet/prodtechnol/exchange/2003/library/febetop. mspx
DEMO: Exchange 2003 en Cluster
Solución de Problemas en MSCS
Herramientas Ø Visor de Sucesos Ø Cluster Log § En C: WINDOWSCLUSTER § Cluster. Log. Level=2 por defecto § Entradas para cada componente. § http: //support. microsoft. com/kb/168801/en-us § http: //support. microsoft. com/kb/286052/en-us Ø Cluster Diagnostics and Verification Tool (Clus. Diag. exe) § http: //www. microsoft. com/downloads/details. aspx? Family. ID=b 898 f 5 87 -88 c 3 -4602 -84 de-b 9 bc 63 f 02825&Display. Lang=en Ø Cluster MPSReports § http: //www. microsoft. com/downloads/details. aspx? Family. Id=CEBF 3 C 7 C-7 CA 5 -408 F-88 B 7 -F 9 C 79 B 7306 C 0&displaylang=en
Sustitución de Discos compartidos Ø Windows 2000 § Dumpcfg. exe para cambiar la firma del disco § http: //support. microsoft. com/? id=243195 Ø Windows Server 2003 § Conf. Disk. exe sustituye a Dump. Cfg. exe § Cluster. Recovery. exe. Engloba a Conf. Disk y Dumpcfg • http: //support. microsoft. com/kb/305793/en-us • http: //www. microsoft. com/downloads/details. aspx? familyid=2 BE 7 E BF 0 -A 408 -4232 -9353 -64 AAFD 65306 D&displaylang=en Ø Incluidas en el Kit de Recursos
Algunos problemas más frecuentes Ø How to enable User Mode Hang Detection on a server cluster in Windows Server 2003 and in Windows 2000 Server SP 4 § http: //support. microsoft. com/default. aspx? scid=kb; EN-US; 815267 Ø How to troubleshoot Cluster Service Startup Issues § http: //support. microsoft. com/kb/266274 Ø How to troubleshoot event ID 9, event ID 11, and event ID 15 error messages § http: //support. microsoft. com/? kbid=154690 Ø Cluster Network Name May Not Come Online with Event ID 1052 § http: //support. microsoft. com/kb/257903 Ø Troubleshooting Multiple Cluster Symptoms on the Same SAN § http: //support. microsoft. com/kb/311081/en-us Ø Troubleshooting Cluster Event ID 1068 § http: //support. microsoft. com/kb/306684/en-us
REFERENCIAS Ø Server Clusters Ø Guide to Creating and Configuring a Server Cluster under Ø Ø Ø Windows Server 2003 White Paper Cluster Configuration Best Practices for Windows Server 2003 Best practices for securing server clusters Cluster support for DHCP servers Deploying Exchange Server 2003 in a Cluster Exchange Server 2003 Cluster Configuration Checklist Solución de problemas en Cluster Server
Más Acciones desde Tech. Net Ø Para ver los webcast grabados sobre éste tema y otros temas, diríjase a: § http: //www. microsoft. com/spain/technet/jornadas/webcasts_ant. asp Ø Para información y registro de Futuros Webcast de éste y otros temas diríjase a: § http: //www. microsoft. com/spain/technet/jornadas/webcasts/default. asp Para mantenerse informado sobre todos los Eventos, Seminarios y webcast suscríbase a nuestro boletín Tech. Net Flash en ésta dirección: § http: //www. microsoft. com/spain/technet/boletines/default. mspx Para estar informado sobre novedades vea nuestros It´s Showtime en: § http: //www. microsoft. com/spain/technet/itsshowtime/default. aspx Para acceder a toda la información, betas, actualizaciones, recursos, puede suscribirse a Nuestra Suscripción Tech. Net en: § http: //www. microsoft. com/spain/technet/recursos/cd/default. mspx Ø Ø Ø
¿PREGUNTAS? David Cervigón Luna Microsoft IT Pro Evangelist davidce@microsoft. com http: //blogs. technet. com/davidcervigon
- Slides: 38