Se DRe Moyens Informatiques Fiabilisation des Services Benjamin
Se. DRe Moyens Informatiques Fiabilisation des Services Benjamin Dexheimer Ingénieur Associé Rapport du 29/04/2002
Plan z Fiabilisation z Surveillance des services z Serveurs fiabilisés z Perspectives
Fiabilisation z Diminution du ynombre de pannes ytemps d’indisponibilité en cas de panne z Corollaire important : avoir un système d’information sur l’état de santé des services systèmes et réseaux ytableau de bord efficace xdétection rapide des pannes xactions de prévention xactions automatisées de réparation
Plan z Fiabilisation z Surveillance des services z Serveurs fiabilisés z Perspectives
Surveillance des services z Choix de Net. Saint yétude via un projet de DESS ysystème de surveillance automatisée des liaisons, serveurs et services z Points forts yalertes personnalisées par mail yadministration par Web ytrès modulaire : développement de tests en fonction des besoins
Plan z Fiabilisation z Surveillance des services z Serveurs fiabilisés yarchitecture yservices à données statiques yservices à données dynamiques z Perspectives
Architecture z Architecture des serveurs en cluster z Cluster = ensemble de machines (de qques unités à plusieurs centaines) interconnectées et utilisées de manière unifiée pour un usage donné. z Machines indifférenciées --> tolérance à la perte accidentelle d ’un ou plusieurs noeuds
Architecture z Plusieurs familles ycalcul hautes-performances (High Performance Computing) yhaute disponibilité (High Availability) xservices à données dynamiques ypartage de charge (Share Load Balancing) xservices à données statiques
Plan z Fiabilisation z Surveillance des services z Serveurs fiabilisés yarchitecture yservices à données statiques yservices à données dynamiques z Perspectives
Services à données statiques z Cluster à Partage de charge y répartition au niveau de la connection/session réseau y utilisation de commutateurs 4 -7 (Black Diamond - Extreme client Networks) requête LAN @Ip virtuelle associée au service service
Services à données statiques z Cluster Mosix (partage de charge) y répartition au niveau processus y utilisation d’un OS spécifique (Linux 2. 4. 17+patch) y Serveur de TX en exploitation (serveurtx. loria. fr) Nœud #1 Nœud #2 user Couche de liaison migration Processus local deputy Appels systèmes, signaux, évenmts asynchrones kernel remote kernel LAN
Plan z Fiabilisation z Surveillance des services z Serveurs fiabilisés yarchitecture yservices à données statiques yservices à données dynamiques z Perspectives
Services à données dynamiques z Système de fichier distribué : Intermezzo y distribution d’une partition entre n nœuds y utilisation d’un FS local + disque local y gestion des verrous d’accès concurrents (cohérence du FS) LAN Espace distribué
Services à données dynamiques z Système de fichier cluster : Global File System yaccès simultané à une ressource disque commune à plusieurs serveurs de fichiers y. FS spécifique ygestion de la cohérence du FS yrepose sur une extension du protocol SCSI : Direct Memory Export Protocol z Utilisation multiples : yserveurs de fichiers yserveurs de mails
Plan z Fiabilisation z Surveillance des services z Serveurs fiabilisés z Perspectives
Perspectives z Surveillance de l’intégralité des serveurs et services par Net. Saint ydéveloppement de plugins au besoin z Tests des systèmes de fichiers clusters (Open. GFS, PVFS) ymaquette serveur de messagerie/de fichiers z Système d’installation rapide par serveur d’images
Perspectives Rapport technique INRIA Cluster HPC Sol. de stockage FS clusters 2002 Net. Saint mai août Cluster mail novembre février Serveur d ’images cluster 2003 mai août
- Slides: 18