Tutorial Grille EGEEIDGLASER Montpellier 17062008 www euegee org

  • Slides: 23
Download presentation
Tutorial Grille EGEE/IDG/LASER Montpellier 17/06/2008 www. eu-egee. org SERVICE de GRILLE Système d’information Présentation

Tutorial Grille EGEE/IDG/LASER Montpellier 17/06/2008 www. eu-egee. org SERVICE de GRILLE Système d’information Présentation de Christine Leroy CEA/IRFU faite à partir des exemples du site NA 3/EGEE: http: //wiki. nesc. ac. uk/read/egee-na 3 -etf? Etf. Induction et des slides de Pierre Girard (French ROC deputy CC-IN 2 P 3 site administrator) Edith Knoops CNRS/CPPM EGEE is a project funded by the European Union under contract IST-2003 -508833

Plan Le système d’information dans EGEE/LCG • • origine, architecture, protocole, format des données

Plan Le système d’information dans EGEE/LCG • • origine, architecture, protocole, format des données Les outils du système d’information Exploitation et Système d’information Conclusion

Introduction • Quoi ? Système chargé de collecter des informations sur l’état des ressources/services

Introduction • Quoi ? Système chargé de collecter des informations sur l’état des ressources/services mis à disposition sur la Grille. • Pourquoi ? Découvrir les ressources/services de la grille et leur nature Disposer des données pertinentes pour utiliser les ressources et les services offerts par des sites hétéroclites. Vérifier l’état de santé des ressources et services de la grille. • Comment ? En monitorant localement l’état et la description des ressources/services, et en publiant les données “fraîchement” collectées sur le système d’information. En adoptant un modèle de données “commun à/connu de” tous les composants/acteurs de la grille qui ont besoin d’interagir avec les ressources/services de la grille. En offrant les outils qui permettent d’alimenter et d’interroger le système d’information.

Système d’Information de LCG/EGEE Principes • Principes Chaque site publie • Une description des

Système d’Information de LCG/EGEE Principes • Principes Chaque site publie • Une description des ressources/services qu’il fournit par VO • L’état actuel de ses ressources (CPUs libres, Espace de stockage, etc. ) Chaque VO publie • Ce qu’elle a installé sur chaque site (“Tags” des Software Managers) Les acteurs interrogent le SI pour savoir comment utiliser les VO 2 VO 3 VO 1 Système d’information RB 1 RC 1 LFC 2 RB 2 RC 3 Interrogation VO 1 services/ressources de la grille RB 1 RB 2 RB 1 LFC 2 Site IN 2 P 3 -CC Utilisation

Système d’Information de LCG/EGEE Origine et Architecture MDS: Monitoring and Discovery Service ► Provient

Système d’Information de LCG/EGEE Origine et Architecture MDS: Monitoring and Discovery Service ► Provient de la boite à outils Globus ► Technologie utilisée pour le système d’information LCG/EGEE Comment? : 1 st. Sur chaque site l’état des services (informations statiques et dynamiques) est rapporté à des serveurs 2 nd. Un système centrale interroge ces serveurs et stocke ces informations dans une base de données 3 rd. Ces informations seront accessibles à travers le protocole d’accès: LDAP 4 th. Le système centrale fourni l’information dans un schema prédéfini: Glue. Schema

Architecture globale : Origine du SI actuel • Globus: architecture MDS-2 (Monitoring and Discovery

Architecture globale : Origine du SI actuel • Globus: architecture MDS-2 (Monitoring and Discovery System) Gatekeeper Gridftp Storage Element Information Provider IP Resource A IP Computing IP Element IP IP GRIS 1 GRIS register with GIIS Cache contains info from A and B GIIS Client 1 searches the GRIS directly Client 1 Grid Index Information Service Grid Resource Information Service Resource B IP GRIS GIIS requests info 2 from GRIS services Client 2 uses GIIS for searching collective information Client 2

Architecture globale : SI actuel • GLITE : Aggrégations des systèmes d’information des sites

Architecture globale : SI actuel • GLITE : Aggrégations des systèmes d’information des sites BDII (Berkeley Database Information Index): même fonctionnalité que le GIIS, avec une implémentation différente (meilleure gestion de cache) 2 niveaux d’aggrégation: resource_BDII-site_BDII et de site_BDII-top_BDII-A CE Site BDII CE CE Local BDII: resource SE Local BDII: resource BDII-C BDII-B Local BDII: resource CE SE Local BDII: resource SE CE Site 1 Local BDII: resource Site 2 SE Local BDII: resource RB Site 3 Local BDII: resource

Mise en oeuvre Annuaire LDAP • GRIS, GIIS et BDII sont des serveurs d’annuaire

Mise en oeuvre Annuaire LDAP • GRIS, GIIS et BDII sont des serveurs d’annuaire Directory Information Tree o=in 2 p 3, c=fr (racine du DIT) LDAP (openldap) LDAP : Lightweight Directory Access Protocol ou=lal • Modèle de données Arborescence de nœuds Chaque nœud (entrée de l’annuaire) contient des attributs La structure d’un nœud est définie par une ou des classes au schéma prédéfini. • Modèle de nommage Distinguished Name (DN): cn=Girard Pierre, ou=People, ou=cc, o=in 2 p 3, c=fr • L’information est importé/exporté depuis/vers les serveurs LDAP par des fichiers au format LDIF (LDAP Data Interchange Format) ou=cc ou=lapp ou=People cn=Girard Pierre cn: Girard Pierre phone: +33 99999 uid: girardpi mail: pierre. girard@in 2 p 3. fr object. Class: top object. Class: person object. Class: organizational. Person object. Class: inet. Org. Person

Glue Schema in EGEE/LCG: Design GLUE Schema (v 1. 3): Définition de schémas LDAP

Glue Schema in EGEE/LCG: Design GLUE Schema (v 1. 3): Définition de schémas LDAP décrivant chaque composant des ressources/services de la grille https: //forge. gridforum. org/sf/projects/glue-wg

Quelques Exemples du Glue Schema (I) 1. Some General Attributes: ¤ Base class (objectclass:

Quelques Exemples du Glue Schema (I) 1. Some General Attributes: ¤ Base class (objectclass: Glue. Top): No attributes ¤ Schema Version Number (objectclass: Glue. Schema. Version) • Glue. Schema. Version. Major: Major Schema Version Number • Glue. Schema. Version. Minor: Minor Schema Version Number 2. Attributes for the CE ¤ Base Class for the CE information(objectclass: Glue. CETop) : No attributes ¤ CE (objectclass: Glue. CE) • Glue. CEUnique. ID: unique identifier for the CE • Glue. CEName: human-readable name of the service ¤ CE Status (objectclass: Glue. CEState) • Glue. CEState. Running. Jobs: number of running jobs • Glue. CEState. Waiting. Jobs: number of jobs not running • Glue. CEState. Total. Jobs: total number of jobs (running + waiting) • Glue. CEState. Status: queue status: queueing (jobs accepted but not running), production (jobs accepted and run), closed (neither accepted nor run), draining (jobs not accepted but those already queued are running) • Glue. CEState. Worst. Response. Time: worst possible time between the submission of the job and the start of its execution

Quelques Exemples du Glue Schema (II) 3. Attributes for the SE ¤ Base Class

Quelques Exemples du Glue Schema (II) 3. Attributes for the SE ¤ Base Class (objectclass: Glue. SETop) : No attributes ¤ Architecture (objectclass: Glue. SLArchitecture) • Glue. SLArchitecture. Type: type of storage hardware (disk, tape, etc) ¤ Storage Service Access Protocol (objectclass: Glue. SEAccess. Protocol) • Glue. SEAccess. Protocol. Type: protocol type to access or transfer files • Glue. SEAccess. Protocol. Port: port number for the protocol • Glue. SEAccess. Protocol. Version: protocol version • Glue. SEAccess. Protocol. Access. Time: time to access a file using this protocol 4. Mixed Attributes ¤ Association between one CE and one or more SEs (objectclass: Glue. CESEBind. Group) • Glue. CESEBind. Group. CEUnique. ID: unique ID for the CE • Glue. CESEBind. Group. SEUnique. ID: unique ID for the SE

Utilisation du Système d’Information • Par les Ressources/services • Par les utilisateurs

Utilisation du Système d’Information • Par les Ressources/services • Par les utilisateurs

Services Grille Matchmaking • Le SI est interrogé par le RB/WMS pour choisir une

Services Grille Matchmaking • Le SI est interrogé par le RB/WMS pour choisir une queue de soumission en fonction du JDL (Job Description Language) fourni par l’utilisateur UI JDL 1 - soumet VO 3 un job (JDL) TAG Requirements: VO 3_APP 1. 0. 2 TAG VO 3_APP 1. 0. 2 Input “datafile 1” Max. CPUTime >= 20 3 - Soumet 2 - Interroge RB 2 Top BDII TAG VO 3_APP 1. 0. 2 RB 1 RC 2 RC 1 LFC 2 RB 2 RC 3

Utilisation du Système d’Information niveau utilisateur - ldapsearch ♠ ldapsearch Read port of the

Utilisation du Système d’Information niveau utilisateur - ldapsearch ♠ ldapsearch Read port of the BDII % ldapsearch -x Simple authentication -H ldap: //grid 017. ct. infn. it: 2170 Uniform resource identifier -b ‘mds-vo-name=resource, o=grid’ Base DN for search ‘(objectclass=Glue. SE)’ Filter Glue. SEUnique. ID Attributes to be returned (Make “man ldapsearch” to retrieve the whole set of options) The ldapsearch Implementation in EGEE/LCG Some wrappers of ldapsearch exist in LCG middleware

Utilisation du Système d’Information Comment interroger les différents composants Abbreviations: BDII: Berkeley Data. Base

Utilisation du Système d’Information Comment interroger les différents composants Abbreviations: BDII: Berkeley Data. Base Information Index Each site can run a top BDII. It collects the information coming from the site-BDII % ldapsearch –x –h <hostname -p 2170 –b “o=grid” At each site, a site BDII collects the information given by the resource_BDII % ldapsearch –x –h <hostname> -p 2170 –b “mds-vo-name=<name>, o=grid” Resource BDII run on CEs and SEs at each site and report dynamic and static information % ldapsearch –x –h <hostname> -p 2170 –b “mds-vo-name=resource, o=grid”

Utilisation du Système d’Information niveau utilisateur - ldapsearch $ ldapsearch -LLL -x -h topbdii.

Utilisation du Système d’Information niveau utilisateur - ldapsearch $ ldapsearch -LLL -x -h topbdii. grif. fr: 2170 -b mds-vo-name=GRIF-LLR, mds-vo-name=GRIF, mds-vo -name=local, o=grid '(&(objectclass=Glue. SA)(Glue. SAType=permanent)(Glue. SALocal. ID=cms))' Glue. SAState. Available. Space Glue. SAState. Used. Space dn: Glue. SALocal. ID=cms, Glue. SEUnique. ID=polgrid 4. in 2 p 3. fr, Mds-Vo-name=GRIF-LLR, Mds-Voname=GRIF, Mds-Vo-name=local, o=grid Glue. SAState. Available. Space: 3810000000 Glue. SAState. Used. Space: 11989948171 Sortie sous format LDIF

Utilisation du Système d’Information niveau utilisateur - lcg-infosites > lcg-infosites --vo <your_vo> feature –-is

Utilisation du Système d’Information niveau utilisateur - lcg-infosites > lcg-infosites --vo <your_vo> feature –-is <your_bdii> • It’s mandatory to include the vo and the feature • The –is option means the BDII you want to query. If not supplied, the BDII defined into the LCG_GFAL_INFOSYS will be interrogated Features and descriptions: close. SE Names of the CEs where the user’s VO is allowed to run together with their corresponding closest SEs ce Number of CPUs, running and waiting jobs and names of the CEs se SEs names together with the available and used space lfc Name of the lfc for the user’s VO all It groups all the features just described help Description of the script

lcg-infosites: Examples (I) > lcg-infosites –-vo biomed se –-is topbdii. grif. fr Avail Space(Kb)

lcg-infosites: Examples (I) > lcg-infosites –-vo biomed se –-is topbdii. grif. fr Avail Space(Kb) Used Space(Kb) Type SEs -----------------------------1928602364 2752109700 n. a scaise-2. scai. fraunhofer. de 288020000 1984948 n. a se 2. egee. cesga. es 2030000000 1807434 n. a fornax-se. itwm. fhg. de 361520000 955266 n. a se 02. marie. hellasgrid. gr 2550000000 579915 n. a egee-se. grid. niif. hu 1421026112 125944000 n. a g 03 n 05. pdc. kth. se 858740000 229921 n. a SE. pakgrid. org. pk 614310000 4863261 n. a dgc-grid-34. brunel. ac. uk 51510000 698432 n. a cs-grid 2. bgu. ac. il 323750000000 12132807 n. a gw-3. ccc. ucl. ac. uk 94110000 10555968 n. a se 01. grid. auth. gr ………. .

lcg-infosites: Examples (II) > lcg-infosites –-vo biomed ce –-is topbdii. grif. fr lcg-infosites --vo

lcg-infosites: Examples (II) > lcg-infosites –-vo biomed ce –-is topbdii. grif. fr lcg-infosites --vo biomed ce #CPU Free Total Jobs Running Waiting Computing. Element -----------------------------22 12 0 0 0 pearl. amu. edu. pl: 2119/jobmanager-lcgpbs-biomed 12 12 0 0 0 ce. egee. di. uminho. pt: 2119/jobmanager-lcgpbs-biomed 76 5 0 0 0 lcg 38. sinp. msu. ru: 2119/jobmanager-lcgpbs-biomed 1608 728 0 0 0 grid 10. lal. in 2 p 3. fr: 2119/jobmanager-pbs-biomed 1116 7 326 0 gridce. pi. infn. it: 2119/jobmanager-lcglsf-grid 4 552 319 224 0 svr 021. gla. scotgrid. ac. uk: 2119/jobmanager-lcgpbs-q 3 d 156 133 0 0 0 lcgce 0. shef. ac. uk: 2119/jobmanager-lcgpbs-biomed 830 491 210 1 209 ce 06. pic. es: 2119/jobmanager-lcgpbs-gshort 22 20 0 ce 001. grid. uni-sofia. bg: 2119/jobmanager-lcgpbs-biomed 26 26 3 2 1 scaicl 0. scai. fraunhofer. de: 2119/jobmanager-lcgpbs-biomed 356 335 0 0 0 egeece 01. ifca. es: 2119/jobmanager-lcgpbs-biomed 204 45 0 0 0 dgc-grid-44. brunel. ac. uk: 2119/jobmanager-lcgpbs-biomed 34 28 1 1 0 ce 1. egee. fr. cgg. com: 2119/jobmanager-lcgpbs-biomed 118 105 0 0 0 ce 01. marie. hellasgrid. gr: 2119/jobmanager-pbs-biomed ……

Exploitation et Système d’information GOC DB • Référenciel de tous les sites de LCG/EGEE

Exploitation et Système d’information GOC DB • Référenciel de tous les sites de LCG/EGEE l’URL LDAP du Site BDII de chaque site Le statut/type (Certified/Production) de chaque site La déclaration éventuelle de « Scheduled Downtime » … Utilisable pour générer automatiquement la configuration des Top BDIIs avec la liste des sites déclarés en « Production » http: //grid-deployment. web. cern. ch/grid-deployment/gis/lcg 2 -bdii/dteam/lcg 2 -all-sites. conf GOC DB HTTP Config URL Site. BDII 1 URL Site. BDII 2 … BDII

Exploitation et Système d’information Monitoring • SAM (Service Availibility Monitoring) https: //lcg-sam. cern. ch:

Exploitation et Système d’information Monitoring • SAM (Service Availibility Monitoring) https: //lcg-sam. cern. ch: 8443/sam. py système soumettant régulièrement des tests sur les sites Le résultat des tests est utilisable pour filtrer les Top BDIIs en supprimant les sites en échec. • Vue d’ensemble: infrastructure Grille: http: //gridmap. cern. ch/gm/

Exploitation et Système d’information l’Accounting

Exploitation et Système d’information l’Accounting

Conclusions • Le SI LCG/EGEE fournit les informations nécessaires à l’utilisation des ressources/services de

Conclusions • Le SI LCG/EGEE fournit les informations nécessaires à l’utilisation des ressources/services de la grille Pour les utilisateurs Pour les services de grille ~200 sites sont ainsi publiés • Il est organisé autour d’une architecture à 3 niveaux de serveurs LDAP Resource BDII Site BDII Top BDII Utilise un modèle de données défini par le GLUE Schema Attention aux temps de latence liés à l’accumulation de cache • Criticité du SI Stabilité en progression : répartission des Top BDIIs par ROC (fédérations)