Report da attivita OAT Giuseppe Misurelli INFNCNAF giuseppe

  • Slides: 9
Download presentation
Report da attivita’ OAT Giuseppe Misurelli INFN-CNAF giuseppe. misurelli<at>cnaf. infn. it

Report da attivita’ OAT Giuseppe Misurelli INFN-CNAF giuseppe. misurelli<at>cnaf. infn. it

Invito alla lettura deliverable l https: //edms. cern. ch/document/927171/1 – l Commenti, critiche, addendum…

Invito alla lettura deliverable l https: //edms. cern. ch/document/927171/1 – l Commenti, critiche, addendum… Focus – – – Modello operativo attuale Modello operativo futuro Limiti strumenti operativi attualmente usati Nuovi strumenti operativi Monitoraggio di multi livello

Modello operativo futuro l Basato su principi per garantire – – – autonomia operativa

Modello operativo futuro l Basato su principi per garantire – – – autonomia operativa al ROC possibilita’ di operare MW di tipo diverso uso di strumenti nuovi e/o modifica degli esistenti in base alla reale necessita’ del ROC l Monitoraggio di SLA ad hoc per VO globali (progetto) e locali (ROC)

Punti chiave del modello futuro l l l La responsabilita’ si muovera’ dal COD

Punti chiave del modello futuro l l l La responsabilita’ si muovera’ dal COD ai ROC ed ai loro siti Una piu’ veloce notifica del problema al sito che anticipi (6 h? ) l’apertura del ticket da parte del ROC Automazione del controllo sui siti al fine di eliminare il lavoro del COD (fine EGEE 3)

Monitoraggio di multi livello

Monitoraggio di multi livello

Monitoraggio di sito

Monitoraggio di sito

Multi-level monitoring (J. Casey, SA 1 coordination meeting, July 2008 ) l l l

Multi-level monitoring (J. Casey, SA 1 coordination meeting, July 2008 ) l l l Based on CEE ROC Nagios prototype – Replace central SAM with components at ROC and site – Tie together with the messaging system – Regional operations dashboard and alarms DB – Link into regional ticketing l Perhaps via GGUS (for integration simplicity) Follow new operational model – Raise alarms immediately at the site – 1 st level support sees them and can respond if needed – Central COD only involved after 2 -3 weeks e. g. site banning Project/Infrastructure can aggregate data for reporting 7

Strategia comunicative per nuovi strumenti l l Migliorare la visibilita’ e la conoscenza di

Strategia comunicative per nuovi strumenti l l Migliorare la visibilita’ e la conoscenza di nuovi strumenti di controllo Maggiore pubblicita’… – – l Breve sessione ad hoc alla prossima conferenza EGEE Proporre un articolo che parli dello strumento a i. SGTW (http: //www. isgtw. org/) OAT cerchera’ di gestire uno spazio wiki per la pubblicazione di info utili alla visibilita’ di nuovi strumenti l https: //www. sysadmin. hep. ac. uk/ To change: View -> Header and Footer 8

Roadmap for tools (J. Casey, SA 1 coordination meeting, July 2008) l Milestone ‘Messaging

Roadmap for tools (J. Casey, SA 1 coordination meeting, July 2008) l Milestone ‘Messaging 1’: August 2008 – l Milestone ‘Messaging 2’: December 2008 – l Production level messaging broker in production. This should have internal failover capabilities, but will not have the WAN failover capabilities of a network of broker A scalable and reliable network of brokers, consisting of a deployment over at least 3 sites is in place Milestone ‘Site Monitoring 1’: September 2008 – …. A release of the site components for the multi-level monitoring, including packaging and configuration as part of a EGEE middleware release exists and is ready for deployment to the sites. To change: View -> Header and Footer 9