Distribution des donnes CMS Palaiseau Distribution des donnes
Distribution des données CMS Palaiseau • Distribution des données et préparation de l’analyse • Production MC distribuée et données centralisées au CERN • accès pour site Tier • cas des données de LHC • Besoin distribution en vue analyse pour TDR physique (fin 2005) • analyse hors CERN • définition des données à transférer vers chaque Tier en cours d’élaboration • total CMS ~60 TB • suivant contributions au TDR • Planning court terme • Réutiliser PHEDEX • le système de distribution des datasets utilisés lors de DC 04 • distribution déjà en cours pour INFN, PIC, FNAL • CCIN 2 P 3 prévu fin semaine prochaine 1
Infrastructure nécessaire Palaiseau • Organisation • Site (SE) eneregistré dans CMS BDII • Certificats et enregistrement dans CMS VO • Installation software CMS • User Interface • LCG 2 -UI • Client Oracle • Agent de transfert à adapter • Storage Element • Accès direct à HPSS • besoin disk pour flexibilité import des données et analyse • actuellement accès /sps • disk sous le SE • Premiers tests du SE HPSS enabled effectués • Local catalog • Réutilisation du catalogue my. SQL de DC 04 2
Datasets CMS Palaiseau • Un example: hg 03_hzz_4 e_m 140 • Total Hits+MCInfo+Digi+Assoc = 12 GB pour 10 k évts • Digitisation info seulement = 6. 8 GB pour 10 k évts • DST = 1. 5 GB pour 10 k évts • Structure en fichiers • fichiers Hits: ~430 MB/1000évts • fichiers Digi: ~445 MB/1000évts • fichiers MCInfo: ~45 MB/1000évts • Fichiers Assoc: ~250 MB/1000évts • Fichiers DST: ~150 MB/1000évts • Fichiers META + Events: taille négligeable • Stockage • Tous fichiers dans HPSS • Fichiers META et Events sur disk en permanence • Fichiers data sur disk lors de l’utilisation 3
Conclusion: besoins 2004 Palaiseau • Très court terme: infrastructure de transfert • dans l’immédiat, utilisation SE • setup optimisé par la suite • A l’automne: analyse des données • software CMS • accès données pour ~10 -30 utilisateurs PRS CMS • relecture principalement DST • mais aussi Digis/Mc. Info • essentiellement besoin disk sous le SE et cache HPSS 4
- Slides: 4