COSTES DE UN REPOSITORIO DE DATOS Enrique Wulff

  • Slides: 1
Download presentation
COSTES DE UN REPOSITORIO DE DATOS Enrique Wulff enrique. wulff@icman. csic. es* Mercedes Rodríguez

COSTES DE UN REPOSITORIO DE DATOS Enrique Wulff enrique. wulff@icman. csic. es* Mercedes Rodríguez del Castillo Martín mmerced. rodriguez. sspa@juntadeandalucia. es·· * Consejo Superior de Investigaciones Científicas. Cádiz ** Hospital Universitario Virgen de las Nieves. Granada Introducción Son bibliotecas digitales de datos que tienen asegurada su preservación. El intercambio de datos entre médicos clínicos e investigadores requiere mecanismos para desarrollar fuentes de datos, describir hallazgos y acceder a los datos importantes ya descubiertos. Estudiamos aquí los costes de los repositorios de datos médicos, incluyendo planificación y mantenimiento. NCAD: Non-Coded Amino Acids Database DRI/Mammogrid medicalimaging repository Repositorios de datos útiles en Medicina pueden, por ejemplo, incluir secuencias de nucleótidos, codificadoras de proteínas, coordenadas atómicas macromoleculares, y datos epidemiológicos CETA-CIEMAT y MAAT International han desarrollado DRI/Mammogrid la aplicación de infraestructura de repositorios digitales que ofrece un sistema de apoyo al diagnóstico (DSS) y la federación de los datos para la investigación sobre cáncer de mama. el coste de almacenar y gestionar datos ha descendido. El acceso online a los datos de investigación en formato digital debe ser gratuíto. Presupuesto estimado para crear plataforma de producción en acceso abierto en Internet. Estimación de Costes de Puesta en Marcha (año 1). • Hardware / red Servidor, cpu Dual, memoria 4 GB, 156 GB disco interno: 12003400 € • Cartucho de registro para backup: 15 -130 € • Software Linux Red Hat (SO) 34 € • Tivoli (servidor backup) 34 € • Tripwire (seguridad) 200€ • Personal Desarrollo y puesta en marcha (320 horas): 3270 € • Costes totales 4750 – 7060 € Estimación de Costes en Curso Anuales (empiezan a partir del 2º año) • Hardware / red • Mantenimiento del servidor 340 € • Coste de red 58 € • Software Linux Red Hat 34 € • Tivoli (servidor backup) 34 € • Tripwire (seguridad) 113 € • Personal (Mantenimiento en curso y apoyo (20 horas / mes) 2450 € • Costes totales 3029 La flexibilidad y autonomía permite a los investigadores controlar cada fase del ciclo de vida de los conjuntosde datos individuales que manejan. Si se proponen interconec tarlos estratégicamente para mejorar sus resultados, Las partes implicadas tendrían que negociar acuerdos para compartir datos de investigación, La nueva generación de Infraestructuras de datos científicos se enfrenta a dos desafíos principales Adquisición y Asimilación 1, 4 Almacenamiento y Preservación de los datos 2, 4 Acceso 3, 4 c. 42% . 23% c. 35% Notas incluyendo la preparación de los metadatos para la detección de los recursos. incluyendo la planificación de la preservación y de la gestión de los datos. incluyendo el apoyo al usuario tanto a la búsqueda como al uso de los datos. los costes de las funciones de administración y gestión se incluyen (de forma desigual) en las tres rúbricas sobre la base de una estimación de los salarios requeridos. ciencia intensamente basada en datos ciencia multi/interdisciplinar