HP Vertica Analytic Database Que es Vertica Sobre
HP Vertica Analytic Database
Que es Vertica? Sobre Vertica • Fundada en: 2005 • Headquarters: Cambridge, MA Vertica proporciona una plataforma de analytics en tiempo real que ofrece: ► Low-latency para generar analytics “in-time” ► 50 -1000 x mejor desempeño en queries en comparación a otros manejadores tradicionales y orientados a columnas ► Hasta 10 x mejor desempeño en carga de datos ► Sencilla instalación/uso con auto-configuración y tuning ► Alta escalabilidad y paralelismo nativo. Uso de hardware x 86 estándar en la industria ► Arquitectura híbrida in-memory/on-disk ► Soporte para cargas de trabajo a gran escala • Empleados: +350 • Inversionistas: Bessemer, Highland, Kleiner Perkins, & NEA • Adquirida por HP – Febrero 2011 • Redituable y con flujo de efectivo positivo • Clientes: +2500 incluyendo:
Arquitectura Física de HP Vertica
Los pilares de HP Vertica
Almacenamiento en columna. Reduce el tiempo de consulta leyendo solo las columnas necesarias. La información se almacena en la forma en la que se consulta. El almacenamiento columnar es ideal para operaciones intensivas de lectura ya que reduce drásticamente el número de accesos a disco, en comparación con el almacenamiento basado en filas de las bases de datos relacionales
Codificación y Compresión de Datos • Para reducir mas el acceso de disco se aplican agresivamente algoritmos de codificación y compresión. • La cardinalidad y el ordenamiento de los datos de columnas ayudan a determinar el mejor algoritmo de codificación. • Vertica trabaja con datos codificados reduciendo el uso de memoria y CPU en la ejecución de consultas.
• Run-Length Encoding (RLE)
• Deltaval Encoding
• LZO Compression
Alta Disponibilidad • Funcionalidad tipo RAID en la base de datos • Si un nodo falla, la copia de datos esta disponible en otro nodo • No hay necesidad de recuperación en base change-logs. • Siempre se puede consultar y cargar datos • Se puede continuar cargando y consultando datos cuando algunos nodos esta “DOWN” • Cada nodo se adjunta al cluster automáticamente consultando los datos de los otros nodos
Segmentación y Alta Disponibilidad
Segmentación y Alta Disponibilidad
Segmentación y Alta Disponibilidad
Múltiple Procesamiento de datos (MPP) • • Instacia de nodes trabajan en paralelo para garantizar distribuido almacenamiento y carga de trabajo • Redundancia de datos activa • Replicacion de datos automáticas para en caso de fallas poder recuperar. Shared-nothing, grid-based arquitectura probé alta escalabilidad de nodos en un clúster de commodity hardware
Integración de Aplicaciones. HP Vertica esta basada en estándares con compatibilidad completa para SQL, JDBC y ODBC. Permite conservar años de inversión y formación en estas tecnologías. HP Vertica también incluye una amplia variedad de funciones analíticas integradas que son compatibles con las herramientas de visualización y BI más importantes
Diseño Automático de Base de Datos • Database Designer (DBD) recomienda el diseño físico de datos mas apropiado para el caso de uso • Analiza el diseño lógico, muestra de datos y consultas de ejemplo • Minimiza el “tuning” del administrador de la base de datos. • Se puedo ejecutar a cualquier momento sin tener que parar la base de datos DBA Provides > Logical schema § Create table > Sample set of § Typical queries § Sample data > K-safety level Database Designer Generates > Physical schema, compression to: § Make queries in sample set run fast § Fit within trickle load requirements § Ensure all SQL queries can be answered A B C B A C
Que son? • Colección de columnas de tabla • Almacena datos en un formato optimo para la ejecución de consultas • Similar en el concepto a las vistas materializadas
Tipos de Projections en HP Vertica
Hybrid Data Store: WOS y ROS • Write Optimized Store (WOS) – Almacen de datos en memoria para la carga de datos • Read Optimized Store (ROS) – En disco, almacenamiento de datos optimizados
Acceso a la base de datos • VSQL • Db. Visualizer • Database Designer • Distintos productos en mercado
Vertica Management Console
Muchas Gracias !!! sergiomat@gmail. com ? Preguntas
- Slides: 39