You are on page 1of 18

HP Vertica

June 12, 2015

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Simply Fast.

Introduction to Vertica
June 12, 2015

www.vertica.com
for Facebooks CIO, Tim Campos, to get on stage in
Europe and declare that, "A partner like
HP Vertica thinks like we do and is a key part of
Facebooks big data capabilities, is one the best
endorsements, err likes, that any modern IT
infrastructure vendor could hope for.
- Dana Gardner, Briefings Direct

Watch the video to see how Vertica empowers


3
Facebook
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Introduccin a Vertica Sobre Vertica
Analytics siempre disponibles Fundada en: 2005
Headquarters: Billerica, MA
Empleados: +350
Inversionistas: Bessemer,
Highland, Kleiner Perkins, & NEA
Velocidad Escalabilidad Sencillez
Adquirida por HP Febrero 2011

Vertica proporciona una plataforma de analytics en tiempo real que ofrece: Redituable y con flujo de efectivo
positivo
Low-latency para generar analytics in-time
Clientes: +2500 incluyendo:
50-1000x mejor desempeo en queries en comparacin a otros manejadores
tradicionales y orientados a columnas
Hasta 10x mejor desempeo en carga de datos
Sencilla instalacin/uso con auto-configuracin y tuning
Alta escalabilidad y paralelismo nativo. Uso de hardware x86 estndar en la
industria
Arquitectura hbrida in-memory/on-disk
Soporte para cargas de trabajo a gran escala
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
4
2500+ clientes y creciendo

Financial Services Communications Consumer Marketing Online Web & Gaming Healthcare Retail
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
5
Clientes de Vertica en Latin America

Grupo Modelo / TSTT Selmec / Grupo Carso


ABInBev
Trinidad & Tobago Mexico
Mexico

SIEMENS y FAPESP SBS Telcel / Anritsu


Brasil Ecuador Mexico
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
6
Vertica Customer Reference
10 Petabytes de datos
Facebook
Microstrategy ED Replace

Cientos de Terabytes de datos


AT&T
TD + Hadoop Replace

Comcast 2 Petabytes de datos

Largest Bank in 1.5 Petabytes de datos


NorthAmerica Microstrategy - TD Replace

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
7
Un DBMS de alto desempeo Algunos casos de uso

Una combinacin nica de Innovaciones Diseo de Campaas


Promocionales
Anlisis de Reclamos

Aprovecha inversiones Redundancia nativa Anlisis de Registros Mdicos


existentes en BI, ETL, automtica que de Pacientes
Hadoop / MapReduce u adems acelera las
Alta consultas. Anlisis de Datos Clnicos
otros OLTP Interfaz SQL
Estndar Disponibilidad Monitoreo de Fraudes
Seguimientos Financieros
Orientacin Diseo Modelos Predictivos con uso de
Sin cuello de botella Columnar Optimizado Configuracin, Datos Histricos
impuesto por el I/O; Automtico optimizacin y manejo
Carga y consulta de Base de Datos Anlisis de Comportamiento
simultaneas automtico
Procesamiento Compresin
Anlisis de Click Streams
Paralelamente Avanzada Anlisis de Carga de Redes
Masivo (MPP)
Customer Analytics

Reduccin de hasta 90% en Auditoras Comerciales


Clustering nativo a nivel Base de
Datos sobre HW x86 Linux de bajo espacio fsico usando 13 Anlisis de Lealtad de Clientes
costo algoritmos de codificacin y
compresin
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change Manejo de Campaas
without notice.
8
El Espectro OLAP OLTP
OLTP OLAP

OLTP (On-Line Transactional Processing)


Rpidos INSERT, UPDATE, DELETE
Beneficios de una arquitectura orientada a filas

OLAP (On-Line Analytical Processing)


SELECT Rpido
Beneficios de una arquitectura orientada a columnas

Vertica est optimizado para OLAP


Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
9
Los Retos Tcnicos de Hoy
Cmo se consigue.
Hacer que los queries sean rpidos
incluso sobre PB de datos?

Atender a un gran nmero de Escalabilidad


usuarios simultneamente?

Crear un sistema con Alta Velocidad


Disponibilidad?

Que sea sencillo de implementar, Sencillez


usar y mantener?

Hacer que funcione con todas las


dems herramientas?
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
10
Desempeo en Queries Mejorado Mediante Reduccin en el I/O
Almacenamiento Columnar
Los manejadores orientados a filas deben leer todas los Column GM
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS

30.77
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS

1/17/08
datos por cada fila.
NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE
NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE
NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE
NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS

Store
NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE

GM NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
30.77 NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
1/17/08
Reads 3 columns GM
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
30.79
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
NYSE
NYSE
NQDS
NYSE
1/17/08
NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE

Los manejadores orientados a columnas slo leen los


AAPL NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE 93.24 NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
NYSE
NQDS
NYSE
1/17/08

NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE
NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE NYSE
NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS NQDS

datos que se requieren. GM NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 30.77 NYSE NYSE NYSE 1/17/08

Las columnas se almacenan ordenadas. Row Store


Reads all columns
GM NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 30.77 NYSE NYSE NYSE 1/17/08
GM NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 30.79 NYSE NYSE NYSE 1/17/08

No se requieren ndices. AAPL NYASE NYAASE NYSE NYASE NGGYSE NYGGGSE NYSE NYSE NYSE 93.24 NYSE NYSE NYSE 1/17/08

Compresin Fecha de transaccin ID de cliente Costo


100
5/05/2009,
5/05/2009 16 0000001
0000001
0
100.25
.25
5/05/2009 0000001 100.50
1
2
0000003 2
5/05/2009 100.75

Vertica aplica ms de 13 esquemas de compresin y codificacin.


2 3
5/05/2009 0000003 100.25
4 1
5/05/2009 0000005
10 3
100.75
4
5/05/2009 0000011
10 101.00
5
19
0000011
5/05/2009 25 101.25
3
0000020

El almacenar las columnas de manera ordenada reduce


5
5/05/2009 49 100.75
3
0000026
5/05/2009
5/05/2009 0000050
101.25
100.75

dramticamente los radios de compresin.


5/05/2009 0000051 100.00
0000052 100.50

Pocos Muchos valores Muchos


Tpicamente veremos una compresin de entre 50% - 90%. valores
ordenados
enteros
ordenados
valores no
ordenados
RLE DeltaVal LZO
Vertica puede trabajar con datos codificados. Muchos otros

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
11
Desempeo en Queries Mejorado Gracias al Cmputo Distribuido
La informacin se segmenta a lo largo de todos los nodos en el clster.
Todos los nodos participan en resolver todas las consultas.
El desempeo escala linealmente con el nmero de nodos.

Red Pblica Red Privada

Query
Sub- Resultados
Query

Resultados Sub- Resultados


Query

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
12
Arquitectura Append-Only Elimina la Contencin entre Load/Query
Todos los datos pertenecen a un epoch determinado.
Operaciones de Lectura leen desde el ultimo epoch.
Operaciones de Escritura escriben desde el epoch actual.
Sin contencin entre load/query.

Row Store
Bob Jones Bob Jones
Joe Smith Joe Smith
Samantha Bee Samantha Bee
Lectura John Thomas Escritura Lectura John Thomas
Frazier Grey Frazier Grey
Willy Lowman Willy Lowman
Grace Kelly Grace Kelly ltimo Epoch
Escritura Lady Gaga Epoch Actual

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
13
Alta Disponibilidad Nativa
Funcionalidad RAID al nivel de la Base de Datos
Las Proyecciones estn organizadas de modo que si un nodo falla, una copia estar disponible en
uno de los nodos sobrevivientes
Automticamente almacena datos con redundancia ordenados de manera diferente para obtener
tambin mejoras en el desempeo
No se requieren Recoveries manuals basados en logs.

Queries & Loads siempre disponibles


El Sistema continuar realizando cargas y consultas an cuando existan nodos cados en el cluster.
Recuperacin de datos en nodos fallidos con base en los dems nodos.

B2 A2 C2 B1 A1 C1 B3 A3 C3

A3 B3 C3 A2 B2 C2 A1 B1 C1

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
14
El Database Designer de Vertica simplifica la administracin de Big Data
La herramienta Database Designer de Vertica automticamente crea y optimiza el diseo fsico de la dase de datos que
proveer el mejor desempeo para los requerimientos especficos de las consulta de los usuarios.
Minimiza el tiempo que un DBA debe gastar en el tuning del diseo fsico de la base de datos.
La primera solucn mid market friendly.
Habilidad para redisear la base de datos incrementalmente para optimizar cargas de trabajo cambiantes en el tiempo.
Se ejecuta antes o despus de la base de Vertica ha sido implementada. Es altamente responsivo a cargas de
trabajo cambiantes.
Procesos background pueden ser ejecutados en caliente en cualquier momento. Sencillez de uso para usuarios no
tcnicos.
El DBA proporciona Database Designer genera

Esquema lgico > Esquema Fsico y Compresin para:


Create table Consultas de muestra ms rpidas
> Conjunto muestra de Optimizar desempeo en cargas y
Consultas tpicas consultas.
Datos de prueba A B C B A C
> Nivel de Tolerancia a
Fallos
(A B C | A) (B A C | B A)

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
HP Vertica: Un ecosistema Big Data integrado
Licenciamiento Flexible
No por nodo, CPU o core
Crece por necesidades
Licencias perpetuas y por tiempo
Paga slo por produccin
Licencias gratuitas de Test / Dev y
Disaster
Valor Agregado
Flex Zone
Conectores para HADOOP, ETL, BI
tools
Soporte para Distributed R
Pulse (Sentiment Analysis)
Soporte GeoSpatial
Funciones Anliticas SQL Nativas
Cloud, VM, x86
World Class Support
365 x 24 x 7 x 4 (1 hr Misin Crtica)
Basado en Estndares
Arquitectura de costo eficiente x86
con almacenamiento DAS
ODBC / JDBC
Linux (RHEL, SUSE, Debian,
Centos)
Solucin Big Data Full Big Data
Solution in 120 MB
Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
En Resumen

Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Ms datos. Ms informacin. Ms valor. Ahora!
Analytics en tiempo real Plataforma Revolucionara de Analytics en
Tiempo Real - Construida para los
requerimientos de maana, hoy

Sencillez de Uso - Entrega valor


inmediatamente a usuarios del negocio,
DBAs, y programadores
El ms rpido Entorno
Time-to-Value Flexible Integracin - El Sistema deber estar
integrado perfectamente.

Desempeo, Reduccin en Footprint de


Datos & Flexibilidad son la clave

Intntalo. con tus Datos en tu Entorno


Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change
without notice.
18

You might also like