You are on page 1of 32

BIG DATA

y su impacto en el negocio
Una aproximacin al valor que el anlisis
extremo de datos aporta a las organizaciones

Leopoldo Boado
Country Manager de Oracle Espaa.

LA BSQUEDA DEL TESORO DE DATOS


En la literatura infantil anglosajona hay una bella imagen que excita la imaginacin de los nios: al final del
arcoris hay un tesoro; un caldero lleno de monedas de oro custodiado por un duende. Hoy, lo que excita la
imaginacin de buena parte de los directivos y empresarios es un tesoro de un tipo muy particular. El tesoro
se llama Big Data y consiste en la acumulacin y tratamiento de cualquier tipo de informacin que se est
produciendo en todo tipo de redes, dispositivos y sistemas informticos.
Cada da, segn informacin de McKinsey, la humanidad crea 1,5 trillones de bytes de datos. La imparable
expansin de Internet, no slo como un canal de informacin, sino como un instrumento al servicio de la
gestin empresarial, explica en gran medida este incremento de datos. Pero a ello se unen otros fenmenos,
como la explosin de las redes sociales, el desarrollo de la telefona mvil en particular de redes 3G y
smartphones con capacidades de conexin de datos impensables hace no tanto tiempo-, el crecimiento de la
produccin y divulgacin de materiales multimedia foto y vdeo- por parte de usuarios particulares, la eclosin
de medidores inteligentes (smartmetering) y el despliegue de dispositivos que transmiten informacin por
radiofrecuencia.
Cmo pueden las empresas hacerse con este tesoro? Cmo pueden convertir los datos propios y los que
circulan por las redes y sistemas de informacin en un valor aadido para su negocio y en una ventaja
competitiva?
No hay una respuesta nica para estas preguntas. Cada organizacin, en funcin de su sector de actividad y de
sus propias peculiaridades, deber analizar qu uso puede hacer de este inmenso caudal de datos y cmo los
puede aprovechar. Pero lo que s hay es una clara respuesta tecnolgica. Aprovechar el potencial de Big Data es
una realidad perfectamente posible hoy en da, y a un coste razonable, gracias a los sistemas que empresas como
la nuestra ponen a disposicin de sus clientes.
En el presente informe, promovido por Oracle, buscamos ofrecer una muy amplia visin de lo que Big Data
puede representar para el entorno empresarial en todo el mundo y en Espaa en particular. Con ello queremos
ofrecer a nuestros clientes una aproximacin caracterizada por la independencia de criterio y opinin de quienes
han colaborado en su desarrollo.
Los Big Data representan una ventaja competitiva para todos aquellos que los sepan aprovechar. No nos
cabe duda de que, al contribuir a una mejor comprensin sobre este fenmeno, ayudaremos a los gestores
empresariales de toda Espaa a llegar al final del arcoris.

Leopoldo Boado

RESUMEN EJECUTIVO

BIG DATA y su impacto en el negocio


Una aproximacin al valor que el anlisis extremo de datos aporta a las organizaciones

El 90% de los datos del planeta se ha generado en los


ltimos dos aos y durante 2011 se rozaron los dos
zettabytes (1 zettabyte = 1024 exabytes) de informacin
en todo el mundo segn datos de McKinsey Global
Institute. Provienen de redes sociales (ms de 900 millones
de usuarios de Facebook , 500 millones de seguidores
de Twitter y cerca de 200 millones de blogs pblicos);
telfonos mviles (5.000 millones en uso en todo el
mundo); sistemas de telemedicin; fotografas; vdeos;
emails El conjunto de toda esta explosin de informacin
recibe el nombre de Big Data y, por extensin, as tambin
se denomina al conjunto de herramientas, tcnicas y
sistemas destinados a extraer todo su valor.
En el sector retail se espera que quien aplique tcnicas de
Big Data podr incrementar sus mrgenes en ms de un
60%; los costes de fabricacin y mantenimiento de muchas
empresas se veran reducidos a la mitad; en sus distintas
aplicaciones en el sector pblico europeo podra generarse
negocio por valor de 250.000 millones de dlares y de
300.000 millones en el sector sanitario estadounidense y
los nuevos negocios basados en servicios de localizacin
podran generar ms de 100.000 millones de dlares.
El valor de las prcticas de anlisis extremo reside en el
punto de encuentro entre el acercamiento a Big Data con
los mtodos y herramientas apropiados y su integracin
con los datos de la informtica tradicional. Al combinar las
herramientas de Big Data con la gestin de datos clsica las
organizaciones obtienen una visin enriquecida de ellas
mismas y sus posibilidades.

Para el xito de las iniciativas de Big Data es fundamental


una buena sincrona entre la capa de negocio y la
infraestructura tecnolgica subyacente. Las TI son sin duda
la herramienta imprescindible para llevar a cabo cualquier
proyecto de Big Data pero es el conocimiento de negocio el
que determinar el xito de la misma.

Aplicaciones
Existen mltipes aplicaciones horizontales de Big Data:
motores de recomendaciones; anlisis de sentimientos;
control del riesgo; deteccin del fraude; anlisis de
campaas de marketing, de abandono de clientes,
de influencia social, y de experiencias de cliente;
monitorizacin de la red y aplicacin del anlisis extremo a
los procesos de investigacin y desarrollo.
Por sectores, Big Data influye en una gran variedad de
aplicaciones:
Banca y finanzas: Servicios de proteccin de marca;
proteccin ante riesgos y fraude y servicios personalizados a
clientes.
Sector Pblico: Servicios de inteligencia, defensa y
proteccin (control de comunicaciones, vigilancia,
intercepcin de redes de telefona, acumulacin de todo
tipo de datos); proteccin de la flota pesquera; vigilancia,
seguridad y sealizacin y proyectos de Smart Cities.

Cuestiones tcnicas
Un trmino ntimamente relacionado con Big Data desde
el punto de vista tcnico es Hadoop, un entorno de cdigo
abierto para almacenar y organizar cantidades masivas de
datos distribuidos y no estructurados que, a su vez, estaba
inspirado en MapReduce, una funcin desarrollada por
Google a principios de 2000 para indexar la web.
Hadoop se encuadra como un proyecto de la Apache
Software Foundation, en el que cientos de participantes
mejoran continuamente el ncleo de la tecnologa. Adems,
una nueva generacin de desarrolladores de este entorno
y de Cientficos de datos est empezando a despuntar.
Asimismo, start-ups de ltima generacin empiezan a
perfeccionar bases de datos NoSQL que, combinadas con
Hadoop, son capaces de descubrir patrones prcticamente
en tiempo real.
Sanidad: Monitorizacin remota de pacientes; localizacin
de emergencias y almacenamiento de historias clnicas,
radiografas, escneres y todo tipo de pruebas de forma
centralizada.
Retail-Gran Consumo: Control de la cadena de
fabricacin; anlisis del ticket de compra; marketing
personalizado y RFID (Identificacin por Radio Frecuencia)
en centros comerciales.
Turismo: Optimizacin de precios y generacin de ofertas
personalizadas.
Telecomunicaciones: control de la red; venta de servicios
de localizacin; servicios de publicidad asociados al patrn
de llamadas o las aplicaciones descargadas; obtencin
de perfiles enriquecidos de consumidor enriquecidos y
explotacin de RFID para segmentar y personalizar ofertas
anlisis de abandono.
Utilities: Interpretacin de contadores inteligentes en todas
las casas; control de la red comunicaciones, de tuberas,
red del metro y proyectos de sealizacin de tramos de
mantenimiento
Web y Digital Media: Anlisis de click and stream;
personalizacin y forecasting y optimizacin

La propuesta de Oracle en Big Data descansa


en tres pilares: sistemas preconstruidos
con hardware, software y comunicaciones
integrados que se puedan conectar
directamente (Big Data Appliance);
herramientas de productividad y de desarrollo
alrededor de creaciones OpenSource como
Hadoop o MapReduce y conectores que
automatizan las transformaciones necesarias
para procesar la informacin en origen,
dotando de la estructura necesaria a la parte
que se desea integrar con la informtica
tradicional.

Big Data en Espaa


Las empresas espaolas muestran inters hacia la
explotacin de Big Data, pero es difcil sustraerse a los
rigores del momento econmico que limita los presupuestos
de TI. Las principales cuestiones que se plantean las
organizaciones espaolas en relacin a Big Data son: es
aplicable y factible en mi organizacin?, cunto me cuesta?
Y quin me ayuda a implantarlo?

BIG DATA: DESGRANANDO EL CONCEPTO


Proliferacin de informacin en crecimiento acelerado y sin visos de ralentizarse, explosin de
indicadores, seales y registros, interacciones en redes sociales No hay camino de vuelta: la
cantidad de datos que se genera diariamente en el mundo no presenta sntomas de ir a reducirse,
ms bien todo lo contrario. El mundo est lleno de seales, de signos, datos, piezas de informacin
que analizadas y puestas en relacin podran responder a cuestiones que nunca hubiramos
imaginado poder preguntar. Segn la consultora McKinsey Global Institute, el 90% de los datos del
planeta se ha generado en los ltimos dos aos y su proliferacin va en aumento en una progresin
difcil de calcular. Estn en todas partes, provienen de redes sociales, sistemas de telemedicin,
fotografas, vdeos, emails, son de mltiple naturaleza y se almacenan en distintos lugares y
formatos. El conjunto de toda esta explosin de informacin recibe el nombre de Big Data y, por
extensin, as tambin se denomina al conjunto de herramientas, tcnicas y sistemas destinados a
extraer todo su valor.
En 2010 existan 480 millones de smartphones y la cifra
crece.al 20% anual! Un segundo de vdeo en alta
definicin ocupa 2.000 veces ms que una pgina de
texto. Las cmaras integradas en los telfonos hacen fotos
a de 15 megapxeles que ocupan 10 Megas. Existen ms
de 30 millones de sensores en transportes, automocin,
industria, fabricacin En todas nuestras interacciones
los seres humanos dejamos rastros, seales que nos definen
y que mediante las tecnologas de la informacin y, sobre
todo a raz de la proliferacin de las redes sociales, pueden
registrarse a modo de documento de identidad vital.
La vida de la tecnologa ha alcanzado
las fases de madurez en las que ser
rpido y ser fuerte importa pero no es
suficiente. Ha llegado el momento de
combinar la ambicin y la fuerza de la
juventud (informtica estructurada) con
la experiencia comparada (informtica no
estructurada), de modo que la interrelacin
de ambos tipos de datos nos lleve a la
sabidura corporativa
Andrew Sutherland,
Vicepresidente Senior de Tecnologa de Oracle EMEA.
La realidad muestra una acumulacin que nunca termina
de todo tipo de datos, la mayora proveniente de nuevos
canales para formar lo que se conoce por Big Data, y
que carecen de una estructura comn. Los volmenes de
datos son tan extremos y su crecimiento tan exponencial
que resultan demasiado ingentes o demasiado crudos
para ser recogidos, registrados, aceptados, gestionados y
analizados por software y hardware tradicional a unos costes
razonables.
Pero la posibilidad de explotarlos abre mucho espacio para
nuevas empresas y para las organizaciones tradicionales que
sepan extraerle valor a su capital informativo.

Segn McKinsey Global Institute, en el sector retail se


espera que quien aplique tcnicas de Big Data podr
incrementar sus mrgenes en ms de un 60%; los costes de
fabricacin y mantenimiento de muchas empresas se veran
reducidos a la mitad; en sus distintas aplicaciones en el
sector pblico europeo podra generarse negocio por valor
de 250.000 millones de dlares y de 300.000 millones en
el sector sanitario estadounidense y los nuevos negocios
basados en servicios de localizacin podran generar ms de
100.000 millones de dlares.
McKinsey aade que las oportunidades laborales asociadas
al fenmeno tambin son ms que relevantes: de aqu
a 2018, la demanda prevista de proyectos de Big Data
en Estados Unidos va a necesitar de un ecosistema de
profesionales expertos de entre 440.000 y 490.000.
El objetivo principal de Big Data es enriquecer
y complementar los sistemas corporativos
con capacidades predictivas
La estimacin de la oferta real de talento analtico, sin
embargo, se calcula que no superar en 2018 los 300.000
profesionales, lo que significa que se abren oportunidades
laborales para entre 140-190.000 expertos.
Pero no todo son buenas noticias. La teora tiene todo
el sentido pero, segn expresa Gartner en su informe de
2011 Extreme Data challenges and opportunities: Hasta
2015 ms del 85% de las empresas que componen la lista
Fortune 500, van a fallar en la explotacin de Big Data de
forma eficiente para obtener ventajas competitivas.
Para Andrew Sutherland, Vicepresidente Senior de
Tecnologa de Oracle EMEA , no se trata de montar un
departamento de I+D de Big Data, se trata de sacarle un
valor a esa informacin al combinarla lo antes posible con
las fuentes tradicionales de datos. Hablamos de enriquecer
la fuente, de dar herramientas de productividad alrededor
de un entorno que de por s es improductivo.

Estructurado-no estructurado
Hay datos que conforman el alma operativa de una
organizacin y deben estar almacenados, organizados y
clasificados en bases de datos transaccionales con mtodos
que garanticen su seguridad, cifrado y alta disponibilidad.
A estos se les conoce como datos estructurados que se
almacenan, gestionan y analizan segn unos procedimientos
de tablas, atributos e indexacin.
En la lgica de Big Data lo relevante tiene que ver
con tratar la ingente y creciente cantidad de datos no
estructurados procedentes de canales no tradicionales
(blogs, redes sociales, emails, sensores, fotografas, vdeos,
servicios de geolocalizacin, tecnologas de radiofrecuencia).
Estos datos tendran gran utilidad predictiva pero
resultara desproporcionadamente costoso darles el
mismo tratamiento con las condiciones de seguridad, alta
disponibilidad y cifrado que los datos que se denominan
estructurados.
Entre la punta de la pirmide que representan
Facebook o Google y la base de la informtica
tradicional existe una casustica amplia
y variada a la hora de aadir informacin
de valor procedente de nuevas fuentes y
canales, mezclndola con la informacin y los
sistemas tradicionales
La razn para utilizar tecnologas distintas a la relacional
tiene, por tanto, mucho que ver con el carcter no
estructurado de los datos y con la necesidad de utilizar
algoritmos de bsqueda/filtrado distintos al lenguaje
utilizado por las bases de datos relacionales, el SQL.

Conocimiento combinado
El valor de las prcticas de anlisis extremo reside en el
punto de encuentro entre el acercamiento a Big Data con
los mtodos y herramientas apropiados y su integracin
con los datos de la informtica tradicional. Al combinar las
herramientas de Big Data con la gestin de datos clsica las
organizaciones obtienen una visin ms completa de ellas
mismas y sus posibilidades.
Facebook, Google y Amazon son ejemplos de compaas
que utilizan el anlisis extremo como patrn de
tratamiento de las ingentes cantidades de datos que
manejan. De hecho, las herramientas, lenguajes y
entornos asociados al anlisis de Big Data se desarrollaron
bajo el paraguas de estas compaas que demandaban
nuevos mtodos para tratar y obtener valor de su capital
informativo.

Entre la punta de la pirmide que representan Facebook o


Google y la base de la informtica tradicional existe una
casustica amplia y variada a la hora de aadir informacin
de valor procedente de nuevas fuentes y canales,
mezclndola con la informacin y los sistemas tradicionales.
Las grandes empresas tienen sus sistemas de gestin
de la relacin con clientes (CRM), conocen sus gustos
y comportamientos, aplican pautas de inteligencia de
marketing, personalizan ofertas Pero aun as, existe
informacin que podra enriquecer esas prcticas. De este
modo, el objetivo principal de Big Data es enriquecer y
complementar los sistemas corporativos con capacidades
predictivas.
Los volmenes de datos son tan extremos y
su crecimiento tan exponencial que resultan
demasiado ingentes o demasiado crudos
para ser registrados, aceptados, gestionados
y analizados por software y hardware
tradicional
Big Data busca capturar, almacenar, organizar y
analizar esos datos no estructurados, pero ahora con la
necesidad de aplicacin de economas de escala y con unos
requerimientos tcnicos muy concretos y especficos por
debajo.
Para Andrew Sutherland, nosotros mismos somos
contenedores de informacin, estructuras de datos.
Almacenamos exabytes de informacin gentica y al
aprender desarrollamos un marco, una estructura de
conocimiento que nos servir para organizar la informacin,
las seales, los estmulos que percibimos y los que nosotros
generamos. La experiencia vital, el ensayo y error ayudan
a edificar esa estructura de conocimiento que se acaba
conociendo como sabidura.
En tecnologa no es muy diferente. Nos encontramos en
un punto en el que la vida de la tecnologa ha alcanzado las
fases de madurez en las que ser rpido y ser fuerte importa
pero no es suficiente. Ha llegado el momento de combinar
la ambicin y la fuerza de la juventud (informtica
estructurada) con la experiencia comparada (informtica
no estructurada), de modo que la interrelacin de ambos
tipos de datos nos lleve a la sabidura corporativa, seala
Sutherland.

A VUELTAS CON LA AVALANCHA DE DATOS


Los datos son la materia prima de cualquier prctica de anlisis de negocio. Hasta ahora eso
implicaba datos estructurados creados y almacenados por las propias organizaciones: informacin
de clientes recogida en CRMs, datos operacionales almacenados en sistemas ERP o datos financieros
almacenados en bases de datos de contabilidad. Todo esto permanece pero ahora, adems, el
volumen y los nuevos tipos de datos disponibles en las empresas y la necesidad de analizarlos
prcticamente en tiempo real para obtener de ellos el mximo valor de negocio- crece rpidamente
gracias a la popularizacin de las redes sociales como Facebook y Twitter, de los sensores y
dispositivos de red generadores y captadores de seales, de las transacciones on line y de otras
fuentes de datos no estructurados y semi estructurados. Big Data en estado puro.

Investigaciones de The Economist Intelligence Unit y de


McKinsey Global Institute, revelan que durante 2011 se
rozaron los dos zettabytes (1 zettabyte = 1024 exabytes)
de datos creados en el mundo. En la prxima dcada el
nmero de servidores que tendr que gestionar el capital
de datos mundial podra multiplicarse por diez. Cada da
se envan en el mundo 294.000 millones de emails. Una
compaa como Wal-Mart procesa ms de un milln de
transacciones cada hora y posee bases de datos con una
capacidad estimada de 2,5 petabytes. Las cifras son tan
inabarcables como las distancias del universo, pero ah
estn, componiendo la materia prima ms valiosa de las
organizaciones.
Big Data puede llegar a ser el activo ms decisivo de una
organizacin o una de sus obligaciones ms costosas, todo depende
de las estrategias y soluciones que se pongan en marcha a corto
plazo para afrontar el ingente crecimiento del volumen, la
complejidad, la diversidad, y la velocidad de los datos. Como
veremos, es una tendencia importante para las organizaciones y
sus procesos de toma de decisiones, pero en absoluto afectar de
la misma forma a todas las firmas y sectores, explica Manuel
ngel Mndez, analista asociado de Penteo y autor del
documento Big Data: humo o reto corporativo?
Segn The Economist Intelligence Unit, el 53% de las
firmas con una estrategia eficiente de gestin y anlisis de
datos obtuvieron mejores resultados de negocio frente a solo
el 36% que asegura no tener esa estrategia establecida.
Por qu? Porque la mejora en la segmentacin y calidad
de la informacin revierte en el descubrimiento de necesidades,
identificacin de problemas, automatizacin de la toma de
decisiones y el aumento de la transparencia, aade Manuel
ngel Mndez en el documento de Penteo arriba
mencionado.
La gestin de datos tradicional y las herramientas de
anlisis de negocio se revelan como limitadas bajo el peso

aadido de Big Data y por ello estn surgiendo nuevas


aproximaciones que ayuden a las compaas a obtener un
conocimiento aplicable al negocio.
La transicin no va a ser sencilla para muchas
organizaciones, pero aquellas que acometan la tarea y
abracen Big Data como los pilares de sus prcticas de
anlisis de negocio podrn obtener ventajas competitivas
relevantes frente a rivales ms tmidos. Big Data
combinado con sofisticados mtodos de anlisis tiene el
potencial de ofrecer a las empresas un conocimiento sin
precedentes del comportamiento de los consumidores y de
las voltiles condiciones del mercado. Esto les permitir
tomar decisiones basadas en las evidencias que plantean los
datos y ser ms eficaces que su competencia.
Datos tradicionales

BIG DATA

Gigabytes/Terabytes

Petabytes/Exabytes

Centralizados

Distribuidos

Estructurados

Semiestructurados-desestructurados

Modelo de datos estable

Carencia de esquemas

Interrelaciones complejas

Ausencia de relacin

Desde la tecnologa de servidores de almacenamiento


que soporta el procesamiento de Big Data hasta las
herramientas de visualizacin del front-end, el surgimiento
del fenmeno tambin implica grandes oportunidades para
los fabricantes de hardware, desarrolladores de software y
proveedores de servicios.
En esta lnea, Big Data se perfila, adems, como la nueva
fuente de ventajas competitivas para todos los sectores.
Las organizaciones y los fabricantes de tecnologa que
enfoquen esta prctica como una moda pasajera se exponen
a quedarse atrs y pronto se vern a s mismos imitando a
rivales con mayor capacidad de pensar un paso ms all.

Previsiones para el mercado de Big Data 2012-2017


(en miles de millones de dlares)
$60.0

$53.4
$48.0

$50.0

Mercado de Big Data 2011. Ingresos por segmento.


Total: 5.200 millones de dlares

Servicios: 44%
Hardware: 31%

$40.0

Software:25%

$32.1
$30.0
$20.0

$16.8
$10.0

$5.1

$10.2

$0.0
2012

2013

2014

2015

2016

2017

Fuente: Wikibon , 2012

Con V de volumen, variedad y velocidad


La explosin de la Web como vehculo comercial y de
relacin, la rapidsima difusin de la telefona y los
dispositivos mviles y de otras tecnologas paralelas ha
provocado un cambio fundamental en la naturaleza de los
datos. Ahora ms que nunca, los datos estn dispersos,
distribuidos, ligeramente estructurados, su volumen se
dispara cada vez ms y hay que saber encontrarles el valor.
Tras identificar y filtrar los elementos valiosos de Big
Data stos se relacionan con informacin estructurada,
enriquecindola. Los datos estructurados seguirn
residiendo en estructuras de almacenamiento de alta
densidad (bases de datos relacionales) y continuarn siendo
la base de las operaciones de la empresa. As lo hacen los
grandes jugadores de Social Media: extraer el valor de Big
Data y almacenarlo en estructuras relacionales para ponerlo
en valor e integrarlo en los procesos de negocio
Cuatro uves definen a Big Data:
Volumen: La cantidad de datos creada tanto dentro de las
organizaciones como detrs del firewall corporativo a travs
de la web, dispositivos mviles, sensores, infraestructura de
TI y otras se incrementa exponencialmente cada ao.
Variedad: La variedad de tipos de datos tambin se
diversifica, ya se trate de datos no estructurados basados en
texto, semiestructurados como los provenientes de social
media o los de informacin basada en la localizacin.
Velocidad: La velocidad a la que se crean nuevos datos
y la necesidad de analticas en tiempo real para extraer
valor de ellos, se incrementa gracias a la inmediatez de las
transacciones, a la informtica mvil y al creciente nmero
de usuarios de Internet y de dispositivos mviles.
Valor: El valor econmico de los datos vara
significativamente. Siempre hay informacin valiosa oculta
entre enormes cantidades de datos no tradicionales y el
reto reside en identificar aquellos datos que tienen valor,

Fuente: Wikibon , 2011

transformarlos y extraerlos para su anlisis. Para obtener el


mximo valor de Big Data, las organizaciones deben hacer
evolucionar sus infraestructuras de TI de cara a soportar
el ratio de entrega de volmenes extremos de datos de
distintos tipos, integrarlos con los datos corporativos y
proceder a su anlisis.

Fuentes de Big Data: de dnde proceden los


datos?
Big Data se nutre de una serie de fuentes que incluyen, de
forma general:
Redes y medios sociales: Segn Mc Kinsey Global Institute,
existen actualmente ms de 900 millones de usuarios de
Facebook , 500 millones de seguidores de Twitter y casi
200 millones de blogs pblicos. Cada actualizacin de un
perfil de Facebook, cada tweet, cada post y cada comentario
de cada blog crea, a su vez, mltiples nuevos datos.
Dispositivos mviles: IDC apunta a que existen alrededor
de 5.000 millones de telfonos mviles en uso en todo el
mundo. Cada llamada, cada texto de cada mensaje queda
registrado a modo de datos. Los dispositivos mviles,
especialmente los smart-phones y las tablets, tambin
facilitan el uso de las redes sociales, al tiempo que utilizan
otras aplicaciones generadoras, a su vez, de ms datos.
Adems, los dispositivos mviles recogen y transmiten
datos de localizacin.
Transacciones va Internet: Miles de millones de compras
online, operaciones burstiles y otro tipo de transacciones
se suceden cada da. Cada una de ellas genera una serie
de datos que son recogidos por tiendas, bancos y agencias
crediticias, entre otros.
Sensores y dispositivos de red: los dispositivos electrnicos
de todo tipo (incluyendo servidores y otras clases de
sistemas de hardware, contadores inteligentes y sensores de
temperatura) crean datos de registro semiestructurados que
dejan constancia de cada accin.

PARA QU BIG DATA?


APLICACIONES REALES DE UN CONCEPTO
La razn de que Big Data sea tan atractivo y poderoso es porque permite a las organizaciones
encontrar respuestas a cuestiones que ni siquiera se haban planteado preguntarse. Esto puede
generar descubrimientos que lleven a nuevas ideas para incorporarlas a los productos o servicios o
que ayuden a identificar la manera de mejorar las cuestiones operativas.

En este momento, existen varias prcticas de utilizacin


de Big Data tanto en gigantes de la web como Google,
Facebook o LinkedIn como en compaas ms tradicionales.
Estos son, segn Wikibon y Mc Kinsey Global Institute,
algunos ejemplos de las aplicaciones que pueden drsele a
Big Data. Aunque segn ambas compaas de anlisis, la
mayora est an por descubrir.
Motores de recomendaciones: los gigantes de la Web y
los vendedores online utilizan Hadoop para recomendarse
entre ellos o para aconsejar a los clientes sobre otros
productos y servicios que podran interesarles a partir
del anlisis del perfil de usuario y de su comportamiento
online. LinkedIn utiliza este enfoque para reforzar su
apartado Gente que podras conocer y Amazon hace lo
propio para sugerir productos relacionados con una compra
concreta a los consumidores online.
Anlisis de sentimientos: utilizadas en conjuncin con
Hadoop, las herramientas de anlisis de texto avanzadas
analizan el texto no estructurado de las redes sociales
(tweets y posts de Facebook), para determinar los
sentimientos de los usuarios en relacin a marcas, empresas
o productos concretos.
Modelizacin del riesgo: las compaas del sector
financiero utilizan Hadoop y los data warehouses de
prxima generacin para analizar grandes volmenes de
datos transaccionales y determinar el riesgo al que estn
expuestos sus recursos, adems de para prepararse ante
futuros escenarios basados en situaciones de mercado
simuladas.
Deteccin del fraude: utiliza tcnicas Big Data para
combinar el comportamiento de los clientes y los datos
histricos y los transaccionales para detectar actividades
fraudulentas. Las compaas de tarjetas de crdito, por
ejemplo, utilizan tecnologas de Big Data para identificar
comportamientos transaccionales que indican que podra
estar utilizndose una tarjeta robada.
Anlisis de campaas de marketing: los departamentos
de marketing de todos los sectores utilizan desde hace
largo tiempo la tecnologa para monitorizar y determinar
la efectividad de las campaas de marketing. Big Data
permite a los equipos de marketing incorporar mayores
volmenes de datos de granularidad incremental, como
datos sobre el flujo de clicks de un usuario o los detalles
de registro de una llamada para aumentar la precisin del
anlisis.

Anlisis de abandono de clientes: las compaas utilizan


Hadoop y tecnologas Big Data para analizar los datos
relacionados con el comportamiento de los clientes para
identificar patrones que indiquen qu cules de ellos son
ms susceptibles de abandonar la compaa en favor de
un producto o servicio de la competencia. De ese modo,
pueden tomarse medidas para evitar el abandono de clientes
valiosos.
Anlisis de influencia social: los datos provenientes de
redes sociales se analizan para determinar qu usuarios
tienen mayor influencia sobre otros dentro de los social
media. Esto ayuda a las compaas a determinar quienes
son sus clientes ms importantes, que no son siempre los
que ms productos consumen o ms dinero gastan, sino
los que poseen una mayor capacidad de influencia sobre el
comportamiento de compra del resto.
Anlisis de experiencias de cliente: las organizaciones
que trabajan de cara al pblico utilizan las prcticas de Big
Data para integrar la informacin previamente recogida
proveniente de canales de interaccin con los clientes como
call centers, chats online, Twitter, etc. Para obtener una
visin completa de la experiencia de cliente. De ese modo,
las empresas pueden comprender el impacto que tiene un
canal de interaccin con los clientes sobre otro de cara a
optimizar el ciclo de vida completo de la experiencia de
cliente
Monitorizacin de la red: Hadoop y otras tecnologas
relacionadas con Big Data tambin se utilizan para
atrapar, analizar y desplegar datos recogidos de servidores,
dispositivos de almacenamiento y otros tipos de hardware
para permitir a los administradores monitorizar la actividad
de red y diagnosticar cuellos de botella y otros problemas.
Este tipo de anlisis puede aplicarse tambin a otro tipo
de redes, incluyendo las de transporte para, por ejemplo,
mejorar la eficiencia del combustible.
Investigacin y desarrollo: organizaciones como las
farmaceticas utilizan Hadoop para peinar enormes
volmenes de investigaciones basadas en textos y otros
datos histricos que puedan contribuir al desarrollo de
nuevos productos.

APLICACIONES DE BIG DATA POR Y PARA LOS DISTINTOS SECTORES

Banca y finanzas

Sanidad

Servicios de proteccin de marca


Proteccin ante riesgos y fraude
Servicios personalizados a clientes
Bsqueda de patrones de uso de productos financieros
Marketing personalizado
Creacin de servicios basados en la localizacin

Sector Pblico










Servicios de inteligencia, defensa y proteccin: control


de comunicaciones, vigilancia, intercepcin de redes de
telefona, acumulacin de todo tipo de datos
Proteccin de la flota pesquera
Vigilancia, seguridad y sealizacin
Localizaciones por GPS
Deteccin del fraude
Control de presupuestos pblicos
Proteccin de la infraestructura pblica
Proteccin contra el maltrato
Proyectos de Smart Cities

Monitorizacin remota de pacientes


Localizacin de emergencias
Almacenamiento de historias clnicas, radiografas,
escneres y todo tipo de pruebas de forma centralizada
Elaboracin de estadsticas alrededor de incidencias de
determinadas enfermedades por zonas concretas
Acercamiento de la asistencia a domicilio
Investigacin clnica: estudios de medicamentos,
ensayos clnicos, genoma humano

Retail-Gran Consumo







Las prcticas de explotacin de Big data son el ncleo


de su negocio desde hace muchos aos por encima de las
aplicaciones transaccionales
Control de la cadena de fabricacin
Anlisis del ticket de compra
Marketing personalizado
Identificacin por radiofrecuencia (RFID) en
centros comerciales

Turismo

Utilities

Optimizacin de precios
Generacin de ofertas personalizadas
Anlisis de sentimientos

Smart Metering: interpretacin de contadores


inteligentes en todas las casas
Control de la red comunicaciones, de tuberas, red del
metro
Proyectos de sealizacin de tramos de mantenimiento

Telecomunicaciones
Control de la red
Venta de servicios de localizacin
Servicios de publicidad asociados al patrn de llamadas
o las aplicaciones descargadas
Obtencin de perfiles de consumidor enriquecidos
Explotacin de RFID para segmentar y personalizar
ofertas
Anlisis de abandono, riesgo y fraude en clientes
Satisfaccin y lealtad de clientes
Anlisis de CDR (Call Data Record) o registro de
llamada

Web y Digital Media


Anlisis de click and stream
Personalizacin
Forecasting y optimizacin

SMART CITIES, un captulo aparte


La poblacin mundial es mayoritariamente urbana.
As lo asegura el estudio de Naciones Unidas World
Urbanization Prospects que, entre otras conclusiones,
muestra cmo ha evolucionado la tendencia del ser humano
a agruparse en ciudades. Si en 1950, la poblacin urbana
del planeta era del 51% del total, actualmente el ndice es
del 71% y creciendo: hasta un 84% hacia la mitad del siglo
XXI.
La concentracin en ncleos urbanos y el desarrollo de los
mismos trae consigo la definicin de un nuevo modelo
de ciudad que permita desarrollarse sosteniblemente
optimizando todos sus recursos y conformando un entorno
humano para sus ciudadanos.
Nace as el concepto de Smart Cities, en el que mltiples
organizaciones pblicas y privadas pertenecientes a
diversos sectores trabajan para definir ese modelo de
ciudad inteligente que es necesario perfilar. La tendencia
es mundial pero justamente en Espaa ha alcanzado una
notoriedad especial y as qued recogido en el informe
elaborado por IDC sobre Smart Cities espaolas en 2011.

Al margen de fijar una clasificacin de ciudades segn


su grado de inteligencia, el informe de la consultora
ha revelado que los ncleos urbanos espaoles han de
avanzar en sus modelos de desarrollo y gestin para crear
los pilares de un futuro ms sostenible que contemple al
ser humano como centro. El soporte de las tecnologas
El soporte de las tecnologas de la
informacin, especialmente del anlisis
extremo de datos, seales y transacciones
es el elemento crucial del que obtener la
informacin de referencia para permitir que se
desarrollen las ciudades inteligentes. Big Data
aplicado a la habitabilidad, la sostenibilidad y
la convivencia ciudadana.
de la informacin, especialmente del anlisis extremo de
datos, seales y transacciones es el elemento crucial del que
obtener la informacin de referencia para permitir que se
desarrollen las ciudades inteligentes. Big Data aplicado a la
habitabilidad, la sostenibilidad y la convivencia ciudadana.

MATRIZ DEL NDICE DE CIUDADES INTELIGENTES DE ESPAA


Alto
Mlaga
Santander

Barcelona

Elche

Madrid

Dimensiones de inteligencia

Hospitalet
de Llobregat

Santa Cruz
de Tenerife

Cartagena

Mstoles

Sevilla

Almera

Murcia

Vitoria-aGasteiz

Crdoba

Alicante

Pamplona
/Irua

Gijn
Alcal de
Henares

Fuenlabrada

Zaragoza

Burgos

San
Cristobal de
la Laguna

Castelln de
la Plana

Logroo

Oviedo

Bilbao

Corua (A)

Palma de
Mallorca

Valencia
Getafe
Granada

DonostiaSan
Sebastan

Albacete
Valladolid

Leganes
Jerez de la
Frontera

Salamanca

Badalona

Alcorcon

Badajoz

Vigo
Las Palmas
de Gran
Canaria

Sabadell

Bajo

Fuerzas capacitadoras

Dbil

Cinco primeros

10 aspirantes

Jugadores activos

Para IDC, las ciudades inteligentes hacen un uso intensivo


de las TIC para transformar su manera de operar en
apartados como medio ambiente, energa, servicios
pblicos, trfico o construccin. Mlaga, Barcelona,
Santander, Madrid y San Sebastin abren el ranking de
inteligencia urbana gracias a estas iniciativas:
1) Mlaga: despliegue de una iniciativa de ciudad ecolgica
y eficiente a partir de la integracin en la red elctrica de
fuentes de energa renovables.
2) Barcelona: adopcin de soluciones de movilidad en el
transporte urbano mediante el proyecto LIVE (Logstica per
a la Implementaci del Vehicle Elctric).
3) Santander: desarrollo del proyecto SmartSantander,
basado en el despliegue de 20.000 sensores dirigidos al
control medioambiental en aspectos como el trfico, la
gestin de los residuos y la eficiencia en el transporte
pblico.
4) Madrid: creacin del Centro Integrado de Servicios de
Emergencia (CISEM), capaz de coordinar todos los servicios
de urgencia.
5) Donostia-San Sebastin: despliegue del proyecto
Estrategia 2020, que contempla aspectos como personas y
valores, ciudad conectada y vivir y disfrutar.

Fuerte

Seguidores

Aunque suene a iniciativa en beneficio del ciudadano y


eso le confiere un carcter bsicamente pblico, hay varios
organismos privados involucrados en el desarrollo de
proyectos de Smart Cities. Tal es el caso de BBVA, muy
implicado en el concepto desde su centro de Innovacin
que, a su vez, colabora con el Senseable City Lab del MIT
(Massachusetts Institute of Technology).
Los objetivos van en la lnea de buscar nuevos enfoques
de uso de todos los datos de carcter no personal que
proceden de las transacciones de pago y de las retiradas de
efectivo. Tambin intenta comprender cmo las personas se
relacionan con las ciudades analizando sus interacciones con
los distintos tipos de comercios.
En BBVA buscamos, igualmente, evaluar las
posibilidades de prediccin que estos anlisis tienen
sobre comportamientos futuros. Combinando los datos de
transacciones con otras fuentes de informacin se podrn
aadir nuevas perspectivas y desplegar nuevos servicios que
repercutan en la calidad de los espacios urbanos, comenta
Elena Alfaro, gerente en el rea de Business Discovery y
experta en Smart Cities de BBVA.

Unos cuantos tecnicismos que hay que conocer

Otra forma de hacer las cosas:


los nuevos modos de procesamiento y anlisis que trae Big Data
Existen varias aproximaciones para afrontar el procesamiento y anlisis de Big Data, pero la mayora
comparten algunas caractersticas comunes. Bsicamente, se benefician de hardware estndar que
permite implantar tcnicas de procesamiento paralelo y escalabilidad; emplean capacidades de
almacenamiento no relacional de cara a procesar datos no estructurados y semi estructurados y
aplican tecnologas avanzadas de anlisis y visualizacin de datos a Big Data para extraer elementos
de comprensin a los usuarios finales.

Wikibon, una comunidad profesional de intercambio de


conocimiento que aborda cuestiones tecnolgicas aplicadas
a la resolucin de retos de negocio, ha identificado dos
aproximaciones a Big Data que transformarn los mercados
de la gestin de datos y las analticas de negocio: Hadoop y
los data warehouses de nueva generacin.
Hadoop puede definirse como un entorno de cdigo abierto
para procesar, almacenar y analizar cantidades masivas
de datos distribuidos y no estructurados. Doug Cutting
de Yahoo! fue quin cre el entorno que, a su vez, estaba
inspirado en MapReduce, una funcin desarrollada por
Google a principios de 2000 para indexar la web.
Hadoop se dise para soportar petabytes y exabytes de
datos distribuidos en mltiples nodos en paralelo. Los
clusters de Hadoop operan en hardware estndar que no
requiere grandes inversiones de modo que los proyectos
pueden escalar sin afectar presupuestariamente a las
organizaciones. En estos tiempos de rigor presupuestario,
la opcin de entrada en Big Data que se plantean algunas
empresas espaolas con las que hemos hablado del concepto
es empezar a investigar y a adentrarse en Hadoop para
identificar la utilidad que podra tener en un futuro,
comenta scar Alonso, analista de Penteo.

En ocasiones veo elefantes amarillos


Actualmente Hadoop se encuadra como un proyecto
de la Apache Software Foundation, en el que cientos de
participantes mejoran continuamente el ncleo de la
tecnologa. Qu tiene de especial este entorno conocido
a travs de su icnico elefante amarillo? Hay un concepto
fundamental en relacin a l: en lugar de procesar un
enorme bloque de informacin cada vez, Hadoop segmenta
Big Data en mltiples partes, de modo que pueden
procesarse y ser analizadas al mismo tiempo.

Un cliente accede a datos no estructurados y


semiestructurados desde distintas fuentes. Secciona
los datos en partes, que se cargan a continuacin en
un sistema de ficheros de mltiples nodos. El fichero
almacenado por defecto en Hadoop se denomina Hadoop
Distributed File System o HDFS. Los sistemas de archivo
como HDFS resultan adecuados para almacenar grandes
volmenes de informacin de cualquier naturaleza que
no requieren datos ni instrucciones para organizarse en
columnas o tablas relacionales.

Cada parte se replica mltiples veces y se carga en el


sistema de ficheros de modo que si un nodo falla, otro
dispone de una copia de los datos que se encontraban
en el nodo que fall. Lo que se conoce como Name
Node acta como facilitador, comunicando de vuelta al
cliente informacin como, por ejemplo: qu nodos estn
disponibles en el cluster, en qu lugar del cluster reside un
determinado dato y qu nodos han fallado.
Una vez que el dato se ha cargado en el cluster ya est listo
para ser analizado por el entorno MapReduce. El cliente
pone en marcha, entonces , la tarea de Map (normalmente
una query escrita en Java) en uno de los nodos en el cluster
conocido como Job Tracker. ste se relaciona con el Name
Node para determinar a qu datos necesita acceder para
completar la tarea y en qu lugar del cluster se encuentran.
Una vez determinados, el Job Tracker transfiere la query
a los nodos relevantes. En lugar de devolver todos los

datos a una localizacin central para su procesamiento, dicho


procesamiento sucede en cada nodo simultneamente o en
paralelo. Esta es una caracterstica esencial de Hadoop.
Cuando el nodo termina de procesar una determinada
tarea, almacena los resultados. El cliente inicia entonces un
trabajo de Reduce a travs del Job Tracker en el que los
resultados de la fase de Map almacenados localmente en
nodos individuales se agregan para determinar la respuesta
a la consulta original, para despus cargarse en otro nodo
del cluster. El cliente accede a esos resultados que pueden
cargarse despus en uno o varios entornos de anlisis. De este
modo se completa la tarea MapReduce.
Hadoop se dise para soportar petabytes y
exabytes de datos distribuidos en mltiples
nodos en paralelo. Los clusters de Hadoop
operan en hardware estndar que no requiere
grandes inversiones.

Una vez que la fase MapReduce se complete, los datos


procesados estn listos para un anlisis ms detallado por
parte de los Cientficos de datos que poseen habilidades
avanzadas de anlisis de datos. Los Cientficos de datos
pueden manipular y analizar los datos utilizando una o
varias herramientas para mltiples propsitos como la
bsqueda de conocimiento o de patrones ocultos para
utilizarlos como pilares en la construccin de aplicaciones
analticas concretas. Los datos pueden tambin
modelarse y transferirse desde clusters de Hadoop a
las bases de datos relacionales existentes, a los data
warehouses o a cualquier otro sistema de TI tradicional
para un anlisis ms detallado o para soportar los procesos
transaccionales.

Unos cuantos tecnicismos que hay que conocer

Otra forma de hacer las cosas:


los nuevos modos de procesamiento y anlisis que trae Big Data

Algunas de las mentes ms brillantes del sector de TI


estn contribuyendo con su experiencia al proyecto Apache
Hadoop y una nueva generacin de desarrolladores de
este entorno y de Cientficos de datos est empezando
a despuntar. Como resultado, la tecnologa avanza
rpidamente y se transforma en un elemento ms poderoso
y sencillo de implementar y mantener.
Algunas de las mentes ms brillantes del
sector de TI estn contribuyendo con su
experiencia al proyecto Apache Hadoop y
una nueva generacin de desarrolladores de
este entorno y de Cientficos de datos est
empezando a despuntar. Como resultado,
la tecnologa avanza rpidamente y se
transforma en un elemento ms poderoso y
sencillo de implementar y mantener.

Mltiples sabores
Igualmente, un gran nmero de fabricantes ha desarrollado
sus propias distribuciones de Hadoop, la mayora basadas
en la de cdigo abierto de Apache pero con distintos niveles
de personalizacin propietaria. El claro lder de mercado
en trminos de distribucin es Cloudera, una start-up de
Silicon Valley con un equipo de primera lnea de expertos
en Big Data que incluye al propio creador de Hadoop,
Doug Cutting, y a Jeff Hammerbacher, anterior mago del
anlisis de datos de Facebook.
En paralelo, otras start-ups de ltima generacin empiezan
a perfeccionar bases de datos NoSQL que, combinadas con
Hadoop, son capaces de descubrir patrones prcticamente
en tiempo real.

Principales bloques tecnolgicos para


establecer una estrategia Big Data segn Penteo
Bases de datos e infraestructura. Dotarse de bases de datos
e infraestructura potente es fundamental en un entorno de
Big Data. Ms all de los tradicionales sistemas de gestin
de bases de datos relacionales (RDBMS, en sus siglas en
ingls), se requieren bases de datos con capacidades de
procesamiento y almacenamiento extremas, sistemas OLAP
multidimensionales y bases de datos basadas en memoria
voltil (in-memory). La virtualizacin de servidores,
almacenamiento y desktop suele ser tambin necesaria
para acelerar la gestin de datos y hacerla escalable, y otros
componentes como aceleradores de aplicaciones y redes o
bases de datos distribuidas, son tambin clave.

Middleware y aplicaciones. La actualizacin del middleware


y aplicaciones en un entorno de Big Data es menos
exigente que en el apartado de infraestructura. Muchos de
los proveedores tradicionales de herramientas de ETL o
de middleware de integracin de datos, estn adaptando
ya sus soluciones. A nivel de aplicaciones, sin embargo,
el software de visualizacin no est tan maduro aunque se
trata de mdulo fundamental para sacarle partido al anlisis
de millones de datos.
Opciones de software libre. Durante el ltimo ao se
ha hablado mucho de la capacidad de herramientas de
software libre como Apache Hadoop para gestionar grandes
volmenes de datos. Cada vez ms compaas utilizan esta
y otras opciones de software libre para experimentar cmo
almacenar, gestionar y analizar grandes cantidades de datos.
Una de las claves para entender las implicaciones del Big
Data es que no importa tanto el volumen de los datos o
la rapidez con la que se generan como el valor en s de la
informacin y la complejidad de extraer valor de la misma.
Fuente: Big Data: humo o reto corporativo?, Penteo 2011

Buscando desesperadamente al cientfico de


datos
Los datos no van a hacer ms que crecer y crecer. En cifras
de IDC, el volumen de informacin que se cre, captur
y replic en 2010 fue de 1,8 millones de petabytes, cifra
que implica un aumento del 125% en relacin a 2009.
Las previsiones a largo plazo apuntan a que en 20 aos
el volumen de datos habr crecido un 1.845% respecto a
2010, alcanzando el astronmico volumen de 35 millones
de petabytes.
McKinsey Global Institute relaciona el aumento del
volumen de informacin con la demanda de expertos
en extraer valor de los datos y asegura que en 2018
habr un desfase de entre el 50-60% entre demanda de
talento analtico para acometer proyectos y la oferta real
de profesionales preparados para abordar tal tarea. Esto
quiere decir que sern necesarios alrededor de 490.000
profesionales para disear estrategias Big Data en Estados
Unidos pero que tan slo habr 300.000 para cubrir la
demanda. Ver grfico
Muchas necesidades futuras y pocos expertos presentes,
as lo resume Miguel Galera en una entrada de TICbeat,
mientras que Michal Lev-Ram, periodista de Fortune
exhortaba en septiembre de 2011: Si encuentra algn
cientfico de datos: contrtelo.

Parece que la de cientfico de datos ser la carrera del


futuro. El trmino, desconocido hasta hace ao y medio, se
dispara como entrada de bsqueda en Google, un indicador
siempre claro del inters de un concepto. En el ltimo
trimestre de 2011 y 2012, alcanz picos 20 veces superiores
a los de los mismos periodos del ao anterior.
La necesidad de expertos en anlisis extremo: hasta
un 60% por encima de la oferta real de profesionales.
Escenario: Estados Unidos, 2018
Oferta y demanda de profesionales con capacidades analticas en 2018.
En miles de personas
140-190

1803

440-490

300
50-60% de
desfase entre
demanda de
talento
analtico y la
oferta real.

150

Profesionales Universitarios con


empleados en capacidades de
2008
anlisis extremo

OtrosP

rofesionales
cualicados en
analtica
extrema en
2018

Desfase

Profesionales
cualicados para
cubrir la demanda
prevista en 2018

Perfiles demandados: Estadsticos, cientcos cuantitativos, analistas,


managers con enfoque y
experiencia cuantitativa y tcnicos expertos en software y lenguajes de
programacin de anlisis de datos.

Fuente: Oficina de Estadstica de Empleo de Estados Unidos;


Censo de EE.UU.; Dun & Bradstreet; McKinsey Global Institute

Para Jaime Garca Cantero, analista independiente,


las capacidades del as llamado cientfico de datos se
concretaran en un perfil mixto que integre conocimientos
tecnolgicos con comprensin del negocio. El CIO (Chief
Information Officer) ha acabado por estar vinculado a la
parte ms puramente tecnolgica, lo que le convierte ms
en un CTO (Chief Technology Officer). Para entender la
naturaleza y magnitud de Big Data se necesitara una figura
nueva: el Chief Data Officer capaz de entender la naturaleza
de los datos y organizarlos y explotarlos para obtener un
impacto positivo.
Ante la brecha entre demanda de talento analtico y
profesionales actuales expertos en la lgica de Big Data,
Garca Cantero opina que no queda ms remedio que
adaptarse a lo que la realidad impone. Los analistas de
datos tradicionales son ms bien matemticos, estadsticos,
economistas. Trabajan con modelos ms que con tecnologa
pura y dura porque lo que importa son las reglas de
negocio. Ahora habr que ponerle un plus de inteligencia
por encima para que ese anlisis de datos se integre en las
reas de marketing, comunicacin, ventas

De la teora a la prctica

BIG DATA EN LAS ORGANIZACIONES ESPAOLAS


Para compaas como Google, Facebook o LinkedIn la explotacin de los datos es el ncleo de su
actividad y han sido pioneras en hacer de la acumulacin de informacin un activo de rentabilidad
casi infinita. Pero y el resto? Las organizaciones recogen las tendencias tecnolgicas a veces
mucho antes de que analistas y medios especializados se encarguen de difundirlas. Estos ltimos
dan nombre a prcticas que ya ejecutaban las empresas como parte de la evolucin de negocio o
como modo natural de buscar ventajas competitivas. En el caso de Big Data, algunas organizaciones
ya lo practicaban orgnicamente pero no le haban puesto nombre, de modo que la adopcin del
fenmeno est en curso pero hay pocos ejemplos totalmente contrastados y aquilatados tanto a
escala global como en Espaa.

En una sesin organizada por Penteo con 15 empresas


espaolas de distintos tamaos y sectores que facturan ms
de 100 millones de euros al ao, qued registrado que las
organizaciones estn impregnadas de la idea de crear valor a
partir de los datos. En Espaa estamos en un momento de
curiosidad hacia el concepto pero con dudas razonables. Las
empresas espaolas muestran inters hacia la explotacin
de Big Data, pero es difcil sustraerse a los rigores del
momento econmico que limita los presupuestos de TI,
comenta scar Alonso, consultor de la firma de anlisis
Penteo.
Las principales cuestiones que se
plantean las empresas con las que hemos
hablado en relacin a Big Data son: es
aplicable y factible en mi organizacin?,
cunto me cuesta? Y quin me ayuda a
implantarlo?
scar Alonso,
analista de Penteo
Las principales cuestiones que se plantean las empresas
con las que hemos hablado en relacin a Big Data son: es
aplicable y factible en mi organizacin?, cunto me cuesta?
Y quin me ayuda a implantarlo?, explica Alonso.
Para Jaime Garca Cantero, analista independiente, Big
Data trae un cambio en los modelos de gestin de las
organizaciones que ahora pasaran a ser compaas que
toman sus decisiones basndose en lo que les dicen los
datos. Los egos corporativos se diluyen. Las decisiones
tienen que venir avaladas por datos que las justifiquen y
esto es un cambio de mentalidad importante.
Por su parte, scar Alonso asegura que todas las
compaas con las que han hablado del concepto entienden
la necesidad de sacar partido de sus datos a la misma
velocidad que su propia proliferacin impone y que cada

una aplica la explotacin de sus datos segn su naturaleza


sectorial. En lneas generales, retail, gran consumo,
banca, telco y sector pblico son las actividades que ms
rpidamente ven los beneficios de la aplicacin de Big Data
y que ms dinamismo muestran a la hora de adoptarlo.
Hay ejemplos de proyectos concretos pero an son muy
pocos y pasar tiempo antes de que las empresas los den a
conocer abiertamente.
Garca Cantero est de acuerdo en la enorme potencialidad
de Big Data en segmentos como banca (clculo de riesgo,
percepcin de marca), telecomunicaciones (control de
la red, anlisis de abandono, riesgo y fraude en clientes,
satisfaccin y lealtad de clientes) sector pblico (fraude
fiscal, control del gasto, smart cities) y gran consumo.
Aun as, el analista cree que es pronto para hablar de
experiencias consolidadas pero que, al ser una prctica
que tiene que ver ms con el negocio, es probable que el
ritmo de adopcin sea ms rpido que si se tratase de un
asunto puramente tecnolgico. Hay ejemplos conocidos
de explotacin de datos como en el caso de R Cable, la
operadora gallega de telecomunicaciones, que ha generado
un agregador de datos en su contact center para tener
una visin nica de cliente: su facturacin, productos y
servicios, incidencias.
En cuanto al tamao de las organizaciones ms receptivas,
scar Alonso, comenta que con Big Data sucede lo mismo
que con los proyectos de inteligencia de negocio: en un
principio se asociaban a gran cuenta pero su utilidad es
aplicable a cualquiera. Basta con tener volumen de datos
y querer hacer uso de ellos. De hecho, empiezan a aparecer
muchas start-ups en las que la explotacin intensiva de los
datos es la regla principal de su negocio. No hay que ser
una firma del IBEX 35 para sacarle partido a esta prctica.

Cmo hacerlo?
scar Alonso aade que el momento econmico no es
fcil y los presupuestos de TI estn congelados, cuando no
se han reducido. Lo que s hemos visto es que, al tratarse
Hadoop de un entorno OpenSource algunas compaas estn
derivando recursos humanos a investigar este entorno y a
aproximarse a su utilizacin.
De entre las compaas a las que Penteo tiene acceso existe
una compaa de retail de gran consumo que sin denominar
Big Data a su modo de explotar la informacin, lleva tiempo
aplicando el anlisis de datos para recoger y relacionar lo que
se dice de ellos en las redes sociales integrndolo en el BI
tradicional. Esta compaa tiene un grupo de analistas que
pueden considerarse autnticos cientficos de datos: personas
con perfiles matemticos-estadsticos con una visin y unos
conocimientos de negocio muy intensos. La recomendacin
de Penteo a las organizaciones es empezar a buscar ya mismo
ese talento analtico que requiere este tipo de proyectos.

La banca gana
Hay pocos ejemplos concretos de inicio y desarrollo de
prcticas de Big Data y mucha discrecin a la hora de hablar
de ellos por parte de sus responsables, ya se trate de personal
tcnico o de profesionales ligados al negocio. La prudencia
se impone. Aun as, algunos representantes de empresas
espaolas de varios sectores s que muestras sus experiencias
en encuentros y foros profesionales o valoran a ttulo
personal el concepto y las iniciativas de sus organizaciones
en la explotacin de Big Data.
Manuel Gmez Burriel, de Sistemas Centrales de la
Confederacin Espaola de Cajas de Ahorros (CECA) opina
que el concepto Big Data viene de tiempo atrs, sobre
todo desde el momento que surge la necesidad de manejar
informacin no estructurada. Hasta ahora, los gestores de
bases de datos clsicos han ido incorporando, con ms o
menos funcionalidades, los datos tipo LOB y XML, pero
siguen apareciendo nuevas necesidades de accesos analticos
a informacin no estructurada. La valoracin positiva
del impacto en el negocio vendr determinada, como es
habitual, por el retorno de la inversin estimada para
proveer el servicio.

Acerca de qu usos de Big Data que ayudasen a mejorar


el negocio podran ser relevantes en su organizacin,
Gmez Burriel slo observa el posible requerimiento de
cantidades ingentes de informacin para los servicios que
deben conservar datos a lo largo del tiempo, por razones o
imperativos legales y/o de auditora.
Para un profesional de TI de otra entidad financiera
espaola que prefiere no identificarse, Big Data no es
una prctica completamente nueva: el tratamiento de la
informacin no estructurada lleva realizndose hace varios
aos, lo que ha cambiado realmente es la cantidad de
informacin a almacenar y procesar, as como las fuentes
diversas que la originan. Este crecimiento es exponencial
y en estos momentos desconocemos cual ser el techo, si es
que algn da llega a tenerlo.
Disponer de informacin masiva permite
prever mejor dnde es necesario suministrar
la energa y eso se traduce en ser ms
eficiente, ms fiable y, en consecuencia,
mejorar econmicamente. En un mercado
desregulado hay que competir por los
clientes. Hace unos aos, el crecimiento
de la construccin trajo en paralelo un
incremento del despliegue de agua, energa,
luz nueva, gas... Pero la fiesta se acab.
Ahora peleamos por los clientes y estamos
obligados a ser ms eficientes, a ser
mejores.
Rafael Blesa,
Responsable de Arquitectura y BI y de Gestin del
Software SSII de Gas Natural/Fenosa
Otro hecho diferenciador es la velocidad de acceso
a la informacin a la que nos hemos acostumbrado.
Necesitamos la informacin ya, de forma inmediata.
Si combinamos estos aspectos, Big Data si es un nuevo
concepto. Estn justificadas las inversiones? Pues
depender de las necesidades del negocio, y debe ser este
rea de la compaa quien decida su rentabilidad o no.
Lo que parece indudable, es que el futuro nos lleva a
trabajar con este concepto, por lo que de una forma u otra
tendremos que evolucionar en este sentido.

De la teora a la prctica

BIG DATA EN LAS ORGANIZACIONES ESPAOLAS

Mundo Telco
El sector de las telecomunicaciones es uno de los que ms
potencial podra extaer de las prcticas relacionadas con Big
Data.
Ana Lled Tarradell, directora de Productos y Diseo de
Soluciones de BT Espaa, valora el fenmeno en toda su
amplitud: Big Data se ha convertido en un autntico
desafo para las empresas en los ltimos dos o tres aos:
inmensa y creciente generacin de datos que se acumulan
cada da y que hay que gestionar de la manera ms eficiente
posible con el objetivo de disponer de informacin como
ventaja competitiva. En este contexto, la eclosin de las
redes sociales, donde cada individuo interacta y genera
mucha informacin, ha venido a evidenciar ms si cabe la
necesidad de abordar soluciones prcticas.

Big Data trae un cambio en los modelos


de gestin de las organizaciones que ahora
pasaran a ser compaas que toman sus
decisiones basndose en lo que les dicen
los datos. Los egos corporativos se diluyen.
Las decisiones tienen que venir avaladas por
datos que las justifiquen y esto es un cambio
de mentalidad importante
Jaime Garca Cantero,
analista independiente
Para Lled, volumen, variedad y velocidad constituyen
el algoritmo comn que comparten las empresas para
enfrentarse a la gestin del ingente volumen de informacin
acumulado. La bsqueda del difcil equilibrio entre
anlisis y parlisis, es decir, qu y cuntos datos analizar
para obtener informacin de autntico valor para la
empresa, es el dilema al que se enfrentan. Y todo ello en
mercados que cambian cada vez ms rpidamente y con

normas regulatorias en algunos de ellos que obligan a


almacenar los datos durante tiempo prolongado aunque no
se utilicen, contina la directora de Productos y Diseo de
Soluciones de BT Espaa.
De modo ms concreto, la directiva de la compaa de
telecomunicaciones comparte la experiencia y planes de
su firma en relacin a Big Data: Como operador, BT
analiza los datos del trfico de voz y datos de sus clientes
para dimensionar sus propias redes segn la geografa y
la demanda de capacidad e incluso para disear ofertas
especficas. Este anlisis, le permite tambin la gestin
idnea de las necesidades de sus clientes colaborando
directamente con ellos en la optimizacin de sus redes y
sistemas teniendo en cuenta sus necesidades de trfico,
transacciones, almacenamiento e incidencias segn la
estrategia de uso. Al no estar en Espaa orientados al
mercado residencial, y a pesar de que el volumen de datos
que se generan es enorme y sigue creciendo, BT contina
en disposicin de manejar la informacin de sus clientes
con un mayor grado de personalizacin.
Continuando en el segmento de las telecomunicaciones,
el 1004 de Telefnica es un ejemplo concreto de prcticas
de Big Data a travs de modelos predictivos. Durante
una jornada de difusin del concepto organizada en
ESADE Por Bayes Forescast bajo el epgrafe Big Data y
modelos de prediccin en marketing y operaciones, el
Gerente de Atencin al Cliente en Telefnica, Javier Falc,
comparti la experiencia de su organizacin explotando
sus datos y utilizando modelos de prediccin que ayudan
a diagnosticar, explicar y prever y que producen un
impacto muy positivo en la optimizacin de los procesos
productivos y en los ahorros de costes.
En su ponencia Falc explic que el nmero de atencin a
sus clientes, el conocido 1004, utiliza modelos predictivos
para determinar el nmero de llamadas que recibir el
servicio cada vez que se lanza una campaa. Actualmente,

el 1004 realiza un plan de operaciones mensual y otro


trimestral y en enero de 2012 lleg a atender 14 millones
de llamadas.
Para Telefnica, el 1004 ha sido siempre su canal
fundamental de ventas. Cada vez que se programa una
campaa, se invita a los posibles clientes a contratar el
servicio en el 1004 y los responsables de gestin tenemos
la responsabilidad de determinar los picos de llamadas,
de garantizar que un cliente va a ser atendido, de trabajar
junto al equipo de previsiones de cara a cumplir las
expectativasEn este punto, los modelos predictivos
resultan de una utilidad vital.

La valoracin positiva del impacto en


el negocio vendr determinada, como es
habitual, por el retorno de la inversin
estimada para proveer el servicio
Manuel Gmez Burriel,
Sistemas Centrales de la Confederacin
Espaola de Cajas de Ahorros (CECA)

Posteriormente, y de cara a los aspectos comerciales, se


miden los efectos de las acciones de marketing masivo
(prensa, televisin, sms, cartas, email ), el marketing
de emisin (inbound o llamadas por efecto de la accin
comercial) y la factura.
En su intervencin, Falc tambin seal que una variable
muy interesante y necesaria es la del comportamiento del
cliente. No es lo mismo el comportamiento de un usuario
que ha comprado la promocin en una tienda, a travs del
call center o a travs de telemarketing de emisin. Es muy
importante identificar los patrones asociados al lugar y
momento donde se ha generado una venta.

De la teora a la prctica

BIG DATA EN LAS ORGANIZACIONES ESPAOLAS

Energa concentrada
El conocido como sector Utilities, generador y distribuidor
de energas y servicios bsicos (luz, gas, agua, gasolina,
petrleo) vive un momento marcado por tendencias como
las Redes Inteligentes, el Smart Metering, la entrada
de nuevos actores y distribuidores en el mercado, la
atomizacin de las operadoras y las inversiones congeladas.
Esto se une a las propias tendencias del mercado de TI que
propone prcticas como Big Data, soluciones de movilidad
y la convergencia de las tecnologas de la informacin con la
esencia del negocio.

Big Data representa una vuelta a las viejas


prcticas del mainframe. Las estrategias
tecnolgicas, como sabemos, son cclicas
y ahora toca consolidar. Particularmente,
defiendo una posible inversin, aunque al
principio no veamos un impacto directo
en el negocio. Su impacto sera ms bien
indirecto, de cara a minimizar los riesgos
tcnicos que tienen el hardware y software
distribuido entre n-mil empresas
Mario Sanz Mayor,
Equipo de plataformas de Middleware de Barclays

Como resultado del cruce de tendencias, las estrategias


tecnolgicas del rea Utilities enfatizan el uso de la
explotacin de tecnologas de informacin geogrfica que
minimicen el impacto en el medio ambiente, la utilizacin
de soluciones en la Nube y las capacidades ampliadas de
gestin de activos.
Adems, las compaas de energa asumen un riesgo
importante: se trata de servicios bsicos y el desprestigio de
imagen y de marca que se sucede a un mal servicio o a un
servicio caro es difcilmente recuperable.
Rafael Blesa, Responsable de Arquitectura y BI y de
Gestin del Software SSII de Gas Natural/Fenosa, opina
que disponer de informacin masiva permite prever mejor
dnde es necesario suministrar la energa y eso se traduce en
ser ms eficiente, ms fiable y, en consecuencia, mejorar
econmicamente.

En un mercado desregulado hay que competir por los


clientes. Hace unos aos, el crecimiento de la construccin
trajo en paralelo un incremento del despliegue de agua,
energa, luz nueva, gas... Pero la fiesta se acab y la
economa va para atrs. Ahora nos peleamos por los clientes
con compaeros como Endesa o Iberdrola y estamos
obligados a ser ms eficientes, a ser mejores.
Para ello, Blesa entiende que es necesario optimizar las
campaas que se lanzan desde Gas Natural/Fenosa: hay
que afinar la direccin de las acciones para calar mejor en
los pblicos objetivos y obtener un mayor xito: llegar con
la oferta adecuada, organizar campaas menos masivas y
ms dirigidas a segmentos concretos. Esa es una demanda
del negocio y desde el punto de vista de sistemas tenemos
que proveer ms informacin, en perodos mucho ms
cortos. Se necesita informacin y se necesita para analizarla
YA.
En el caso de su organizacin, Blesa comenta que se trata de
aprovechar la informacin de los clientes y sus patrones de
consumo pero que tambin es necesario incorporar fuentes
externas: informacin demogrfica, geogrfica-geodsicageoespacial, metereolgica, de impacto medioambiental
y sin olvidar la influencia de las redes sociales en la
reputacin de la compaa.
Big Data trae un cambio en los modelos
de gestin de las organizaciones que ahora
pasaran a ser compaas que toman sus
decisiones basndose en lo que les dicen
los datos. Los egos corporativos se diluyen.
Las decisiones tienen que venir avaladas
por datos que las justifiquen y esto es un
cambio de mentalidad importante
Jaime Garca Cantero
Analista independiente
Hay muchas soluciones interesantes que estamos
evaluando actualmente que espero nos ayuden. La barrera,
como casi siempre es el coste. Los proyectos no resultan
baratos y tenemos que estar seguros que la aplicacin
justifica la inversin en un momento en que todo se
cuestiona, concluye el Responsable de Arquitectura y BI
de Gas Natural/Fenosa.

Gran Consumo
Tambin en la Jornada sobe Big Data y modelos predictivos
aplicados al marketing y operaciones, Massimiliano
Marinucci, Director de Marketing de Estrategia y
Productividad de Coca Cola comparti la experiencia de la
que es, quizs, la marca global por excelencia con el uso de
las tcnicas predictivas a partir del anlisis masivo de los
datos.

el valor que verdaderamente tiene. Los modelos favorecen


la comunicacin objetiva. Ya no se trata de decir: el ao
pasado hizo calor y por eso vendimos ms. Vamos a analizar
el aumento de temperatura y lo vamos a cuantificar. As se
acaba con la diatriba tipo: fue el calor frente a no, fue mi
marketing.

Marinucci inici su intervencin con una frase pronunciada


en 1887 por John Wanamaker, considerado el padre de la
publicidad moderna y pionero de las tcnicas de marketing
: Ya s que la mitad del dinero que empleo en marketing
no tiene ningn efecto. El problema es que no s de qu
mitad se trata.

BT analiza los datos del trfico de voz y


datos de sus clientes para dimensionar
sus propias redes segn la geografa y
la demanda de capacidad e incluso para
disear ofertas especficas. Este anlisis, le
permite tambin la gestin idnea de las
necesidades de sus clientes colaborando
directamente con ellos en la optimizacin
de sus redes y sistemas teniendo en cuenta
sus necesidades de trfico, transacciones,
almacenamiento e incidencias segn la
estrategia de uso

Con ella, el directivo de Coca Cola pretenda enfatizar


la necesidad de entender de dnde vienen las ventas y
los factores que influyen en ellas en un deseo de prever,
planificar y mejorar la productividad. En ese sentido, los
modelos predictivos creados tanto globalmente como en
nuestro pas pueden considerarse un ejemplo de innovacin
y desarrollo.
Nos interesa analizar los datos porque necesitamos
entender, diagnosticar, saber de dnde vienen nuestras
ventas o los factores que han influido en ellas Si
aadimos la capacidad de previsin de los modelos a su
habilidad para entender lo que est pasando, el resultado
es que los modelos tambin podrn utilizarse de cara a la
planificacin. Otra razn ms que potente para modelizar
es el dinero que invertimos en publicidad: Utilizamos los
modelos para mejorar la productividad de nuestras acciones
de marketing. A travs de la diagnosis podemos mover los
recursos de un lado para otro segn la productividad.
Los modelos explican qu motivaciones influyen en el
negocio, de dnde vienen las ventas, cmo contribuye cada
elemento al crecimiento o a los volmenes de venta por
ao y, de ese modo pueden identificar cul sera la inversin
ptima en acciones de marketing y publicitarias.
De modo muy grfico, Marinucci relat que los modelos
generan controversia en los departamentos de marketing.
Por ejemplo el hecho de demostrar que gran parte del
aumento de ventas no se debe al marketing sino a factores
externos como una mayor tasa de crecimiento de pases en
vas de desarrollo. En ese sentido, los modelos ayudan a
redimensionar la aportacin de cada elemento y a darle

Ana Lled Tarradell,


directora de Productos y Diseo de Soluciones de BT Espaa
Para el directivo de Coca Cola un asunto importante es
cmo se reciben estas prcticas de anlisis extremo de datos
y aplicacin de modelos predictivos. Segn Marinucci el
punto fundamental es que los altos cargos entiendan su
beneficio y utilidad que se den cuenta de que se trata de
una prctica que les va ayudar a tomar decisiones y a valorar
los riesgos de cara al futuro.

Jaime Garca Cantero


Analista independiente
@jaimegcantero

BIG DATA: MUCHO MS QUE INFORMACIN


Transacciones financieras y ventas en tiempo real, medidas de sensores en las cadenas de
fabricacin, localizacin de nuestra flota de distribucin u opiniones de los clientes en las redes
sociales. Nuestras organizaciones manejan en la actualidad una cantidad ingente de informacin. Su
anlisis hace posible una nueva manera de gestionar las organizaciones que el profesor del MIT Erik
Brynjolfsson define como DDD (Data Driven Decision) que permite a las organizaciones ganancias de
productividad de entre un 5 y un 6 % (Brynjolfsson, 2011).

Figura 1: Facilidad y Potencial de la


implantacin de Big Data en los diferentes
sectores

UTILIDAD DE BIG DATA POR SECTORES

Datos de la economa estadounidense


El tamao del crculo indica la contribucin relativa al PIB
Alto

Big Data: facilidad para capturar datos

Big Data, unnimemente incluida entre las


tendencias del ao por todos los analistas y
consultoras, es el conjunto de herramientas,
procesos y aptitudes que van a permitir
la gestin de estas enormes cantidades de
informacin para mejorar los resultados
de nuestras organizaciones. Sin duda el
impacto de Big Data y la complejidad de su
implantacin dependen en gran media de la
organizacin concreta, pero prcticamente
todos los sectores pueden verse beneficiados
como muestra la figura 1 en un ejercicio
realizado por Mckinsey para el mercado de
EEUU.

Utilities
Recursos naturales

Servicios
sanitarios

Informtica de consumo
Informacin

Fabricacin

Finanzas y seguros

Transportes

Servicios profesionales

Inmobiliarias

Industria alimentaria

Gestin de empresas
Gran Consumo

Construccin
Servicios administrativos

Retail

Otros servicios

Sector Pblico

Servicios educativos
Arte y entretenimiento

Bajo

Alto

Big Data: valor potencial de utilizacin

La explosin de la informacin.
Un estudio de investigadores de La Universidad del Sur
de California publicado en la revista Science en Mayo de
2011, cifraba la informacin digital almacenada en el ao
2007 en todo el mundo en ms de 276,000 millones de
Gigabites, unas 13,800 veces la informacin almacenada 20
aos antes (Figura 2). Segn este estudio menos del 9% de
toda esa informacin est almacenada en servidores. Lejos
de frenarse, este crecimiento sigue acelerndose y dicho
estudio prev que la informacin generada en 2020 sea 50
veces la originada en 2011. Fuentes menos acadmicas pero
que dan cifras ms actualizadas, como la consultora IDC
cifran en 1,8 Zettabytes la informacin generada en 2011.
Si tratramos de almacenar esa informacin en Ipads (de

los caros, de los de 32GB) necesitaramos 57.500 millones.


Con ellos puestos unos al lado de otro formaramos una
lnea que dara 3 veces la vuelta al mundo y si tratramos
de apilarlos, la montaa resultante sera 25 veces ms alta
que el monte Fuji.
Estas magnitudes macro tienen su reflejo micro, y la
informacin gestionada y almacenada por las organizaciones
tambin alcanza cifras espectaculares, Google procesa al da
20 Petabytes de Informacin y el CERN en Ginebra genera
40 terabytes por segundo. Pero no slo estos gigantes
manejan ingentes cantidades de informacin. Segn la
consultora Mckinsey, en 15 de los 17 sectores econmicos
analizados, la empresa americana media de ms de 1.000

2007 ANALOGICO

18,86 Gigabytes
Papel, pelculas, cintas de msica y vinilos: 6,2%
Cintas de vdeo analgicas: 93,8%

ANALOGICO

Otros medios digitales: 0,8%*


Discos duros porttiles: 2,4%

DIGITAL

CDs y Minidisks: 6,8%

Discos duros de servidores y mainframes: 8,9%

Cintas digitales: 11,8%

1986 ANALOGICO

2,62 Gigabytes
DVD/Blu-ray: 22,8%

DIGITAL

0,02 Gigabytes
POTENCIA DE COMPUTACIN

En 1986, las calculadoras de bolsillo recogan la mayor parte de la potencia de


procesamiento de datos mundial
Porcentaje de potencia de procesamiento disponible por dispositivo
Calculadoras

Ordenadores personales

41%

Consolas de
videojuegos

33%
66%

Discos duros de PC: 44,5%

Servidores

9%

17%

25%

3%

6%

Superordenadores 0,3%

*Tarjetas con chip integrado, tarjetas de memoria,


disquetes, cmaras de telfonos mviles y PDAs,
videojuegos

Telfonos mviles, PDAs

Figura 2: La explosin de la informacin

2007 DIGITAL

276,12 Gigabytes

Mucho ms que informacin


empleados almacena en sus bases de datos ms de 235
Terabytes de capital informativo (cantidad de informacin
almacenada en la biblioteca del congreso de los EEUU,
considerada una de las mayores del mundo).
Pero esto slo es el principio, la anunciada llegada de
Internet de las cosas, en la que multitud de objetos
cotidianos estn dotados de ojos y orejas que les
permiten ser conscientes del entorno que les rodea
(context awareness), de su posicin geogrfica (location
awareness) y su entorno. Este entorno que distintos autores
denominan de formas diferentes: Web squared (OReilly,
2009), Pervasive computing (Weiser, 1993) o Everyware
(Greenfield, 2006). Supone que el futuro de Internet es
su encuentro con el mundo real. Una ingente cantidad de
nueva informacin formar una piel digital que cubrir
el mundo fsico y abrir nuevas oportunidades para
organizaciones privadas y pblicas.

Sin embargo la informacin no es la parte crtica en


el proceso de adopcin de Big Data, casi todas las
organizaciones disponen ya de informacin suficiente o les
resultara relativamente sencilla su captura. El problema
es la transformacin organizacional y de los procesos y la
inteligencia de negocio que permita sacar conclusiones de
esa informacin. En esto es crtico entender que el perfil
de los usuarios de la informacin est cambiando. Si antes
esta pareca patrimonio de los departamentos financieros y
por supuesto del CIO, hoy son los directivos de marketing
y operaciones quienes se estn convirtiendo en los usuarios
ms intensivos de la misma. Por eso es fundamental
para el xito de las iniciativas de Big Data una buena
sincrona entre la capa de negocio y la infraestructura
tecnolgica subyacente. Las TI son sin duda la herramienta
imprescindible para llevar a cabo cualquier proyecto de Big
Data pero es el conocimiento de negocio el que determinar
el xito de la misma.

Fran Rosillo
Experto en gestin de crisis
Director General
Aleph Comunicacin
www.alephcom.es

BIG DATA,
METEOSAT DE LA GESTIN DE CRISIS
La capacidad de generar y difundir informacin de modo instantneo se ha disparado especialmente
desde la llegada de los social media. Resulta muy difcil gobernar y canalizar las opiniones de
un pblico cada vez ms amplio que se expresa libremente sobre cualquier asunto y difunde sus
valoraciones con una capacidad de influencia en aceleracin constante.
Qu hacer desde las organizaciones para evitar que se produzcan crisis de reputacin o de cualquier
clase? Cmo volver en su favor el uso de las redes sociales analizando y valorando los datos que en
ellas se generan?

El mercado de las Tecnologas de la Informacin tiene un


nuevo mantra: Big Data. Puede parecer increble, pero se
estima que el 90% de los datos mundiales se ha generado
en los ltimos dos aos. Adems, el 80% de ellos no son
estructurados, es decir, no estn integrados en bases de
datos al uso, por lo que nicamente el 20% est disponible
para ser analizado en sistemas tradicionales.
Cmo distinguir el polvo de la paja?
Cmo identificar opiniones que pueden
llegar a tener influencia?
As pues, contamos con gran cantidad de informacin,
enormemente valiosa, pero la gran mayora de las
compaas incluso las lderes- todava no han articulado
sistemas punteros de gestin de informacin para
cocinarla y obtener slidos puntales para la toma de
decisiones, puesto que sus tecnologas tradicionales de TI se
quedan cortas.

Adems, tampoco se aprecia un decidido respaldo por


parte de algunos CEOs, que siguen reticentes con respecto
al valor que Big Data puede aportar a sus negocios.
Naturalmente, tambin ellos son conscientes de que la
popularidad de los social media y la multiplicacin de
los dispositivos electrnicos han sido en buena parte
responsables de esa masiva generacin de datos que ha
provocado un cambio radical, dado que hoy en da a
diferencia de aos atrs- tanto los consumidores como
los negocios generan e interaccionan con informacin
dispar. Y sin embargo, an no se atreven a apostar clara
y decididamente por un cambio de paradigma a nivel
tecnolgico y estratgico.
IDC prev que en 2012 el volumen del contenido digital
llegar a alcanzar los 2,7 ZB, un 48% ms que en 2011,
cifra que en 2015 se disparar hasta los 8 ZB. Lo curioso
es que la propia analista reconoce que estos datos estn
repletos de una valiossima informacin, pero todava
constituyen un reto que debemos comprender y analizar.

Todo el mundo opina


Aun as, en medio de este complejo contexto, en el que las
cifras ingentes llegan a escapar a nuestra comprensin, se
siguen situando las personas. S, gente de carne y hueso,
que vive, lucha, ama, tiene hijos, celebra cumpleaos, visita
otros pases, encuentra trabajo, lo pierde y consume
millones de productos a lo largo y ancho del planeta.
Al igual que actualmente es ms sencillo
difundir por cualquier confn del mundo
un argumento, un rumor o una consigna,
las actuales tecnologas proporcionan
las herramientas suficientes como para
detectarlos a tiempo y prepararse para el
combate. Todo es cuestin de clasificar,
procesar, analizar y escuchar lo que nos dice
Big Data.
Ahora ms que nunca, estas personas expresan su opinin.
No es que antes no la tuvieran; los libros de Historia
estn repletos de las consecuencias de esos pareceres. La
diferencia es que ahora cuentan con medios fciles, baratos,
inmediatos y sumamente cmodos para expresarlas y
difundirlas a nivel mundial.
Habr quien piense que esto provoca las crisis, pero no es
del todo cierto. Revoluciones, manifestaciones, cadas en
desgracia, derrocamientos, modas, rumores y cambios de
tendencia en la opinin pblica han sido una constante
desde que el hombre es hombre, lo que ocurre es que hoy
todo eso sucede instantneamente.
Ahora bien, tambin los gestores de las crisis contamos
con la misma ventaja que sus protagonistas o impulsores.
Al igual que actualmente es ms sencillo difundir por
cualquier confn del mundo un argumento, un rumor o
una consigna, las actuales tecnologas proporcionan las
herramientas suficientes como para detectarlos a tiempo y
prepararse para el combate. Todo es cuestin de clasificar,
procesar, analizar y escuchar lo que nos dice Big Data.
El abanico de posibilidades que se abre es prcticamente
inimaginable y su origen es la digitalizacin de la
informacin y la trazabilidad digital, porque no olvidemos

que todas nuestras huellas y acciones en el mundo online


pueden ser analizadas. Todo este volumen de informacin
interconectado, analizado y explotado proporciona un
detalle nunca antes imaginado.
Pero para poder gestionarlo debemos estar sumamente
preparados, porque a veces las seales que lanzan las redes
cuando algo no marcha bien se producen tenuemente y
con la rapidez de un tweet; en cuestin de minutos la
chispa puede encenderse y en apenas unas horas nos
encontraramos con una bonita crisis. Cmo distinguir el
polvo de la paja? Cmo identificar opiniones que pueden
llegar a tener influencia?
Hoy ms que nunca, las marcas no tienen el control sobre
los consumidores. Slo cuando el compromiso es real y las

En una segunda fase, deberamos ser capaces


de identificar cul fue el origen del problema,
las reas de la compaa implicadas, los
fallos cometidos y qu puntos dbiles tena
nuestra estrategia. Para ello, una vez ms, los
resultados procedentes del anlisis de Big Data
equivaldran a oro puro.
tecnologas las adecuadas pueden las empresas identificar
sus errores y reaccionar a tiempo, al igual que cuando el
hombre del tiempo anuncia lluvias torrenciales la gente
prepara sus casas. Es entonces cuando podramos ser capaces
de atajar un rumor incipiente, o responder a una queja
que tiene razn de ser, es decir, gestionar adecuadamente
una crisis en las redes sociales y adems apuntarla en
nuestro haber: sumar puntos para la marca en trminos de
confianza, en definitiva.
De cualquier modo, nuestro trabajo no habra acabado.
Comenzara una segunda fase, en la que deberamos ser
capaces de identificar cul fue el origen del problema, las
reas de la compaa implicadas, los fallos cometidos y qu
puntos dbiles tena nuestra estrategia. Para ello, una vez
ms, los resultados procedentes del anlisis de Big Data
equivaldran a oro puro.

ENTREVISTA

Andrew Sutherland,
Vicepresidente Senior de Tecnologa para
Europa, Oriente Medio y frica de Oracle

Big Data es el viga capaz de optimizar los procesos de una


organizacin al estar pendiente y vigilante de los cambios de
tendencia
Qu diferencias o matices hay entre Big Data y otras
prcticas consolidadas como el data warehouse, la
inteligencia de negocio, las herramientas estadsticas o
los sistemas de gestin de relacin con los clientes?

Por qu The Beatles tuvieron tanto xito y tan


rpido? Tras aos de Beatlemana, Beatleloga y
pginas y pginas escritas sobre la clave del fenmeno
de los cuatro de Liverpool parece que todo puede
destilarse en una premisa bien simple: el xito de los
Beatles era que estaban tan cerca de su pblico, que
el reflejo y la identificacin era inmediato. Cmo
pueden las organizaciones estar cerca de su pblicoaudiencia-consumidor-ciudadano? Segn Andrew
Sutherland, Vicepresidente Senior de Tecnologa para
Europa, Oriente Medio y frica de Oracle, Big Data
tiene la respuesta. Slo hay que encontrar el camino
adecuado, despejar la maleza, ver el bosque y cada
rbol, cada rama, cada hoja y saber interpretar qu
significa.
Qu beneficios puede aportar Big Data a las
organizaciones?
Si uno entiende la utilidad de las aplicaciones de negocio,
entiende entonces los beneficios de Big Data. Bsicamente
hablamos de una prctica que aspira a aadir valor de forma
rpida a una organizacin, encontrando las oportunidades
de nuevas fuentes de ingresos. Cuando le das valor de
negocio a los proyectos de TI, todo el mundo gana. Se
obtienen ventajas competitivas, se incrementan las ventas,
se aumenta la sabidura corporativa, la inteligencia
colectiva. Eso es siempre bueno.

Histricamente, en la primera generacin de las


aplicaciones de negocio las soluciones estaban muy
centradas en la automatizacin de los procesos. En la
segunda generacin, la inquietud iba por otro lado. No
se trata slo de automatizar procesos, sino tambin de
encontrar el modo de automatizar los cambios en los
procesos: la flexibilidad era la clave. Los procesos cambian,
evolucionan, es fundamental entender esto.
Hay que conocer la realidad del cliente. Big
Data permite hacer ajustes a los procesos,
que no son inamovibles, ya lo estamos
viendo, y obtener mayores beneficios en el
negocio
Big Data aporta la visin sobre cmo podran cambiar esos
procesos a raz de los indicios que estn recogindose de la
realidad?
Efectivamente. Valora la direccin a la que nos dirigimos
y ayuda a reconducir el rumbo si fuera necesario. Es el
viga capaz de optimizar los procesos de una organizacin
al estar pendiente y vigilante de los cambios de tendencia.
Algo de lo que somos muy conscientes es que ya pasaron
los das de la cultura del puro producto en una direccin.
Hay que conocer la realidad del cliente. Big Data permite
hacer ajustes a los procesos, que no son inamovibles, ya lo
estamos viendo, y obtener mayores beneficios en el negocio.

LA ESTRATEGIA DE ORACLE EN BIG DATA


Sistemas preconstruidos con hardware,
software y comunicaciones integrados
que se puedan conectar directamente.
El Big Data Appliance es el ejemplo ms
representativo.
Herramientas de productividad y de
desarrollo alrededor de creaciones
OpenSource como Hadoop o MapReduce.
La conexin con los sistemas tradicionales
es fundamental. Oracle ofrece conectores
que automatizan las transformaciones
necesarias para procesar la informacin
en origen, dotando de la estructura
necesaria a la parte que se desea integrar
con la informtica tradicional.

Funciona de manera proactiva-positiva o slo sirve


para corregir?
Big Data ofrece la posibilidad de analizar con mayor
precisin lo que est cambiando. Tiene valor predictivo,
de identificador de tendencias y desviaciones de lo que
se daba por bueno. Va a un nivel intenso y profundo
de granularidad en el entendimiento de nuestras
organizaciones. Es anlisis extremo.

Big Data ofrece la posibilidad de analizar


con mayor precisin lo que est cambiando.
Tiene valor predictivo, de identificador de
tendencias y desviaciones de lo que se daba
por bueno. Va a un nivel intenso y profundo
de granularidad en el entendimiento de
nuestras organizaciones. Es anlisis extremo
Por qu llamamos datos no estructurados a los
que provienen de nuevas fuentes y canales si estn
perfectamente estructurados en s mismos?
No se trata tanto de una cualidad de los propios datos
sino del mtodo que usamos para analizarlos. Un dato es
estructurado porque la manera de capturarlo, almacenarlo,
organizarlo y analizarlo cumple unos parmetros
estructurados, concretos, alineados con unas prcticas
contrastadas, validadas y automatizadas. Los datos no
estructurados relacionados con Big Data se denominan as
porque la forma de gestionarlos y obtener valor de ellos no
responde a un patrn tan rgido en trminos de estructura,
ordenamiento y seguridad.

Qu ofrece Oracle alrededor de Big Data?


Nuestra estrategia se apoya en tres aspectos. El primero
es ofrecer sistemas preconstruidos con hardware, software
y comunicaciones integrados que se puedan conectar
directamente. El Big Data Appliance es el ejemplo ms
representativo. En segundo lugar, ofrecemos herramientas
de productividad y de desarrollo alrededor de creaciones
OpenSource como Hadoop o MapReduce. Muchas de
las empresas Fortune 500 quieren adoptar la tecnologa
OpenSource porque es buena, est muy probada, no tiene
coste y es muy escalable, pero no quieren hacerlo sin un
soporte de tipo empresarial, sin un gran sponsor detrs.
Cuando se deciden las arquitecturas corporativas los
clientes esperan una lgica de distribucin, mecanismos de
soporte bien establecidos. El elemento de soporte es crtico,
la integridad de la distribucin es bsica. En el caso de Big
Data las mejores herramientas (Hadoop, MapReduce)
para el manejo masivo de informacin ya existen en clave
OpenSource y junto a Cloudera, la principal empresa que se
dedica a soluciones Big Data basadas en Hadoop, vamos a
ofrecer nuestra garanta de continuidad y soporte.
En tercer y ltimo lugar, la conexin con los sistemas
tradicionales es fundamental. Para ello Oracle ofrece
conectores que automatizan las transformaciones necesarias
para procesar la informacin en origen, dotando de la
estructura necesaria a la parte que se desea integrar con la
informtica tradicional.

Big Data y su impacto en el negocio


Una aproximacin al valor que el anlisis
extremo de datos aporta a las organizaciones
Mayo 2012
Autor: Ana Garca Huerta
Diseo e ilustraciones: Ivn Ords Ayuga
Oracle Espaa
C/ Jos Echegaray 6B
Las Rozas
28230 Madrid
Telf. 900992922 | 900952900
http://www.oracle.com/bigdata

Oracle is committed to developing practices and products that help protect the environment
Copyright 2012, Oracle and/or its affiliates. All rights reserved. This document is provided for information
purposes only and the contents hereof are subject to change without notice. This document is not warranted
to be error-free, nor subject to any other warranties or conditions, whether expressed orally or implied in
law, including implied warranties and conditions of merchantability or fitness for a particular purpose. We
specifically disclaim any liability with respect to this document and no contractual obligations are formed
either directly or indirectly by this document. This document may not be reproduced or transmitted in any
form or by any means, electronic or mechanical, for any purpose, without our prior written permission.
Oracle is a registered trademark of Oracle Corporation and/or its affiliates. Other names may be trademarks
of their respective owners.

You might also like