You are on page 1of 5

No puedes administrar cuando no puedes medir

W. Edwards Deming y Peter Drucker explican porque la reciente explosin de la informacin digital
es tan importante. Simplemente, dijo, a causa de grandes volmenes de datos, los
administradores pueden medir y por tanto radicalmente saber ms acerca de sus negocios, y
directamente traducir ese conocimiento en la toma de decisiones y el rendimiento previsto.

Despus de todo, ellos han desarrollado un algoritmo para predecir cuales libros podran leer
prximamente. El algoritmo tuvo mejor resultado cuando los clientes respondian a una invitacion
o la ignoraban.
Que hay de Nuevo alli?
Los ejecutivos de los negocios a veces se preguntan "No se trata de datos grandes slo otra
manera de decir analisis?" Es verdad que estn relacionadas con: el movimiento de datos grande,
como anlisis de que dispone, trata de recoger inteligencia de datos y traducir eso en una ventaja
competitiva. Sin embargo, hay tres diferencias clave:
Volumen: En el 2012, cerca de 205 exabytes de datos son creados cada dia, u el numero se dobla
cada 40 meses o mas. Mas datos cruzan el internet cada segundo de lo que fue almacenado en
todo internet hace 20 aos. Esto les da la oportunidad a las compaias para trabajar con muchos
petabytes de datos en un almacenamiento mas pequeo y no de internet. Se estima que Walmart
colleciona mas de 2.5 petabytes de datos cada hora de las transacciones de sus clientes. Un
petabyte es un cuatrillon de bytes, o el equivalente de 20 millones de archivadores. Un exabyte es
1000 veces esa cantidad o un billon de gigabytes.

Velocidad: Para muchas aplicaciones, la velocidad de la creacin de los datos es aun mas
importante que el volumen. La informacion en tiempo real, o lo mas cercano al tiempo real es
posible para las compaias que para ser mucho mas agil que sus competidores. Por ejemplo,
nuestro colega Alex sandy Pentland y su grupo del laboratorio de la MIT usan datos de
localizacion de los moviles para deducir cuanta gente esta en el estacionamiento de Macy los
viernes negros- el comienzo de las compras de temporada navidea en Estados Unidos.
Variedad: Los datos grandes en forma de mensajes, actualizaciones e imagenes posteadas en las
redes sociales; lecturas de sensores; seales GPS de celulares y mas. Muchos de los origenes de
datos grandes son relativamente nuevos. La enorme cantidad de informacin de las redes sociales,
por ejemplo, son tan antiguas como las propias redes; Facebook fue lanzado en 2004, twitter en
2006. Lo mismo pasa con los smartphones y los otros dispositivos mviles que ahora proveen
enormes flujos de datos enlazados a personas, actividades y lugares. Por qu esos dispositivos son
omnipresentes, su facilidad para olvidar que el iphone fue presentado solo hace 5 aos y el ipad
en el 2010. Por lo tanto las bases de datos estructuradas que almacenaban las corporacines con
informacin recientemente se ajustan a almacenar y procesar datos grandes. Al mismo tiempo,
los costos disminuyen los costos de todos los elementos de la computadora- almacenamiento,
memoria, procesamiento, ancho de banda, etc. Significa que previamente los datos intensivos se
estn convirtiendo rpidamente en econmicos.
De poco en poco las actividades de los negocios son digitales, nuevas fuentes de informacin,
adicional al equipo mas barato combinados, para introducirnos en una nueva era: una en la que
las grandes cantidades de informacin digital existen en prcticamente cualquier tema de inters
para la empresa. Los celulares, compras en lnea, redes sociales, comunicacin electrnica, GPS, e
instrumentacin de maquinaria, todo produce torrentes de datos como productos de sus
operaciones ordinarias. Cada uno de nosotros esta caminando ahora en un generador de datos.
Los datos estn disponibles algunas veces sin estructuras- no organizados en una base de datos-
pero hay una enorme cantidad de ruido en la seal, simplemente esperando a ser puesto en
libertad. Los analisis trajeron tcnicas rigurosas para la toma de decisiones, los datos grandes son
a la vez ms simples y ms potentes. Como director de investigacin de Google, Peter Norving, lo
expresa as: "No tenemos los mejores algoritmos Solo tenemos ms datos.
COMO REALIZAN LAS EMPRESAS EL MANEJO DE DATOS.
La segunda pregunta de los escpticos podra ser esta: En donde esta la evidencia de que usando
la inteligencia de los datos grandes podremos implementar un rendimiento empresarial?.
la prensa econmica est llena de ancdotas y estudios de casos que supuestamente evidencian el
valor de los datos empleados. Pero la verdad, nos dimos cuenta hace poco, es que nadie est
abordando esta cuestin con rigor.
Para hacer frente a este vaco vergonzoso, se dirigi a un equipo en el Centro MIT para el negocio
digital, trabajando en asociacin con la oficina de McKinsey Technology Bussines y con nuestro
colega Lorin Hitt en Wharton y el estudiante de doctorado del MIT Heekyung Kim. Nos pusimos en
marcha para poner a prueba la hiptesis de que las empresas basadas en los datos seran mejores
intrpretes.
llevamos a cabo entrevistas estructuradas con directivos de 330 empresas pblicas de Amrica del
Norte sobre sus prcticas de gestin organizacional y la tecnologa, y reuni los datos de
rendimiento de sus informes anuales y fuentes independientes.
No todo el mundo estaba abrazando el manejo de datos para la toma de decisiones. De hecho,
encontramos un amplio espectro de actitudes y enfoques en todas las industrias. Pero en todos los
anlisis que llevamos a cabo, una relacin se destacaron: Cuantas ms empresas se caracteriza por
ser controladas por datos, mejor se realiza en las medidas objetivas de resultados financieros y
operativos.
En particular, las empresas en el tercio superior de su industria en el uso de la toma de decisiones
basada en datos fueron, en promedio, un 5% ms productivas y un 6% ms rentable que sus
competidores. Esta diferencia de rendimiento se mantuvo firme tras tener en cuenta los aportes
de mano de obra, capital, adquisicin de servicios y de las inversiones de TI tradicional. fue
estadsticamente significativa e importante econmicamente y se reflej en aumentos
mensurables en las valoraciones del mercado de valores.

Entonces, cmo son los gerentes que utilizan grandes volmenes de datos? Veamos en detalle en
dos empresas que estn lejos de Sillicon valley advenedizos. Uno de ellos utiliza un conjunto de
datos grandes para crear nuevas empresas, y el otro para recibir ms ofertas.

ETA Mejora de avin

Minutos materia en los aeropuertos. Lo mismo ocurre con la informacin precisa sobre la hora de
llegada del vuelo: Si un avin aterriza antes de que el personal de tierra est preparada para ello,
los pasajeros y la tripulacin se encuentran atrapados, y si se mostrar ms tarde de lo esperado,
el personal se encuentra inactivo, lo que eleva los costos. Por eso, cuando una gran compaa
area de EE.UU. aprendi de un estudio interno que alrededor del 10% de los vuelos en su
importante centro tena al menos 10 minutos brecha entre la hora estimada de llegada y el tiempo
real de llegada-30% tenan por lo menos un espacio de cinco minutos, decidi tomar medidas.
En ese momento, la aerolnea contaba con larga prctica de la industria de la aviacin de la
utilizacin de las ETAs proporcionados por los pilotos. Los pilotos hicieron estas estimaciones
durante su aproximacin final al aeropuerto, cuando tenan muchas otras demandas sobre su
tiempo y atencin. En busca de la mejor solucin, la aerolnea volvi a PASSUR Aerospace,
proveedor de tecnologas de apoyo a las decisiones para la industria de la aviacin. En 2001
PASSUR comenz a ofrecer sus propias estimaciones de llegada llamados servicios RightETA. Se
calculan estos tiempos, combinando datos pblicos sobre el clima, horarios de vuelo, y otros
factores con datos de propiedad de la propia empresa que ha recopilado, incluidas las fuentes de
una red de estaciones de radar pasivos que haba instalado cerca de los aeropuertos de recopilar
datos sobre cada plano en el cielo local .
PASSUR comenz con slo unos pocos de estas instalaciones, pero en 2012 haba ms de 155.
Cada 4,6 segundos se recoge una amplia gama de informacin acerca de todos los aviones que se
"ve". Esto produce una gran inundacin y constante de los datos digitales. Lo que es ms, la
empresa mantiene todos los datos que ha recogido a travs del tiempo, por lo que tiene una
inmensa cantidad de informacin multidimensional que abarca ms de una dcada. Esto permite
un anlisis sofisticado y comparacin de patrones. RightETA esencialmente funciona
preguntndose "qu pas todas las veces anteriores, que un avin se acerco a este aeropuerto
en estas condiciones? cuando en realidad lo hizo aterrizar? "
Despus de cambiar a RightETA, la aerolnea prcticamente elimino las diferencias entre los
tiempos de llegada estimados y reales. PASSUR cree que la activacin de una lnea area para
saber cuando sus aviones van a la tierra y planificar, en consecuencia, tiene un valor de varios
millones de dlares al ao en cada aeropuerto. Es una frmula simple: Utilizando los datos de
oferta conduce a mejores predicciones y mejores predicciones producen mejores decisiones.

Ms rpido, ms Promociones personalizadas.
Hace un par de aos, Sears Holdings llegaron a la conclusin de que era necesario generar un
mayor valor de las enormes cantidades de clientes, productos y datos de su forma de promocin
recogen sus Sears, Craftsman y marcas Lands 'End. Obviamente, sera valioso para combinar y
hacer uso de todos estos datos para adaptar las promociones y otras ofertas a los clientes, y para
personalizar las ofertas para tomar ventaja de las condiciones locales. Valioso, pero difcil: Sears
requiere unas ocho semanas para generar promociones personalizadas, momento en el que
muchos de ellos ya no eran ptimos para la empresa. Le tom tanto tiempo, principalmente
debido a que los datos necesarios para estos anlisis a gran escala eran voluminosos y muy
fragmentado alojada en bases de datos en mayo y "almacenes de datos" mantenidas por las
distintas marcas.
En busca de un ms rpido, mucho ms barato que hacer su trabajo analtico, Sears Holdings se
dirigi a las tecnologas y las prcticas de las grandes datos. Como una de sus primeras medidas, se
estableci un grupo de Hadoop. Esto es simplemente un grupo de productos bsicos de bajo costo
sirve cuyas actividades son coordinadas por un marco de software emergente llamada Hadoop
(nombre de un elefante de juguete en la casa de Doug Cutting, uno de los desarrolladores).
Sears comenz a usar el clster para almacenar los datos de entrada de todas sus marcas y para
almacenar los datos de los almacenes existentes. A continuacin, se realizaron anlisis en el
clster directamente, evitando las complejidades que consumen tiempo de extraccin de datos de
varias fuentes y combinacin de ellos, para que puedan ser analizados. Este cambio permiti a la
empresa a ser mucho ms rpido y ms preciso con sus promociones. Segn el CTO de la
compaa, Phil Shelley, el tiempo necesario para generar un conjunto completo de las
promociones lanzadas desde ocho semanas a una, y es hasta que caiga. Y estas promociones son
de mayor calidad, porque son ms oportuna y ms granular, y ms personalizado. Sears Hadoop
grupos almacena y procesa varios petabytes de datos a una fraccin del costo de un almacn de
datos estndar comparable.
Shelley dice que est sorprendido de lo fcil que ha sido la transicin de lo viejo a los nuevos
enfoques de gestin y anlisis de datos de alto rendimiento. Dado que las habilidades y
conocimientos relacionados con las tecnologas de los nuevos datos eran tan raros en el 2010,
cuando comenz la transicin Sears, contrat a algunos de los trabajos a una empresa llamada
Cloudera. Pero con el tiempo la vieja guardia de los profesionales de TI y anlisis se han convertido
en confort poder con las nuevas herramientas y enfoques.
El PASSUR y ejemplos de Sears Holding ilustrar el poder de grandes volmenes de datos, lo que
permite hacer predicciones ms precisas, mejores decisiones e intervenciones precisas, y puede
permitir que estas cosas a escala aparentemente ilimitada. Hemos visto grandes datos utilizados
en la gestin de la cadena de suministro para entender por qu las tasas de un fabricante de
automviles de defectos en el campo aumenta de repente en los servicios al cliente para escanear
continuamente e intervenir en las prcticas de atencin de salud de millones de personas, en la
planificacin y previsin para anticipar mejor las ventas en lnea sobre la base del conjunto de
datos de caractersticas del producto, y tambin en. Hemos visto ganancias similares en muchas
otras industrias y funciones, desde las finanzas hasta la comercializacin de los hoteles y de juego,
y de la gestin de los recursos humanos para la reparacin de la mquina.
El anlisis estadstico nos dice que lo que hemos visto no es slo algunos ejemplos llamativos sino
una transformacin ms fundamental de la economa. Hemos llegado a la conviccin de que casi
ningn mbito de la actividad empresarial se mantendr al margen de este movimiento. delgado

You might also like