You are on page 1of 10

ESTUDOS ANALTICOS DO BIG DATA

Ganhe vantagem competitiva a partir


da combinao de big data e lgica
avanada

Perspectiva da EMC

NDICE
De volta ao futuro: o advento do big data

EXPLORANDO A OPORTUNIDADE DE NEGCIOS DOS ESTUDOS ANALTICOS DO BIG DATA

Ponto 1: PROGRAMA DE COMPUTAO GIL

HABILITAR O DATA WAREHOUSING GIL

DATA WAREHOUSING E ESTUDOS ANALTICOS INTEGRADOS

Ponto 2: CAPACIDADE DE EXPANSO LINEAR

TRANSFORMAR ETL EM APRIMORAMENTO DE DADOS

DAR SUPORTE A CONSULTAS VARIVEIS EXTREMAS E CARGAS DE TRABALHO


DE ESTUDOS ANALTICOS

ANALISAR CONJUNTOS DE DADOS GRANULARES E EM GRANDE ESCALA (BIG DATA)

HABILITAR ACESSO A DADOS DE BAIXA LATNCIA E TOMADA DE DECISES

Ponto 3: EXPERINCIA DE USURIO COLABORATIVA, ONIPRESENTE E GENERALIZADA

HABILITAR UMA EXPERINCIA DE USURIO INTUITIVA E GENERALIZADA

EXPLORAR A NATUREZA COLABORATIVA

HABILITAR NOVOS APLICATIVOS DE NEGCIOS

APLICATIVOS BASEADOS EM ATRIBUIES

APLICATIVOS BASEADOS EM RECOMENDAES

APLICATIVOS PREDITIVOS/BASEADOS EM ESTIMATIVAS

APLICATIVOS BASEADOS EM PERCEPO

APLICATIVOS BASEADOS EM BENCHMARK

CONSIDERAES FINAIS

SOBRE O AUTOR

DE VOLTA AO FUTURO: O ADVENTO DO BIG DATA


Ao longo dos anos 70 e no incio dos anos 80, fabricantes e revendedores de CPG (Consumer
Package Goods, bens de consumo embalados) administravam seus negcios usando
relatrios de mercado bimestrais da AC Nielsen. Esses relatrios apresentavam dados da
concorrncia e do mercado (por exemplo, receita, unidades vendidas, preo mdio e
participao no mercado) que os fabricantes de CPG usavam para definir planos, estratgias
de vendas, marketing, promoo e publicidade e gastos com seus parceiros (por exemplo,
distribuidores, atacadistas e revendedores).
Ento, nos meados dos anos 80, a IRI (Information Resources Inc.) ofereceu-se para instalar
scanners gratuitos de POS (Point-of-sale, ponto de venda conhecido no Brasil como PDV),
em locais de revenda em troca dos dados residuais do scanner. Os revendedores ficaram mais
do que satisfeitos em fazer essa troca, j que a mo de obra era seu maior componente de
custo e a compreenso do valor dos dados do scanner de POS era limitada.
Esses dados do scanner de POS, considerados big data naquela poca, causaram uma
mudana estratgica e industrial no poder (entre os fabricantes e os revendedores) e na
maneira de ambos conduzirem seus negcios. Os volumes de dados aumentaram de
megabytes para terabytes, o que exigiu uma nova gerao de plataformas de armazenamento
e de servidores (por exemplo, Teradata, Red Brick, Sybase IQ, Sun e Sequent) e de ferramentas
de lgica (por exemplo, Metaphor, Business Objects, Informatica e MicroStrategy).
Novas categorias de aplicativos de
negcios baseados em estudos analticos:
Previso baseada em demanda
Otimizao da cadeia de fornecimento
Eficcia dos gastos no comrcio
Anlise das estatsticas do mercado
Gerenciamento e comercializao da
categoria
Otimizao de preos/rendimento
Gerenciamento de reduo de
comercializao
Programas de fidelidade de cliente

Empresas lderes, como Wal-Mart, Procter & Gamble, Tesco e Frito Lay, exploraram esse novo
big data e as novas plataformas e ferramentas de estudos analticos para obter vantagem
competitiva. Essas empresas estavam na vanguarda do desenvolvimento de novas
categorias de aplicativos de negcios orientados por lgica e big data para lidar com
problemas de negcios que no podiam ser resolvidos anteriormente de forma econmica
(consulte o grfico esquerda).
Trinta anos depois, surge mais um dj vu. H uma exploso de novas fontes de dados
diversos, com baixa latncia e alta granularidade (big data), que tm a possibilidade de
mudar o funcionamento das organizaes e dos setores. Essas novas fontes de dados so
originadas de um grupo de dispositivos, de interaes do cliente e de atividades de
negcios que revelam novas percepes nas cadeias de valores organizacionais e do setor.
O advento dessas novas fontes de dados mais detalhadas possibilitar que as organizaes
lidem com oportunidades de negcios que antes no eram possveis e levar criao de
novas famlias de aplicativos de negcios. No entanto, para que isso acontea, devem surgir
novas plataformas (infraestrutura) e novas ferramentas (estudos analticos). Este white
paper descrever a funo que essas novas plataformas podero desempenhar e discutir
os tipos de aplicativos de negcios orientados por lgica e de explorao de big data que
podero surgir.

EXPLORANDO A OPORTUNIDADE DE NEGCIOS DOS ESTUDOS


ANALTICOS DO BIG DATA
O big data requer uma nova plataforma de estudos analticos a partir da qual tanto os
negcios quanto a tecnologia possam obter vantagem competitiva. Isso requer uma nova
infraestrutura de tecnologia que (a) seja altamente dimensionvel para petabytes de dados,
(b) d suporte a acesso aos dados com baixa latncia e tomada de decises e (c) tenha lgica
integrada para acelerar os processos de modelagem e operacionalizao de lgica avanada.
A possibilidade de apresentar novas escalas de capacidade de processamento para dar
suporte a grandes conjuntos de dados permite a identificao contnua de percepes
acionveis inerentes ao big data e proporciona a integrao perfeita dessas percepes
acionveis ao ambiente de trabalho do usurio, onde quer que ele esteja. Essa nova
plataforma de estudos analticos pode liberar as organizaes das maneiras antigas de emitir
relatrios retrospectivos fornecendo estudos analticos modernos e preditivos para as massas
e aprimorando o processo de tomada de decises em todos os nveis da organizao.

PONTO 1: PLATAFORMA DE COMPUTAO GIL


A agilidade proporcionada por data warehousing altamente flexvel e reconfigurvel e por
arquiteturas de estudos analticos. Os recursos de estudos analticos podem ser rapidamente
reconfigurados e reimplementados para atender s demandas dinmicas dos negcios,
possibilitando novos nveis de flexibilidade e agilidade nos estudos analticos.
Habilitar o data warehousing gil
A nova plataforma de estudos analticos proporciona o desenvolvimento de data
warehouses sem as restries encontradas nos ambientes de TI dos dias de hoje. Hoje, as
organizaes so obrigadas a usar tcnicas de projeto artificiais e ferramentas rudimentares
de emisso de relatrios para extrair percepes de enormes e crescentes fontes de dados
usando tecnologias obsoletas de banco de dados. Conforme esses volumes de dados
continuam crescendo e novas fontes de dados so disponibilizadas on-line, as organizaes
descobrem que as arquiteturas, ferramentas e solues de hoje so muito caras, muito
lentas e muito rgidas para dar suporte a suas iniciativas estratgicas de negcios.
Considere o impacto das agregaes de pr-criao. As agregaes1 so normalmente usadas
para superar a capacidade de processamento limitada dos tradicionais RDBMS (Relational
Database Management Systems, sistemas de gerenciamento de bancos de dados relacionais)
ao lidar com junes de vrias tabelas e digitalizaes de tabelas em grande escala. Um DBA
(Database Administrator, administrador de banco de dados) calcula previamente as
agregaes mais comuns durante a preparao dos dados para acelerar o desempenho
especfico e de emisso de relatrios. O volume de dados armazenados nessas tabelas de
agregao cresce muito mais do que os prprios dados brutos. Portanto, necessrio muito
tempo para criar previamente as agregaes contidas nos SLAs (Service-Level Agreements,
contratos de nvel de servio). A explorao de feeds de gotejamento de dados para fornecer
relatrios operacionais em tempo real um sonho devido ao tempo necessrio para recriar
as tabelas de agregao sempre que novos dados gotejam no data warehouse.
A eliminao dessas limitaes proporciona um ambiente gil de data warehouse que to
flexvel e responsivo quanto os negcios que ele atende explorando os seguintes recursos:
Agregao sob demanda: no h necessidade de criar previamente as agregaes para
fornecer tempo de resposta mais rpido a consultas e relatrios. H a possibilidade de criar
agregaes em tempo real, eliminando a necessidade desgastante de recriar constantemente
agregaes toda vez que novos dados gotejam (so enviados) no data warehouse.
Independncia de indexao: os DBAs podem eliminar a necessidade de uma indexao
rgida. Os DBAs no precisaro saber com antecedncia as perguntas dos usurios para
poderem criar todos os ndices de suporte. Os usurios podem fazer perguntas detalhadas
de negcios do prximo nvel sem a preocupao com problemas de desempenho.
Criao dinmica do KPI (Key Performance Indicator, principal indicador de desempenho):
os usurios corporativos podem definir, criar e testar novos KPIs derivados (e compostos)
sem precisar envolver os DBAs para calcul-los previamente.
Estruturas flexveis, especficas e hierrquicas: as hierarquias dimensionais no
precisam ser predefinidas na criao do data warehouse. Por exemplo, durante uma
anlise de inteligncia do mercado, as organizaes poderiam ter flexibilidade para alterar
as empresas com as quais estiverem sendo comparadas.
DATA WAREHOUSE E ESTUDOS ANALTICOS INTEGRADOS
Tradicionalmente, o data warehouse e os estudos analticos residem em ambientes diferentes.
A transferncia de dados do data warehouse para o ambiente de estudos analticos tem
exigido um processo de ETL separado em que os dados so selecionados, filtrados, agregados,
pr-processados, reformatados e, em seguida, transportados para o ambiente de estudos
analticos. No ambiente de estudos analticos, os analistas de dados iniciam a criao, os
testes e o refinamento dos modelos e dos algoritmos analticos. Se, durante esse processo, os
analistas de dados chegarem concluso de que precisam de mais dados granulares e/ou
dados diferentes, eles precisaro repetir todo o processo de ETL do data warehouse. Isso pode
acrescentar dias, talvez semanas, ao processo de estudos analticos.

1
Agregaes so resumos hierrquicos ou dimensionais pr-calculados dos fatos (medidas), geralmente
definidas pela clusula SQL Group By. Por exemplo, na dimenso geogrfica, algum pode criar
agregaes para todos os fatos (por exemplo, vendas, receita, dlares de margem, porcentagem de margem
e retornos) por pas, regio, estado, cidade, municpio e cdigo postal.

Um ambiente de data warehouse e estudos analticos nico e integrado (com estudos


analticos no banco de dados) significa que os analistas de dados no precisam sair do data
warehouse para realizar os estudos analticos. Conjuntos de dados em grande escala podem
ser transferidos entre os ambientes de data warehouse e estudos analticos a taxas de
transferncia muito velozes (de 5 TB a 10 TB/hora). Isso acelera consideravelmente o
processo de anlise e facilita a integrao dos resultados dos estudos analticos de volta ao
ambiente de data warehouse e business intelligence. Por exemplo, um ambiente integrado
de data warehouse e estudos analticos d suporte aos seguintes tipos de anlise:
Subsegmentar e transferir conjuntos de dados em grande escala entre o ambiente de data
warehouse e o ambiente de estudos analticos para possibilitar a criao de reas de
segurana de estudos analticos para explorao e deteco analticas.
Examinar conjuntos de dados em grande escala no nvel mais baixo de granularidade para
indicar comportamentos, tendncias e atividades fora do comum para criar percepes
acionveis com recomendaes correspondentes.
Acelerar o desenvolvimento e os testes de diferentes cenrios de negcios para facilitar
anlises do tipo e se, anlises de sensibilidade e de risco.
Esses tipos de benefcios seriam inestimveis se integrados s tarefas dirias. Basta
perguntar a um gerenciador de distribuio que deseja que o sistema indique possveis
problemas de desempenho do fornecedor em relao a servios com menor qualidade,
conforme medido por entregas pontuais e a porcentagem de entregas completas.

PONTO 2: CAPACIDADE DE EXPANSO LINEAR


O acesso a enormes volumes de capacidade de computao significa que os problemas dos
negcios podem ser abordados de maneira totalmente diferente. Vejamos alguns exemplos em
que o dimensionamento computacional em grande escala pode causar impacto nos negcios.
TRANSFORMAR ETL EM APRIMORAMENTO DE DADOS
O ETL concentra-se na correo de erros causados pelos sistemas de origem; extrao,
traduo, limpeza, definio de perfis, normalizao e alinhamento de todos os dados para
garantir que os usurios estejam fazendo comparaes adequadas em suas anlises. Com a
capacidade de processamento disponvel para ETL (alm de aproveitar a disponibilidade de
novas linguagens computacionais, como Hadoop), o processo de ETL tradicional pode ser
transformado em um processo de aprimoramento de dados. Medidas novas e criteriosas
podem ser criadas, inclusive:
Sequenciamento ou organizao de atividades identificao da sequncia de
atividades que ocorreram antes de um evento especfico. Por exemplo, identificar que
algum normalmente liga duas vezes para o call center depois de buscar por opes de
suporte no site antes de obter a resoluo bem-sucedida do problema.
Contagens de frequncia contagem da frequncia com que determinado evento ocorre
durante um perodo especificado. Por exemplo, a identificao de produtos com x
chamadas de servio durante os primeiros 90 dias de uso.
N quantis agrupamento de itens (por exemplo, produtos, eventos, clientes e parceiros)
em buckets baseados em uma medida especfica ou em um conjunto de medidas. Por
exemplo, controlar o primeiro tercil (os principais 10%) dos clientes com base na receita
ou em uma margem durante um perodo contnuo de trs meses.
Grupo comportamental criao de uma cesta de atividades, inclusive frequncia e
organizao, que precede uma venda ou um evento de converso, de forma a identificar
as combinaes mais eficazes e lucrativas dos tratamentos de mercado.
Dar suporte a consultas variveis extremas e cargas de trabalho de estudos
analticos
muito difcil saber com antecedncia os tipos de consultas e estudos analticos que a
empresa pode querer executar com base no ambiente de negcios mais atual. Os preos ou
as aes promocionais de um concorrente podem exigir uma anlise repentina para melhor
compreenso do impacto financeiro e dos negcios em sua empresa. Os estudos analticos
mais interessantes envolvem cargas de trabalho extremamente variveis e, a princpio,
difceis de ser previstas.
3

Antes, as organizaes tinham de contentar-se com uma anlise superficial ps-fato e no


tinham a capacidade de computao para mergulhar nas anlises enquanto os eventos
ocorriam ou para contemplar todas as variveis e permutaes diferentes que pudessem
estar conduzindo os negcios. Com as novas plataformas, essas necessidades analticas
repentinas e de grande uso computacional podem ser favorecidas. Esse recurso
manifesta-se das seguintes maneiras para os usurios corporativos:
Desempenho e dimensionamento agilidade para aprofundar-se nos dados e fazer as
perguntas de segundo e terceiro nveis necessrias para respaldar a tomada de decises.
Se os usurios corporativos quiserem observar todos os detalhes dos dados para saber
quais variveis esto conduzindo os negcios, eles no precisam preocupar-se em parar o
sistema com a anlise de dados demais.
Agilidade suporte rapidez no desenvolvimento, nos testes e no refinamento de
modelos analticos que ajudam a prever o desempenho dos negcios. Os analistas de
dados esto livres para explorar as diferentes variveis que podem estar conduzindo o
desempenho dos negcios, aprender com os resultados e encaixar essas descobertas na
prxima iterao do modelo. Eles tambm podem falhar rapidamente em sua anlise sem
se preocupar com as ramificaes de desempenho do sistema de suas anlises.
ANALISAR CONJUNTOS DE DADOS GRANULARES E EM GRANDE ESCALA (BIG DATA)
Uma das vantagens mais significativas da nuvem o volume e o nvel dos dados detalhados
que podem ser colocados em uso em anlises e modelagens de geradores de negcios.
Alm de oferecer a possibilidade de obter uma capacidade de processamento mais eficiente
sob demanda, a nuvem fornece recursos mais eficientes e econmicos de armazenamento
de dados. Em vez de forar os negcios a se adaptarem aos dados, eles so livres para
expandir suas anlises aproveitando todos os aspectos dos dados, das seguintes maneiras:
A capacidade de executar o mximo possvel de anlises de mltiplas dimenses. Os
negcios no ficam restritos a contemplar apenas trs ou quatro dimenses, mas podem
abranger centenas, ou milhares, de dimenses para ajustar e localizar o desempenho dos
negcios. Com esse nvel de anlise de mltiplas dimenses, as empresas podem localizar
os geradores de negcios de acordo com a regio especfica (por exemplo, cidade ou CEP),
com o produto (por exemplo, unidade de produto ou nvel de UPC), com o fabricante, a
promoo, o preo, a hora do dia, o dia da semana etc. Com esse nvel de granularidade,
o desempenho dos negcios locais pode ser drasticamente aprimorado.
Encontre pequenos diamantes suficientes no volume de dados para fazer uma diferena
substancial nos negcios. A plataforma lida com dois desafios importantes de lgica
aplicada: o primeiro encontrar os geradores de negcios no nvel local ou especfico e o
segundo localizar geradores de negcios suficientes que possam fazer uma diferena
substancial nos negcios.
HABILITAR ACESSO A DADOS DE BAIXA LATNCIA E TOMADA DE DECISES
Como os dados no precisam passar por uma fase intensiva de preparao de dados (com
relao pr-criao de agregaes e ao clculo prvio de medidas derivadas), a latncia
entre o momento em que os dados so gerados e o momento em que ficam disponveis para
os negcios significativamente reduzida. A capacidade de reduzir o tempo entre o evento
de dados e a disponibilidade de dados significa que o conceito de lgica operacional uma
realidade das seguintes maneiras:
Explorao de feeds de dados contnuos (feeds de gotejamento) para fornecer lgica e
relatrios operacional de baixa latncia. O tempo entre um evento de negcios (como uma
transao financeira) e a deciso de comprar ou vender reduzido drasticamente.
Podemos ver claramente o impacto dessa tomada de decises de baixa latncia no
aumento do comrcio algortmico de Wall Street3.
O acesso a dados de baixa latncia possibilita tomadas de decises pontuais e em
trnsito. Por exemplo, os gerenciadores de campanhas podem realocar oramentos on-line
da campanha entre locais de melhor desempenho e/ou melhor converso e combinaes
de palavras-chave, enquanto a campanha est em trnsito.

PONTO 3: EXPERINCIA DE USURIO COLABORATIVA,


ONIPRESENTE E GENERALIZADA
Os usurios corporativos no querem mais dados, grficos e opes de emisso de
relatrios, independentemente da maneira sofisticada de serem apresentados. Eles querem
uma soluo que aproveite os estudos analticos para identificar e oferecer percepes
importantes e acionveis sobre seus negcios.
HABILITAR UMA EXPERINCIA DE USURIO INTUITIVA E GENERALIZADA
O agrupamento de dados detalhados com capacidade analtica em grande escala oferece
um benefcio interessante: interfaces mais simples e intuitivas. Como isso possvel? Pense
no relacionamento entre o iPod e o iTunes. A interface minimalista do iPod uma das razes
para o sucesso com os clientes (e a fatia dominante no mercado). A Apple transferiu grande
parte da complexidade do usurio (por exemplo, gerenciamento de listas de reproduo,
adio de novas msicas e gerao de recomendaes usando o recurso Genius) do iPod
para o iTunes, onde ela pode ser mais bem gerenciada. Podemos aplicar esse mesmo
conceito para aprimorar a experincia do usurio de estudos analticos.
A experincia do usurio pode potencializar a lgica para realizar mais tarefas complexas
de anlise de dados em segundo plano. Em vez de apresentar uma complexidade cada vez
mais crescente de relatrios, grficos e planilhas, a interface pode tornar-se mais intuitiva
e oferecer aos usurios as percepes de que precisam saber sobre os negcios.
Com base nas percepes apresentadas pelos dados, a experincia do usurio pode
comear com aes especficas recomendadas (como o recurso Genius do iTunes).
A complexidade de identificar recomendaes relevantes e acionveis torna-se
responsabilidade dos estudos analticos.
Por exemplo, imagine a interface do gerenciador de uma campanha que reduza as diversas
variveis que causam impacto no desempenho da campanha a apenas aquelas que sejam
importantes e acionveis. Imagine que a interface do usurio no s apresente essas
variveis, como tambm recomendaes para melhorar o desempenho da campanha em
trnsito. Essa sim uma experincia que a maioria dos usurios gostaria de ter.
EXPLORAR A NATUREZA COLABORATIVA
A colaborao faz parte, naturalmente, dos processos de anlise e tomada de decises.
Pequenas comunidades de usurios afins podem ser formadas rapidamente para
compartilhar aprendizados sobre reas de assuntos especficos.
Por exemplo, seria muito til para todos os gerentes de marca em uma grande empresa de
bens de consumo embalados criar uma comunidade em que os dados, as informaes e as
percepes sobre o gerenciamento de marca pudessem ser facilmente compartilhados e
discutidos. As campanhas de marketing em vigor para uma marca podem ser copiadas e
expandidas por outras marcas mais rapidamente por meio do compartilhamento de dados
e anlises resultantes.
HABILITAR NOVOS APLICATIVOS DE NEGCIOS
Uma maneira de avaliar o potencial dessa nova plataforma de estudos analticos
perguntar: que tipos de problemas de negcios ela (com sua capacidade de processamento
sob demanda, com conjuntos de dados de alta granularidade, acesso a dados de baixa
latncia e estreita integrao entre lgica e data warehouse) permite que a empresa resolva o
que no conseguiu resolver antes? Vejamos alguns aplicativos de negcios que os estudos
analticos podem habilitar nessas novas plataformas, principalmente quando em conjunto
com o big data.

2
Nos mercados eletrnicos financeiros, comrcio algortmico o uso de programas de computao para
inserir pedidos de comercializao, em que o algoritmo do computador decide sobre os aspectos do pedido,
como agendamento, preo ou quantidade do pedido ou, em muitos casos, d incio ao pedido sem
interveno humana.

APLICATIVOS BASEADOS EM ATRIBUIES


Os aplicativos de atribuio tentam atribuir crdito de um evento especfico a uma srie
de atividades ou transaes em um processo complexo de vrias fases. Esses aplicativos
precisam recuperar, alinhar e analisar a srie de atividades, levando em considerao
fatores como frequncia, sequenciamento, novidades, limites e diminuio de tempo entre
as atividades, a fim de agregar valor para cada atividade. Entre os exemplos de aplicativos
de atribuio esto:
Aplicativos com eficcia em marketing de vrios canais, em que comerciantes tentam
atribuir o crdito de uma venda em vrios canais de marketing. Isso especialmente
pertinente para comerciantes on-line que tentam atribuir crdito para uma converso em
mltiplos anncios, sites e pesquisas de palavra-chave.
Aplicativos de atribuio de parceiros em que as organizaes de vendas tentam analisar
as contribuies dos parceiros em transaes de negcios complexas e de vrias fases.
Aplicativos de atribuio de tratamento mdico em que organizaes de sade tentam atribuir
o impacto de tratamentos e medicaes diferentes que apresentaram algum resultado.
APLICATIVOS BASEADOS EM RECOMENDAES
Os aplicativos de recomendao identificam e criam conjuntos de usurios ou produtos
idnticos ou semelhantes baseados em comportamentos, faixa demogrfica ou alguns
outros atributos reconhecveis. Os aplicativos analisam as transaes desses conjuntos para
criar tendncias que analisem a fora dos relacionamentos entre os usurios e seus
comportamentos e suas preferncias. A partir dessas tendncias, os aplicativos podem fazer
recomendaes de produtos (por exemplo, Amazon e Netflix) ou pessoas (por exemplo,
LinkedIn e Facebook). Entre os exemplos de aplicativos de recomendao esto:
Aplicativos de direcionamento de anncios para clientes que recomendam segmentos de
pblico-alvo idntico ou semelhante baseados em comportamentos e no histrico de
compras de produtos (por exemplo, campanhas bem-sucedidas destinadas a Supermes
tm alta probabilidade de tambm obter xito ao se direcionarem a Novas vovs).
Aplicativos de recomendao de produtos que recomendam produtos complementares
com base no que usurios semelhantes compraram em determinado perodo (por
exemplo, os clientes que compraram uma casa nova em determinados locais tm mais
probabilidade de adquirir uma nova mquina de lavar roupas e uma secadora trs meses
aps a compra do imvel).
APLICATIVOS PREDITIVOS/BASEADOS EM ESTIMATIVAS
Os aplicativos preditivos e de estimativas usam uma ampla gama de variveis, medidas e
dimenses para facilitar a tomada de decises em diferentes cenrios de mercado. Esses
aplicativos aproveitam tcnicas de estatstica e de data mining para refinar uma diversidade
de variveis a fim de identificar essas variveis, bem como a combinao de variveis, que
so as melhores possveis para prever o desempenho em determinadas situaes.
Considerando a linha do tempo de algumas dessas decises (como a precificao), o acesso
de baixa latncia aos dados e o in-database analytics so fundamentais para o sucesso.
Os aplicativos preditivos avanados criam avaliaes de sensibilidade e risco para que o
responsvel pela tomada de decises possa entender quais variveis so mais importantes
na tomada de decises. Por exemplo, se determinada varivel considerada importante
para uma tomada de decises, ento esforos extras podem ser feitos para garantir a
preciso e a abrangncia dessa varivel. Entre os exemplos de aplicativos preditivos/de
estimativa esto:
Aplicativos de rotatividade de clientes que preveem a probabilidade de reduo de
clientes com base em fatores tais como atividades de uso, solicitaes de suporte,
padres de pagamento e impacto social de amigos.
Aplicativos de manuteno de produtos que preveem falhas de equipamento com base
nas informaes de uso do produto (principalmente informaes que, agora, so
especificadas por dispositivos de dados incorporados), registros de servios de
manuteno e histrico geral de desempenho do produto.
Aplicativos de desempenho do funcionrio que preveem um possvel desempenho do
funcionrio com base em fatores, tais como grau de instruo, posio socioeconmica,
histrico de empregos anteriores, estado civil e determinadas respostas psicocomportamentais.
6

Aplicativos de desempenho de estudos clnicos que apresentam diferentes resultados de


medicamentos com base em estudos para que uma empresa possa entender a eficcia de
determinados tratamentos e evitar problemas catastrficos quando medicamentos so
usados em determinadas combinaes. Isso passa a ser ainda mais importante ao tentar
atribuir resultados em vrios tratamentos e medicamentos (consulte os aplicativos de
atribuio).
Aplicativos de gerenciamento de produo, de gerenciamento de reduo da
comercializao e de otimizao de preos que criam modelos temporais para ajudar o
responsvel pela tomada de decises a compreender quando e quanto aumentar ou
reduzir os preos com base nas condies atuais de demanda e oferta. Esses tipos de
aplicativos so mais comuns em produtos de consumo (por exemplo, produtos perecveis,
passagens de avio, quartos de hotel, roupas de marca e ingressos para eventos
esportivos) com valor que chega a zero em determinado ponto no tempo.
APLICATIVOS BASEADOS EM PERCEPO
Os aplicativos de percepo usam tcnicas de estatstica e de data mining para identificar
comportamentos ou situaes incomuns. Aplicativos de percepo avanados tm a
capacidade de executar anlises complexas em centenas ou milhares de dimenses de
negcios. Esses aplicativos esto se tornando mais importantes conforme o volume de
detalhes dos dados aumenta com as fontes de dados, como cliques na Web, sensores RFID
e dispositivos em rede. Entre os exemplos de aplicativos de percepo esto:
Aplicativos de distribuio e reduo de produtos que monitoram constantemente os
sensores e dados RFID para identificar discrepncias entre o local em que o produto deve
estar e onde ele realmente se encontra.
Aplicativos antifraude que monitoram transaes financeiras constantemente para
detectar comportamentos incomuns que possam indicar atividades fraudulentas. Esses
tipos de aplicativos esto sendo aplicados em cartes de crdito, contas correntes e
reivindicaes de seguro, inclusive de tratamentos mdicos.
Aplicativos de lavagem de dinheiro que monitoram constantemente o fluxo de dinheiro
para identificar comportamentos incomuns que possam indicar lavagem de dinheiro,
como um nmero estranhamente alto de transaes sequenciais, pequenas e apenas em
dinheiro.
APLICATIVOS BASEADOS EM BENCHMARK
Os aplicativos de benchmark aproveitam os estudos analticos que comparam o
desempenho de uma entidade com alguma linha de base. A linha de base de comparao
pode ser um padro do setor, um perodo ou evento anterior (por exemplo, uma campanha
de marketing). Entre os exemplos de aplicativos de benchmark esto:
Aplicativos de participao no mercado que especificam informaes de participao no
mercado e cota do mercado. Por exemplo, grandes empresas de sites podem fornecer
dados e anlises de cota de mercado que ajudam os anunciantes e as agncias a
compreender seus gastos de marketing em comparao com os de seus concorrentes.
Aplicativos de benchmark da concorrncia que comparam o desempenho de uma empresa
com uma grupo de concorrentes ou uma mdia do setor. Isso fornece uma linha de base
que as empresas podem usar para comparar seu desempenho financeiro ou de mercado.
Aplicativos de benchmark de campanhas que comparam o desempenho de uma
campanha de marketing atual com uma campanha ou um evento de marketing anterior
e/ou semelhante. Por exemplo, uma empresa pode querer comparar o desempenho de sua
campanha atual do feriado de Independncia com a maneira como a mesma campanha foi
realizada no ano passado. Os usurios podem querer rastrear a porcentagem do total de
vendas at o momento da campanha para cada dia da campanha e comparar diariamente
os nveis mximo e mnimo de determinadas reas geogrficas e determinados produtos.

ESTUDO DE CASO: HAVAS DIGITAL


O PODER DOS ESTUDOS ANALTICOS
INTEGRADOS PARA IMPULSIONAR A
MODELAGEM COMPLEXA DE ATRIBUIES

CONSIDERAES FINAIS
Essas plataformas novas e altamente dimensionveis trazem recursos revolucionrios para
o mundo dos estudos analticos. Quais as vantagens em relao s atuais plataformas de
data warehouse e estudos analticos?

A Havas Digital e a Diviso de produtos de


computao de dados da EMC esto
trabalhando em conjunto para aprimorar o
Artemis Analytics Lab uma iniciativa de
pesquisa e desenvolvimento que abrange
estudos analticos de big data em grande
escala na nuvem privada. Essa iniciativa
aumenta muito a compreenso dos clientes
da Havas Digital sobre o comportamento do
usurio e sua capacidade de otimizar as
campanhas de marketing adequadamente.

A agilidade de provisionar e reatribuir recursos de computao em grande escala sob


demanda, conforme impulsionado pelas prioridades dos negcios.
A capacidade de analisar conjuntos de dados de baixa latncia mais granulares e mais
diversificados (big data) e, ao mesmo tempo, preservar detalhes e relaes nos dados que
geraro as percepes diferenciadas para possibilitar o desempenho otimizado dos
negcios.
Colaborao de vrias organizaes nas principais iniciativas de negcios e na rpida
disseminao de prticas recomendadas e descobertas organizacionais.
Superioridade de custos para aproveitar os componentes de processamento de produtos
de consumo e analisar o big data para abordar e explorar oportunidades de negcios que
no puderam ser abordadas com economia anteriormente (se que foram abordadas).

O Artemis Analytics Lab uma iniciativa que


rene a expertise da Artemis em marketing
orientado por dados e a base de
computao de dados do EMC Greenplum
para oferecer mining de estudos analticos
de marketing digital e in-database analytics
lderes do setor.

A plataforma ideal para os estudos analticos apresenta capacidade de processamento


altamente dimensionvel, capacidade de explorar conjuntos de dados de alta granularidade,
acesso a dados de baixa latncia e estreita integrao entre data warehouse e estudos
analticos. Se compreendida e implementada corretamente, ela pode ser usada para
resolver difceis problemas de negcios que no puderam ser resolvidos antes e oferecer
percepes importantes e acionveis aos negcios.

Para muitos profissionais de marketing,


informaes demogrficas simples sobre os
usurios j no so suficientes, diz Katrin
Ribant, Vice-presidente snior da Artemis.
Nossos clientes querem compreender os
aspectos do comportamento dos usurios,
que s podem ser conhecidos com o tempo,
e chegar a concluses que se escondem
atrs de simples listas de transaes.
Usando os estudos analticos avanados, o
EMC Greenplum oferece recursos de lgica
integrados diretamente ao banco de dados
executando-os em grandes conjuntos de
dados, o que nos permite gerar percepes
novas e avanadas sobre o comportamento
dos usurios e ajuda os profissionais de
marketing a prever como os usurios
respondero a novas campanhas.

Sobre o autor
Bill Schmarzo, lder em Competncia global da EMC Consulting, tem mais de duas dcadas
de experincia em data warehousing, Business Intelligence e aplicativos analticos. Bill
autor da metodologia Business Benefits Analysis (Anlise de benefcios de negcios), que
vincula as iniciativas estratgicas de negcios de uma organizao a seus requisitos de
estudos analticos e de suporte a dados, alm de ser coautor, com Ralph Kimball, de uma
srie de artigos sobre aplicativos de estudos analticos. Bill trabalhou no The Data
Warehouse Institute como responsvel pelo currculo de aplicativos de estudos analticos.

Um importante fator de diferenciao do


sistema Artemis seu mecanismo nico e
moderno de atribuio, que calcula com
maior preciso a influncia relativa da
publicidade em eventos de compra. Ao
transferir a modelagem e outros clculos
para o banco de dados e usar o EMC
Greenplum, a Havas Digital agora capaz
de oferecer aos clientes uma estrutura de
lgica de atribuio algortmica mais
prxima do tempo real.

EMC2, EMC, Greenplum e o logotipo da EMC so marcas registradas ou comerciais da EMC Corporation nos Estados Unidos e em outros
pases. Todas as outras marcas comerciais aqui utilizadas pertencem a seus respectivos proprietrios. Copyright 2011 EMC Corporation.
Todos os direitos reservados. Publicado no Brasil. 5/11 Perspectiva da EMC H8668.1

EMC Brasil
Rua Verbo Divino, 1488 - 04719-002
0800-553622 Na Amrica do Norte 1-866-464-7381
www.EMC2.com.br