Professional Documents
Culture Documents
by
ditorial
Sommaire
EDITO . . . . .
CONTEXTE .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
page 3
page 5
En France/Europe
Le cas franais : offre et demande, une incompatibilit ?
Donnes personnelles et cyber-scurit : enjeux technologiques et rglementaires
Vers une cohsion europenne
Lopen data et la cration de valeur
Focus Big Data et formation : les programmes, les profils, la cration demplois
- Mise en place du Big Data : le rle des mtiers, la place de la DSI
- Les formations
- La cration demploi
PORTRAITS .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
page 15
. . . . . . . . . . . . . . . .
page 24
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
page 29
La revolution Hadoop 2
- Naissance de Yarn et rduction de MapReduce
- Une gestion des fichiers amplement amliore
- Petit panorama de quelques modules Hadoop 2
- Sans oublier : scurit, administration et gouvernance
PROJETS .
CONTEXTE
BIG DATA: NOUVELLES
DFINITIONS ET CONCEPT
APPROFONDI
Cest officiel, on lappellera dsormais
Sarah A. King
Formation, recherche, scurit nationale, sant, services publics Des programmes aux
noms les plus intrigants, tels ADAMS, Minds
Eye ou encore TCGA ont pour objectif de dcupler les capacits et lutilisation du Big Data
dans les diverses administrations.
Le dpartement de la dfense qui lui seul
regroupe plus de 10 projets Big Data et bnficie de plus de 250millions de dollars dinvestissement annuel - mne notamment le
programme ADAMS. Ce dernier a pour objectif
de reprer des comportements anormaux, des
changements dattitude inquitants chez un
soldat ou un citoyen amricain.
Minds Eye est galement un projet de la DARPA
(Defense Advanced Research Projects Agency).
Il vise amliorer les performances de reconnaissance vido et danalyse automatise.
Le projet TCGA, port par les archives nationales du cancer (The Cancer Imaging Archive),
permettra danalyser plusieurs pta-octets de
donnes de squences gntiques issues de
patients atteints.
Les exemples sont nombreux, et rvlent la
6
Le dpartement de
la dfense lui seul
regroupe plus de
10 projets Big Data.
dAmazon a marqu un nouveau pas dans la
faon daborder la relation commerciale et le
processus de vente. Le leader mondial de la
vente en ligne a en effet annonc quil tait dsormais en mesure de prdire le prochain acte
dachat de chacun de ses clients, et donc de le
prparer lexpdition avant mme quil ne soit
command.
Le buzzword du Big Data se cache derrire
cette opration. Une bonne campagne marketing a fait le reste. Car ce queffectue le gant
du e-commerce, cest une analyse Big Data
prdictive et presque classique. La relle innovation, cest de transformer toute la chane
logistique en adquation avec les conclusions
des analyses menes. En dautres termes, ce
qui diffrencie Amazon rside dans le fait quils
investissent et se fient aux analyses Big Data,
et ne craignent pas de mtamorphoser leur
organisation qui pourtant ne montrait pas de
failles majeures. Amazon joue l son rle de
leader, en prenant les devants sur une tendance qui ne devrait que se dvelopper dans
les annes venir.
Les pays mergents
LAmrique du Nord est indniablement en
avance sur le sujet du Big Data. LEurope suit la
tendance, tout comme la plupart des pays dvelopps, o le tissu conomique constitu de
nombreuses startups et de grands groupes ncessite et facilite ladoption du Big Data.
Les regards se portent donc souvent sur le
gant amricain, alors que des investissements colossaux ont lieu sur le continent
africain par exemple. Une tude mene par
MarketsandMarkets indique que les pays mergents sont vous grappiller leur retard dans
les annes venir et reprsenteront une part
importante de la croissance du march du Big
Data.
Quelques chiffres rendent compte du potentiel
que reprsentent les pays mergents, ne serait-ce quau niveau des tlcommunications.
Selon la Banque Mondiale, il existe 6milliards
dappareils mobiles sur Terre, dont 5milliards
se trouvent dans les pays mergents. Les applications marketing sont assez videntes,
Il existe 6milliards
dappareils mobiles sur
Terre, dont 5milliards
se trouvent dans les
pays mergents.
8,9milliards de
dollars, cest le chiffre
daffaires que devrait
gnrer le march
du Big data en 2014.
74
Les domaines dapplications sont vastes. La partie projet de ce guide prsente quelques-uns de ces
projets dans des domaines varis.
Conduire plus prudemment grce au laboratoire daccidentologie PSA-Renault, optimiser les
consommations nergtiques dun btiment avec Cofely, dtecter une pidmie avec des outils
comme OpenHealth ou encore endiguer la pauvret avec les Nations Unies: le Big Data est bien une
rvolution de la socit dans son intgralit.
Chaque secteur doit donc dvelopper sa propre connaissance du Big Data, son intrt stratgique,
financier et les moyens mettre en uvre.
En termes dimage, la perception selon le domaine dapplication est souvent connote, positivement
ou ngativement.
laide dune coute mene sur plus de 150K messages, sur la priode du 27/10/2013 au 04/09/2014,
avec Focusmatic, nous avons tent de comprendre quels termes et sentiments sont le plus souvent
associs au Big Data, et cela par secteur dactivit. Les Tlcoms reprsentent la majorit des
messages connots, quel que soit laspect voqu. En dehors des Tlcoms, la sant, la grande
consommation et la publicit sont les secteurs le plus souvent associs des inquitudes et la vie
prive. Dans les domaines dactivits des RH et de la grande consommation, le Big Data est encore
un terme et procd peru comme complexe. (% des messages associs , en audience).
La connaissance du Big Data en elle-mme est discutable en France. Qui parle rellement du sujet?
Est-il si rpandu quon le dit? Ou sommes-nous encore aux prmices de ce phnomne?
Sur la mme priode, nous avons observ le profil des auteurs qui parlent le plus du Big Data. Il
sagit ici danalyser lactivit des auteurs ayant renseign leur profil twitter sur le rseau utilis. On
remarque alors que pour les auteurs se rclamant tre des spcialistes du Big Data, les thmatiques principalement abordes sont dans lordre le Big Data, lopen data, le cloud, la dataviz puis
lopensource. Les auteurs spcialistes du cloud ont une activit aussi importante que les spcialistes du Big Data, bien que moins varie en termes de thmatiques. Fait intressant, ce sont les
spcialistes de la sant qui ddient proportionnellement le plus de leurs messages lopen data. (%
des messages associs , en activit. Du 27/10/2013 au 02/09/2014)
fraude
donnespersonnelles
objets
connects
ville intelligente
EN FRANCE / EUROPE
Le cas franais: offre et demande,
une incompatibilit?
On parlait plus haut des impressionnants programmes dinvestissement amricains dans le
Big Data pour ses administrations. Le cas de
la France est bien diffrent, pour linstant du
moins.
Le plan Big Data pour la Nouvelle France industrielle, port par Franois Bourdoncle et
Paul Hermelin, et dont la feuille de route a t
valide en juillet2014, est ce jour la premire
relle impulsion conomique manant de ltat
visant dvelopper lcosystme Big Data en
France.
Une question dapproche et de stratgie se pose
alors, et on remarque, comme cest souvent le
cas, que la dmarche amricaine est bien diffrente de celle mene par ltat franais.
Les deux gouvernements sont certes, dsormais, tous deux persuads que le Big Data
est un secteur davenir, multisectoriel, plein
de promesses conomiques, sociales et environnementales. Mais les deux gouvernements
nont pas la mme faon de stimuler le secteur.
Outre Atlantique, la prise de position du gouvernement Obama passe par le dveloppement de
projets financs par les administrations et ddi leur propre utilisation. Ce sont ces grands
projets denvergure qui sont censs servir les
objectifs de ltat mais aussi montrer la voie.
Si ltat est rellement persuad de lintrt de
lutilisation du Big Data, pourquoi ne commencerait-il pas par lutiliser lui-mme? Le raisonnement est pragmatique, mais efficace.
On ne procde pas exactement pareil en France.
Tout dabord, nous avons pris du retard par rapport nos voisins amricains. Nous connaissons nos forces de trs bonnes comptences
en mathmatiques et statistiques mais nous
devons dvelopper nos potentiels. Pour ce faire,
le choix du gouvernement est de construire les
conditions de lpanouissement dune filire
Big Data en France. Le discours, les structures
daccueil, et les enveloppes budgtaires, sont
l pour atteindre cet objectif. Quelques projets
seront galement mens au sein des administrations, et on ne peut pas ignorer limportant
engagement sur le sujet de lOpen Data, notamment via Etalab. Cependant, il est vident
que lapproche nest pas la mme.
Si la France souffre encore fortement de la
crise conomique et peine dfendre son statut linternational, elle dispose encore de
grands groupes industriels puissants et agiles.
Cest l que laction du gouvernement sur le
sujet du Big Data trouve un appui non ngligeable. Les besoins de financements, les ressources humaines, la capacit dinnovation et
les structures de R & D sont disponibles au sein
du CAC40. Le plan de la nouvelle France industrielle, et sa nouvelle feuille de route, puise sa
force exactement dans cet environnement favorable. Orange, La Poste, GDF Suez, Alstom,
AXA, Socit Gnrale, Cova (le groupe MMA,
GMF et MAAF) Ces grandes entreprises ont
t choisies pour participer aux grands travaux
du plan initi par Arnaud Montebourg, et dsormais chapeaut par Franois Bourdoncle et
Paul Hermelin.
Quatorze initiatives qui couvrent la protection
des donnes personnelles, la fraude, le dveloppement des objets connects, la ville intelligente et dautres applications sectorielles.
Franois Bourdoncle et Paul Hermelin louverture de la confrence BIG DATA Paris 2014
Le volume de donnes
produites par les
internautes doublerait
tous les 18 24 mois.
Les objets connects sont au cur du dbat.
Ils vhiculent invitablement une masse importante dinformations sur nos modes de vie,
notre faon de consommer, nos habitudes, prfrences ou sur notre profil. Daprs les estimations, en 2018, chacun dentre nous possdera en moyenne 8 objets connects titre
personnel. En 2020, nous en aurons dj 10.
La tendance ne risque pas de sattnuer, tant
donn que, selon un sondage publi par Havas
Media France en janvier2014, 60% des internautes envisagent la gnralisation des objets
connects dici 5 ans, et les peroivent comme
source de progrs (75%) qui facilitent la vie
(71%). Le quantified self, en franais le
soi augment, reprsente lhumain du futur, un futur trs proche.
Courant 2014, un ingnieur a fait une trange
dcouverte. Visionnant des publicits qui lui
paraissaient de plus en plus cibles, il a compris que son tlviseur LG espionnait son comportement son insu. Le fabriquant avait activ
par dfaut une fonction de collecte de donnes.
Aprs avoir dconnect cette dernire, lingnieur a identifi que le tlviseur continuait
transmettre des informations sur ses habitudes tlvises et mme ses visionnages de fichiers privs. Laffaire a t rvle au grand
jour et LG a d prsenter publiquement ses
excuses tout en sengageant supprimer toute
collecte de donnes de ses tlviseurs. La mfiance sest alors gnralise dautres objets
potentiellement connects linsu de leurs
utilisateurs. Le parallle avec George Orwell
semble alors vident, nourrissant une certaine
psychose. Lquilibre est ncessaire et cest l
que se joue le rle de la CNIL et des instances
europennes, toutes conscientes de lurgence
dune rglementation assurant et rassurant les
citoyens.
Les objets connects seront donc part intgrante de notre quotidien. L o ils soulvent
encore davantage dinquitudes, cest lorsquils
concernent la sant connecte. Bracelets, podomtres, balances, tensiomtres, appareils
sportifs, assistants de confort, aide aux personnes ges, contrles mdicamenteux Les
donnes de sant sont considres comme
particulirement sensibles. Elles permettent
de caractriser un individu sur des lments
extrmement prcis et privs. Ces donnes
sont traites part dans les actions de la CNIL.
Les acteurs du monde de la sant sont tenus
de sengager sur lanonymisation totale des
donnes sensibles, donnes de sant comprises. La recherche mdicale en est parfois
pnalise, mais limportance de la scurisation de ces donnes est dsormais accepte.
Quelques scandales ont particip cette prise
de conscience, notamment lorsque certains
patients ont retrouv leur dossier mdical en
accs libre sur internet aprs un passage
lhpital. Comme lexplique Pierre-Yves Lastic,
Chief Privacy Officer chez SANOFI, lutilisation
des donnes de sant doit tre particulirement prcautionneuse. Sassurer que les informations sont parfaitement anonymises est un
prrequis, quel que soit le pays o se droule
leur traitement et la rglementation en vigueur
cet endroit. Un projet de recherche, mme
des fins tout fait honorables, ne doit pas justifier lutilisation de donnes aussi sensibles. Le
monde de la sant joue avec des informations
dune haute valeur aux yeux de la socit. Il se
doit de les protger.
Les objets connects cependant ne touchent
pas uniquement les donnes personnelles. Le
machine-to-machine par exemple, ou M2M,
vise rcolter un maximum dinformations sur
des installations diverses afin doptimiser leur
fonctionnement. Selon lIdate, plus de 80 milliards
de produits seront connects Internet dici
2020.
Dans lindustrie, des socits comme Airbus ou
Total utilisent dj massivement les capteurs
pour leurs projets Big Data. Dbut 2014, Google
investissait 2,3 milliards de dollars dans le rachat de la socit Nest Labs, confirmant que
le march des objets connects est vou une
croissance impressionnante.
Au-del de ce type de donnes, les entreprises
dans leur ensemble dtiennent une masse dinformation considrable. Le volume de donnes
10
Parlement Europen
importante est une premire tape vers la construction dun cadre juridique protecteur lencontre des
activits de renseignement de pays tiers. On y d-
elles-mmes soumises au Patriot Act, il est lgitime de sinquiter de leur utilisation des
fins nfastes. Quelques changes politiques
ont bien eu lieu, visant rassurer les divers
tats de la bonne foi de chacune des parties.
En parallle, la volont de crer un cloud souverain sest renforce, avec des acteurs capables dhberger les donnes nationales et de
les protger (Numergy, Cloudwatt).
L, diverses opinions sopposent: les uns
prnent des actions rapides afin de scuriser
les donnes, les autres sont convaincus de la
ncessit de prserver le libre-change. La
surprotection na pas toujours, dans lhistoire,
port ses fruits. Et si lEurope risquait plus
tenter de senfermer dans un systme de vase
clos qu se laisser scruter?
De plus, une volont dassurer une relative harmonie sur la question de la protection des donnes personnelles en Europe se fait ressentir.
ce jour, les discussions font encore vivement
dbat. La dernire avance majeure sur ce sujet
date du 21 Octobre 2013, lorsque la commission
des Liberts publiques (LIBE), alors largement
porte par Viviane Reding, vota le compromis
sur la rforme de la protection des donnes
dans lUE. Le site de la CNIL qualifie ce vote de
LA VILLE
SERVICES
INTELLIGENTE
Transports
Energie
Ecologie
Dveloppement
SOCIETE
Interactions
Rseaux
Recommandations
TEMPS REEL
Interconnectivit
M to M
FOCUS
BIG DATA & FORMATION:
LES PROGRAMMES, LES
PROFILS, LA CRATION
DEMPLOIS
Ces dernires annes, le terme de datascientist est apparu. Un mouton cinq pattes pour
certains, capable de comprendre les problmatiques mtier tout en tant force de proposition
sur les outils et infrastructures. Ce datascientist est-il issu de la DSI? Peut-tre, mais il doit
davantage se positionner comme un lectron
libre au sein de lentreprise, naviguant entre les
divers services et fdrant les quipes autour
du mme objectif. Un manager en somme? Pas
tout fait. Un leader plutt. Un homme ou une
femme, qui saura apprhender les besoins de
ses collaborateurs, connatre les solutions Big
Data qui y rpondront et les mettre en place
rapidement. Un datascientist doit galement
faire preuve de qualits relationnelles: en tant
qulectron libre, il doit pouvoir impliquer ses
collaborateurs, rendre intelligibles les rsultats
et leur communiquer lavancement. Cest celui
qui vulgarisera le Big Data dans lentreprise, pour
le rendre plus accessible aux divers mtiers.
Une tude mene par IT Research ralise
en partenariat avec le Club Dcision DSI et le
JDN rvle que 35% des DSI sorientent vers
le Big Data en France. Ils rflchissent aux infrastructures et aux finalits des projets, mais
aussi au nouveau rle quils incarneront dans
leur entreprise avec le Big Data. Limage des
DSI en France nest cependant pas toujours
35
Spcialis
Big Data Tlcom ParisTech la
Retrouvez
linterview de
Soraya
Retrouvez
linterview de
Mehdi
Retrouvez
linterview de
Denis
LA CRATION DEMPLOI
La croissance annonce et amorce du march
du Big Data a une consquence sur le march
de lemploi. Comme nous lavons vu, les projets
Big Data ncessitent une relle nouvelle fonction, celle de datascientist. Elle stimule galement toute la sphre conomique des SSII,
cabinets de conseils, intgrateurs, fournisseurs hardware Dans lensemble, lAfdel estime que 1 000 emplois directs seront crs en
France dici 2018. Au niveau mondial, le cabinet
Gartner a suscit leffervescence en annonant en 2013 quil valuait la cration demploi
4.4 millions dici 2015. Prs de la moiti le
serait sur le territoire amricain. On comprend
donc le besoin de formation et la prolifration
des programmes acadmiques. Certains vont
mme jusqu penser que lducation nationale
devrait intgrer des modules de familiarisation
avec le codage et le traitement de la donne,
afin de susciter des vocations et dveiller la
curiosit ds le plus jeune ge. Les gnrations
venir seront certainement plus familiarises
avec les nouvelles technologies, mais les datascientist demanderont quoi quil arrive une
formation spcifique.
Donnes issues dune tude mene avec Focusmatic du 27/10/2013 au 02/09/2014. Nombre de messages associs , en activit
ESSCA : 09
ENSAI : 96
IDRAC : 18
Mines : 140
ECE : 20
ESSCA : 09
ENSAI : 96
IDRAC : 18
Mines : 140
ECE : 20
Grenoble EM : 240
Audencia : 30
ESSEC : 480
Supelec : 46
HEC : 490
Donnes issues dune tude mene avec Focusmatic du 27/10/2013 au 04/09/2014. Nombre de messages voquant le Big Data et lcole
14
4.4
Portraits
Portraits
15
AXELLE
LEMAIRE
SECRTAIRE DTAT
CHARGE DU NUMRIQUE
(Portrait)
(Donnes Focusmatic - messages associant Big Data et Axelle Lemaire - messages issus du web et des rseaux sociaux)
Afin de mesurer la prsence numrique de la secrtaire dtat et ses interventions les plus remarques
lors de sa prise de poste, nous avons observ ses quelques actus Big Data qui ont fait le buzz entre le
09/04/2014 et le 24/05/2014
EXCLUSIF. Axelle Lemaire veut rtablir un Internet qui garantit les liberts
fondamentales - Le Point.fr
TOP #2: LE 19/05/2014 GRCE CETTE INTERVIEW:
Axelle Lemaire: LEurope nest pas les tats-Unis, nous ne voulons pas dun
Internet fractionn. - 20 Minutes
16
HENRI VERDIER
DIRECTEUR DETALAB
(Interview)
Normalien de formation, Henri Verdier est
un entrepreneur dans lme. En 1996, il cre
sa premire entreprise, une web agency, qui
marque le dbut de 20 ans de cration dentreprises dans le secteur du numrique.
En parallle de ses expriences entrepreneuriales, Henri Verdier a men des missions de
conseil et a fait partager son expertise professionnelle. Il a galement occup le poste
de directeur en charge de linnovation chez
Lagardre Active.
Engag dans lcosystme numrique franais, Henri Verdier prend la prsidence de Cap
Digital en 2007. Au sein de cette association de
plus de 800 start-ups, 25 grands groupes tels
Thales, Alcatel ou Dassault systme, et 250 laboratoires de recherches publique, dont lINRIA
par exemple, il se familiarise avec les problmatiques de la donne. Au sein de Cap Digital,
les projets naissent toute vitesse. Le rseau
soutient plus de 300 projets de recherche par
an, les dotant de plus de 70 millions deuros daides. Cest l quHenri Verdier ralise
quune rvolution de la donne est en marche.
Leffervescence qui a alors lieu dans la Silicon
Valley semble confirmer cette tendance. Avec
la dmocratisation du cot de traitement de la
donne, il estime alors que la bataille commence tout juste!
En 2010, il cre, avec Pierre-Louis Lions et
Jean-Michel Lasry, MFG Labs, engage dans
le domaine du Big Data. Le projet rencontre
le succs et est acquis par le groupe Havas
quelques annes aprs sa cration. Cette exprience conforte Henri Verdier dans sa conviction de limportance laquelle est vou le Big
Data.
En 2012, il cocrit Lge de la multitude, qui
traite de la transformation numrique lheure
o la valeur conomique se dplace de plus en
plus vers les particuliers, et leurs crations
conscientes (contribution) ou inconscientes
(traces et donnes). On y dcouvre alors sa
conviction que la puissance publique peut
sinspirer des stratgies des grandes plateformes Internet.
Rien de plus naturel quen 2013 il accepte le
poste de directeur dEtalab. la croise entre
entreprenariat, action publique et univers de
la donne, Etalab sert des objectifs clairs.
Henri Verdier voit laction dEtalab comme la
rencontre de la Dclaration des droits de
lHomme et du web 2.0. Le raccourci peut
paratre tonnant, mais on comprend mieux
lorsquil lexplique: depuis 200 ans, ltat
construit patiemment une certaine transparence. Ctait le sens des rapports publics de la
Cour des comptes, ou de la cration de lINSEE.
Aujourdhui, lopen data, cest la mise disposition des informations dtenues par ltat, mais
dans les formats les plus bruts possibles pour
favoriser le maximum de rutilisations et la coproduction avec les citoyens.
Car cest bien le collaboratif qui prime. Les
donnes seules, sans ide, sans travail, sans
mulation, ne sont pas cratrices de valeur.
Le web 2.0 permet justement de mobiliser une
communaut de plus en plus tendue. Cest
ainsi quEtalab a choisi de soutenir les 15.000
17
la puissance publique
peut sinspirer des
stratgies des grandes
plateformes Internet
contributeurs bnvoles dOpenStreetMap
pour recenser la golocalisation de lintgralit
des adresses en France.
La plateforme www.data.gouv.fr mise en place
par Etalab connat dj un grand succs, ayant
mme reu les honneurs de TechCrunch. Les
donnes qui y sont partages sont extrmement
varies, nombreuses et proviennent de diffrentes sources, comme les administrations et
les tablissements publics, mais aussi lUFC Que
18
TRANSPARENCE DE LA VIE
PUBLIQUE
ANNE LAUVERGEON
EX-PRSIDENTE DAREVA, RESPONSABLE DE LA COMMISSION INNOVATION 2030
ET PRSIDENTE DU CONSEIL DE SIGFOX (Portrait)
Photo : Bruno Levy pour Challenges
Arrtons lauto
french bashing!
[]
Tnacit, vision
stratgique long terme
et cohsion europenne
doivent primer.
Anne Lauvergeon nous rappelle alors une particularit de la France, qui influe fortement sur
ses dmarches dinnovation et par consquent
sur des initiatives telles le concours mondial
de linnovation. Au monde, cest le seul pays
appliquer le principe de prcaution, aprs
lavoir inscrit dans sa constitution (voir la loi
Barnier). Dautres pays lont reconnu, comme
le Brsil ou lAllemagne, mais la France sattache fortement son respect. Souvent dsign comme frein linnovation, le principe de
prcaution requiert dans son application la
recherche dun quilibre avec le principe dinnovation. Les deux ne doivent pas sopposer
mais se temprer. On rejoint alors le concept
du droit lexprimentation stipul dans le
rapport de la commission, qui doit squilibrer
avec la protection de la vie prive. Comme le
dit Anne Lauvergeon, il faut faire le ying et le
yang entre les deux notions. Tout serait donc
une question dquilibre.
Selon la femme daffaires, linnovation ne doit
pas se voir comme une finalit ni se limiter un
seul usage. Il faut la partager, la faire vivre,
QUELQUES LAURATS
DE LA CATGORIE BIG DATA
DU PREMIER CONCOURS
MONDIAL DE LINNOVATION
LANC PAR LA COMMISSION.
PROJET: BIG DATA POUR LE
SPORT PROFESSIONNEL
Mac-Lloyd propose des technologies de rupture dans le domaine du sport de haut de niveau: capteurs de mouvements, mesure par
analyse vido, et traitement intelligent de donnes massives par machine learning.
PROJET: SNIPS
Snips est une startup spcialise en modlisation prdictive pour les villes. En sappuyant sur
des donnes de golocalisation ainsi que des
donnes de contexte, nous pouvons mesurer,
comprendre et anticiper les comportements
dans les villes, contribuant ainsi personnaliser et amliorer le quotidien des citadins.
20
GILLES
BABINET
FONDATEUR DE CAPTAINDASH
ET DIGITAL CHAMPION
AUPRS DE LA COMMISSION
EUROPENNE
(Interview)
Votre parcours:
Au-del de la fiche Wikipedia qui parle dun passage difficile au collge et au lyce Quel parcours
avez-vous suivi? Comment avez-vous commenc
fonder vos premires entreprises et pourquoi vous
tes-vous lanc dans cette aventure?
Je ne suis pas proprement parler un programmeur mme si je me suis beaucoup intress llectronique lorsque jtais jeune.
Jai toujours voulu introduire linformatique, les
rseaux dans mes entreprises. Je pense avoir
fait partie de la premire vague des fondateurs dagence web, ds 1994 et donc tout ceci
reprsente finalement un certain continuum.
Il y a sept ou huit ans, jai rencontr Bruno
Walther, qui tait alors CEO de lagence internet Ogilvy et nous avons eu des discussions
passionnantes sur le constat que nous faisions
que le monde de la donne allait reprsenter
la prochaine rvolution; de fil en aiguille nous
avons cr une socit.
Ltat et le numrique:
Prsident du CNN, Digital Champion auprs de la
Commission Europenne... Que pensez-vous du
rle de ltat dans la construction dun cosystme
du numrique? Open data, financement, ducation,
avantages fiscaux, incubateurs, projets publics
:
dans quelle mesure doit sengager ltat?
risque, pro-business en luttant contre les professions rglementes et tout la fois sassurer que la qualit du systme ducatif est la
hauteur dune socit de la connaissance, que
les infrastructures numriques sont finances
et disponibles, que les liberts ne sont pas altres, etc. mon avis, rares sont les tats qui
parviennent mettre en uvre cette nouvelle
alchimie. La France progresse mais elle a un
long chemin faire.
dtre en permanence dans le principe de prcaution, avoir peur du futur et de notre ombre.
Les attitudes ractionnaires ne russissent jamais aux nations. Idalement, il conviendrait
de favoriser lclosion dune nouvelle forme
de Droit, ce qui ne manquera pas darriver.
chaque rvolution industrielle son droit. La premire a vu lapparition du Code Civil, la seconde
les droits sociaux (code du Travail), nous assisterons un jour lmergence du code de lindividu et de la Donne.
Focus rglementation:
On vous connat pour vos propos assez virulents envers la CNIL. Quel est selon vous lattitude adopter
sur la protection des donnes personnelles, la question du cloud souverain, lharmonisation europenne?
Comment contrer les drives, rassurer les utilisateurs, et dfendre la place de la France et de lEurope sur le plan international?
recommander que
lon cesse dtre en
permanence dans le
principe de prcaution.
PASHU DEWAILLY
CHRISTENSEN
ment mis disposition, partageant la connaissance dorganismes tels Google, LinkedIn, EMC
ou luniversit de Stanford.
En 2 annes, on peut dj mesurer les retours
et voir quelques beaux projets merger. Pashu
insiste sur le fait que The Hive est l pour permettre aux startups de se concentrer sur lessentiel: des bureaux sont mis disposition, des
quipes sont prsentes en continu, linfrastructure est fournie et les financements permettent
davancer rapidement. Une startup ne demeure
gnralement pas plus dun an dans le studio. Rien dtonnant alors ce que de petites
ppites en soient dj sorties, limage de
DeepForestMedia ou E8 Security.
MARKETING AND
PARTNERSHIP MANAGER
CHEZ THE HIVE, PALO ALTO
(Interview)
Pashu a un parcours atypique. Aprs un master en conomie du dveloppement suivi
Dauphine, elle part en stage lambassade de
France en quateur. Elle revient en France pour
effectuer quelques missions en conseil, avant
de prendre en charge la communication dAide
Mdicale en Indonsie. Elle intgre Orange
San Francisco alors que le sujet du Big Data
commence merger. Pashu construit alors
son intrt pour la thmatique et dcouvre
ltendue des domaines dapplication du Big
Data, allant de la finance la mdecine, servant le commerce et lindustrie, sans mme oublier le dveloppement durable. Comme elle le
dit, cest l quelle a pris conscience que dans
lconomie, dans nos vies quotidiennes, grce
aux objets connects: le Big Data va tout
chambouler!
Cest donc tout naturellement quelle accepte
de rejoindre, en Octobre 2012, alors quil vient
dtre fond, lincubateur The Hive. Travailler
dans une structure qui se focalise sur la cration de startups dans le domaine du Big Data a
tout de suite attir Pashu. Autre avantage notable, elle prcise quelle a la chance de travailler avec des gens brillants, qui ont aid
construire linfrastructure chez Yahoo notamment et qui reconnaissent les tendances
de demain.
En effet, The Hive, bas Palo Alto, le cur
nvralgique de lcosystme numrique, a t
fond par T.M Ravi et Sumant Mandal, deux
icnes de la Silicon Valley.
Avec une quipe denviron 10 personnes, The
Hive, que Pashu dfinit comme un studio, finance, incube et lance des data-driven startups
qui proposent des applications B to B. Les secteurs concerns sont principalement le marketing, la scurit et la sant. La philosophie de
The Hive: le low volume, high touch. Cest-dire que lincubateur investit dans 5 10 startups par an, tries sur le volet, et slectionnes
au seed-stage de leur dveloppement, la
naissance de lide. la diffrence des investisseurs (capital risqueurs) ou des incubateurs
traditionnels, The Hive est un studio qui inves-
tit entre $1,5 million $3 millions dans chacune des startups, avec une quipe (CTO, Data
scientist, Architect, Marketer) qui travaille quotidiennement avec les startups. Lobjectif est
donc daccompagner de A Z des projets auxquels lincubateur croit, du concept au produit
final. Au-del de linvestissement financier,
lappui humain est au cur du fonctionnement
de The Hive. voir lorganigramme de The Hive,
on comprend que le studio doit souvent tre en
effervescence, avec cette quipe de rockstars! comme le dit Pashu.
En quelques annes, lincubateur connat dj
un succs certain, qui la pouss se dvelopper au-del de ses frontires, en Inde dans un
premiers temps le bureau de Bangalore a
t inaugur il y a quelques mois.
Comment fonctionne la structure? Les investisseurs sont varis: entreprises prives, individuels ou institutionnels ont apport 8 millions
de dollars la cration. Aujourdhui, The Hive
bnficie dune enveloppe de plus de 30 millions. Des conseillers extrieurs sont gale22
DOUG CUTTING
CO-FONDATEUR DHADOOP
(Portrait)
On remarque dailleurs que sur les trois principales socits qui distribuent Hadoop aujourdhui, que sont Cloudera, Hortonworks
et MapR, deux sont 100% open source
[N.D.L.R.].
Doug explique comment il sest modestement
lanc, il y a quelques annes, dans le projet
Hadoop, en utilisant cinq machines simultanment, puis des mthodes de rpartition. Les
promoteurs du projet ne savaient pas comment
changer dchelle pour faire fonctionner des
milliers dordinateurs en mme temps. Yahoo,
intress par le projet, y a investi de faon importante. La jeune entreprise a alors pu continuer damliorer loutil en changeant dchelle.
Hadoop permet ainsi de stocker et traiter des
volumes considrables de donnes rservs
jusqualors aux traitements en batch. Le
module PIG, qui est un langage de flux de donnes, a aussi t ajout la plateforme afin de
faciliter lutilisation du programme et la dfinition de spcifications pour des sries de donnes.
Hadoop a finalement t adopt par un grand
nombre doprateurs qui en ont fait la plateforme de rfrence en matire de Big Data.
Cette volution ne parat pas devoir connatre
de limite et rien ne semble sopposer la
poursuite de cette logique de partage. Mme
les transactions sont dsormais possibles sur
Hadoop. Ce conglomrat de projets quest devenu Hadoop a fait de celui-ci un hub de donnes dentreprise (Enterprise Data Hub) permettant toutes ces donnes dtre traites en
un seul lieu, avec lensemble des applications
souhaites. Nous ne sommes encore quaux
prmices de ladoption du Big Data par lindustrie et il ne fait pas de doute que chacun voudra
copier les gagnants.
Techno
24
Techno
HADOOP
ENFIN UNE SOLUTION
DENTREPRISE?
HADOOP 1
LA NOUVELLE STAR
DE LANALYTIQUE EST NE
Depuis quatre cinq ans, le framework open
source Hadoop est devenu synonyme de Big
Data. Mme si au dpart, il neffectuait que des
traitements par lots (en batch) et donc en diffr.
Les raisons de ce succs? Premire raison: la
possibilit dutiliser moindre cot des algorithmes open source conus pour fonctionner
sur des serveurs x86 standard, et capables de
rpondre trs rapidement des questions en
analysant jusqu plusieurs ptaoctets dinformations. Et surtout une simplicit (relative)
dutilisation et de dploiement indite.
Enfin, Hadoop combine lutilisation de technologies de pointe trs apprcies ou trs innovantes: paralllisation des traitements, clustering, traitement et donnes sur un mme nud
dans une infrastructure distribue, fiabilit par
rplication des informations, etc. Et avec la version 2: In-Memory, temps rel, haute disponibilit amliore Des technologies enfin porte budgtaire des PME.
Enfin, outre les problmes de volumes difficiles
analyser avec les technologies classiques,
Hadoop permet denvisager la collecte et le
traitement de donnes en volume comme lInternet des objets et les multiples capteurs et
senseurs, le RFID, les tweets, etc.
10 ans: des origines de MapReduce Hadoop 2.x
Pour apprhender ces technologies, un petit
historique simpose. Fin 2004, Jeffrey Dean et
Sanjay Ghemawat employs chez Google pu-
25
26
LA REVOLUTION HADOOP 2
Plus quune autre version corrigeant des
manques, Hadoop 2 modifie son architecture
pour plus de scurit et douverture: haute disponibilit, temps rel, streaming ou encore au
In-Memory.
Naissance de Yarn et rduction de MapReduce
volution majeure: les deux fonctions de
MapReduce sont dcouples. Dsormais, la
gestion des ressources du cluster est assure par la nouvelle couche Yarn ((Yet Another
Resource Negotiator). MapReduce se contente
de grer les travaux de types batch. Une
amlioration qui noblige plus passer par
MapReduce pour accs aux donnes en mode
parallle.
Yarn propose une nouvelle architecture. Depuis
un nud matre, le Resource Manager (RM) orchestre lensemble des ressources du cluster
et arbitre entre les applications ncessitant des
ressources. Sur chaque nud esclave, un Node
Manager communique avec le RM.
chaque demande, Yarn gnre un container
(mmoire+CPU) sur un nud esclave, gr
par un Application Master. En cas de besoin,
dautres containers peuvent tre crs pour
cette application, mais lApplication Master
gre seul tous les containers de lapplication.
Et le Resource Manager supporte Kerberos.
Avec Yarn, il devient possible dajouter des modules applicatifs autres que MapReduce pour
accder aux donnes. La plateforme devient
donc extensible.
Et surtout, plusieurs moteurs applicatifs de
diffrente nature (batch, interactif, temps rel,
streaming) peuvent sexcuter simultanment sur un mme jeu de donnes.
Hadoop 2 modifie
son architecture pour
plus de scurit et
douverture: haute
disponibilit, temps rel,
streaming ou encore
au In-Memory.
27
28
Projets
29
Projets
Le projet est n de la
volont du secrtariat
Lide part dun constat assez simple: lvolution du niveau de pauvret, les conditions de
vie et les crises conomiques sont analyses
gnralement a posteriori. Avec un certain
nombre dindicateurs, on dclare par exemple
que le niveau de pauvret sest aggrav dans
une rgion donne. Or de nos jours, et ce mme
dans les zones les moins dveloppes, les nouvelles technologies ont envahi le quotidien,
lconomie et les administrations. Chaque jour,
en continu, les individus et institutions produisent des signaux digitaux sur les modes de vie. Les rseaux sociaux par exemple,
peuvent reflter les tats desprits dun pays ou
dune communaut. Le niveau dpargne et son
volution traduisent la sant conomique des
mnages mais aussi leur confiance en lavenir. Les mots-clefs entrs sur les moteurs de
recherche peuvent rvler des tendances, des
mouvements sociaux voire mme des pidmies. On se rappelle de lexemple en France de
lpidmie de grippe dbut 2014, prdite par le
gouvernement mais contredite par la socit
Celtipharm.
Grce au Big Data, Global Pulse encourage
lanalyse de ces signaux, qui, observs en
temps rel, fournissent un rel baromtre du
dveloppement au niveau mondial. Chaque action humanitaire ou daide au dveloppement
peut bnficier dun feedback immdiat. Les
projets peuvent alors tre adapts, amliors,
recadrs.
Robert Kirkpatrick, le directeur de Global
Pulse, explique que linitiative est ne suite
aux dbuts de la crise financire mondiale. La
propagation grande vitesse des effets de la
crise a alors prouv au monde entier limportante interconnexion de nos conomies et de
Onion
Retrouvez la
vido anime de
Global Pulse
Voir lintgralit
de linterview de
Robert Kirkpatrick
Dcouvrez en
visualisation
interactive les
rsultats du projet
Pulse Lab Jakarta
31
Selon lOCDE,
le march de la
contrefaon en ligne
connat plus de 25%
de croissance annuelle
depuis 2010.
33
34
LE MODLE DE PROGRESSIVE,
EXPLIQU EN 3 TAPES
SES CLIENTS:
PLUG - DAY 1
SAVE - DAY 31
Now your rate is fully
personalized; any
discount you earned is
in full effect. Simple!
Un des terrains les plus rputs au monde: SC Village, Los Angeles, Californie.
au jeu, recrant leur univers rel jusqu rpliquer leur mobilier lidentique. Les marques
prsentes sur la plateforme avaient donc des
informations prcieuses sur les gots de leurs
potentiels clients.
Suite cette exprience, Fabrice et Sbastien
ont eu lide dexploiter cet univers des communauts. Savoir reconnatre des groupes de
personnes avec une affinit commune, les capter, dvelopper la communaut et la montiser
auprs de marques lies deviendrait leur nouveau business model.
Concrtement, PCB Team a actuellement trois
projets en cours, chacun centr sur un centre
dintrt prcis: le paintball, la musique lectronique et le camping.
X-Field Paintball est le premier projet quils
ont dvelopp, et le plus abouti. Si le secteur
peut paratre surprenant, il faut tout dabord
noter que la communaut des passionns de
paintball reprsente plus de 20 millions de
pratiquants travers le monde. Cest la troisime communaut de sport extrme, derrire
le BMX et le snowboard aux USA. Ce qui est
dautant plus intressant, cest que la pratique
du paintball reprsente des coups similaires
la pratique du golf. Un passionn est donc
susceptible de ddier des budgets importants
pour son activit, et les marques de paintball
ont un fort intrt le capter (march mondial de 200millions deuros dquipements
et 1,3 milliard deuros de consommables les
billes).
Fabrice et Sbastien ont donc dvelopp une
application mobile, teste sur le march au
pralable, qui atteint rapidement des centaines
de milliers de tlchargements.
Leur communaut au sens large comprend les
pratiquants du paintball, mais aussi les industriels (marques dquipements), les exploitants
de terrains de jeu, les ligues (des championnats sont rgulirement organiss) et la presse
spcialise. En un peu plus de 6 mois, PCB
a amorc ce nouveau mdia, lobjectif tant
March mondial de
200millions deuros
dquipements.
35
36
Les deux hommes sont donc rsolument complmentaires, lInstitut de Gnomique du CEA
auquel Pierre Le Ber appartient travaillant sur
la partie R & D en gnomique, Pierre Leca sur
la R & D en calcul et traitement de donnes.
LE SQUENAGE DE LADN
Le projet quils nous prsentent, dans le
cadre de linfrastructure nationale France
Gnomique, traite du squenage de lADN, et
vise fournir des capacits de stockage et de
traitement de donnes qui permettent de nombreuses tudes et analyses. Quelques notions
simposent: le squenage consiste dchiffrer le code gntique. Pour le gnome humain,
cela reprsente 3milliards de bases rparties
sur 23 chromosomes. Le gnome du bl, par
exemple, renferme 17 milliards de bases, alors
quune bactrie nen contient que quelques
millions. On prend alors vite la mesure des volumes et traitements ncessaires. Depuis plus
37
de 30 ans, les scientifiques ont dvelopp diverses mthodes de squenage de lADN, dont
la plus connue est la mthode de Sanger. Dans
les annes 90, un programme international a
t lanc dans le but de squencer lintgralit du gnome humain. La tche a t acheve
en 2003 seulement, mais ctait une premire
mondiale. Plusieurs annes de travail donc,
mais aussi plus de 3milliards de dollars investis pour raliser cet exploit. Aujourdhui, un gnome humain se lit en quelques heures pour
quelques milliers de dollars! Cette rupture
technologique, scientifique et financire ouvre
la voie des applications de squenage massif, dont les besoins en moyens de stockage et
de calcul sont un challenge relever.
Le Genoscope, qui fait maintenant partie de
lIG, avait largement particip au vaste projet
du premier squenage, tant en charge de
lintgralit du chromosome 14. Le travail, soulignent les deux collgues, tait fastidieux et
decine personnalise, une grande avance apporte par la gnomique et qui sappuie sur le
Big Data.
Un autre exemple est celui du projet TARA
Ocans, un vaste projet dtude de la biodiversit planctonique marine qui a amen ds 2009
les quipes sillonner les ocans pendant plus
de 3 ans afin de rcolter des chantillons de
tous les coins du globe. La finalit: squencer
et analyser les gnes des organismes prsents
divers endroits, en parallle avec dautres
approches telles limagerie trs haut dbit.
Il sagit le plus souvent dorganismes que lon
nest pas capable disoler mais quil est possible de squencer en tant qucosystmes
planctoniques complets (approche dite metagnomique). date, environ le quart des
prlvements effectus ont t squencs. La
dcouverte impressionnante rside dans le fait
que la trs grande majorit des organismes squencs nous taient jusqualors inconnus. Ce
projet rvle limmensit de la biodiversit des
ocans. Cest un inventaire, en quelque sorte,
une photo prise au temps-T, qui nous permet
de mieux connatre les tendues aquatiques.
Au-del de lintrt purement informatif,
TARA Ocans permettra par exemple dtudier les effets du rchauffement climatique
sur les cosystmes marins: renouvel dans
quelques annes, le prlvement de nouveaux
chantillons permettra de comparer les organismes prsents. date, on ralise un ca-
le gnome humain
reprsente 3milliards
de bases rparties
sur 23 chromosomes.
cest dynamique. Pour expliquer un accident, il ne suffit pas dobserver que quelques
paramtres. Cest la combinaison de multiples
facteurs complexes qui peut engendrer une
anomalie. Prenons lexemple concret des sorties de pistes, qui ne sont pas les accidents les
plus dangereux mais sont les plus frquents.
Lorsquil travaillait en tant quenquteur,
Pierre Jouniaux a tudi le cas de la sortie de
piste de Toronto et confirm quun tel vnement est d une multitude de donnes.
Le projet de Pierre Jouniaux consiste dterminer le principe des marges et observer
comment elles sont absorbes. Pour ce faire,
il est donc ncessaire de faire un apprentissage
sur ces marges, ces limites. Lide est alors de
connatre les valeurs des donnes pour une si39
tuation dite normale, la marge dcart accepte, et la faon dont la compagnie utilise ces
marges. Sans a priori, on regarde toutes les
donnes, essentiellement rcupres par les
capteurs disposs sur les avions, mais aussi
les donnes mtorologiques par exemple. Un
avion enregistre environ 1 000 paramtres par
seconde, donc sur un vol entier les volumes
atteignent des niveaux ncessitant une analyse experte. Pour Pierre Jouniaux, lavantage
davoir t pilote, tout en ayant les connaissances en traitement de la donne, lui permet
de savoir quelles informations sont pertinentes
et dans quel cas de figure.
Empiriquement, on peut considrer que 60%
de marge sont gnralement pris en compte
pour englober tous les paramtres. Dans la
grande majorit des cas, cest largement suffisant, mais sur des vols atypiques ou pour certains aroports par exemple, la marge de scurit restante est faible.
Revenons lexemple de latterrissage long.
Lalgorithme de SafetyLine met en vidence ce
qui diffrencie les vols normaux des vols atypiques. Profil du vol, configurations diverses,
type de pilotageLoutil prend toutes les donnes de tous les vols disponibles et en fait un
apprentissage, afin de construire un modle. On
peut alors faire une prdiction, en pourcentage,
des risques sur un modle donn. Safetyline
Un avion enregistre
environ 1 000 paramtres
par seconde.
40
Fournisseurs
Le Guide Big Data rpertorie pour vous les acteurs rfrents
et symboliques du march afin de vous permettre de faire
votre propre slection.
Dans cette partie, retrouvez les acteurs de lcosystme Big Data qui font lactualit
en France et ltranger. Ils ont souhait vous faire part de leur vision, de leurs
principales volutions technologiques ou de leurs plus belles ralisations.
Au cours de ces quelques pages, apprenez les connatre ou les redcouvrir,
car ce sont eux qui participent la croissante maturit du Big Data en France.
Que vous soyez la recherche de partenaires et fournisseurs, ou tout simplement
passionn du sujet et attentif aux volutions de ses protagonistes, cette partie
vous intressera.
Dans un souci dorganisation et de clart, nous vous proposons diverses catgories,
reprsentes par des labels, qui vous permettront didentifier immdiatement
les domaines de comptences clefs de chaque entreprise et pouvant donc
rpondre vos besoins. Ces labels sont rpartis en 6 catgories
42
Labels
Annonceurs
Equipementier
Hardware
ACTUATE
Editeur
Software
Editeur
BI
Editeur
Dataviz
A.I.D
BIME ANALYTICS
Conseil / SSII
Intgrateur
BITTLE
BLUESTONE
CAPGEMINI
CENTRALE FORMATION
CLOUDERA
CSC
DATASTAX
EDIS CONSULTING
EKIMETRICS
EXALEAD DASSAULT
SYSTEMES
HP
IBM
KEYRUS
MICROPOLE
NEO TECHNOLOGY
PENTAHO
PIVOTAL
QLIK
SAP
SAS
SCINETIK
SEMDEE
SENTELIS
SINEQUA
SPLUNK
SYNCSORT
TABLEAU SOFTWARE
TALEND
TIBCO JASPERSOFT
VISEO
Pages
44
46
48
50
52
54
56
58
60
62
64
66
68
70
72
GFI INFORMATIQUE
TERADATA
Institutionnel
74
76
78
80
82
84
86
88
90
92
94
96
98
100
102
104
106
108
110
112
114
116
Fournisseurs
43
ACTUATE
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
ACTUATE FRANCE
Instit.
Actuate aide les entreprises exploiter les sources de donnes htrognes dont le Big Data
CONTACT
Sarah
LALLAM
Responsable marketing
rapidement des applications de Business Intelligence sur mesure. Elle exploite la technologie
Open Source BIRT, cre par Actuate au sein de la Fondation Eclipse et adopte par plus
Les applications construites avec BIRT iHub sont idales pour la diffusion de masse
dinformations personnalises.
La plateforme dcisionnelle BIRT IHUB dActuate offre des visualisations de donnes interactives,
intuitives et personnalises travers des outils analytiques et des tableaux de bord pouvant tre
facilement dploys auprs de millions dutilisateurs travers le web et le mobile.
Les applications construites avec BIRT IHUB sont idales pour la diffusion de masse
dinformations personnalises. Actuate aide ainsi les entreprises tirer pleinement parti
du Big Data et de lessor des appareils tactiles.
Dveloppement
BIRT Designer Pro cr des contenus bass sur la technologie BIRT Open Source
Dploiement
BIRT IHUB gre jusqu des millions dutilisateurs via des clusters de servers haute disponibilit
BIRT Mobile visualise des contenus BIRT sur des supports mobiles tels que smartphones et tablettes
Visualisations
BIRT Analytics
BIRT Analytics est la solution danalyse exploratoire et prdictive des donnes qui permet
de raliser des tudes partir de nimporte quelles sources de donnes dont le Big Data
sans besoin de connaissance techniques et statistiques spcifiques.
A la main des utilisateurs mtier, BIRT Analytics offre galement la possibilit de concevoir
des campagnes et den prdire les retombes.
www.actuate.fr
45
A.I.D.
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
A.I.D.
4 rue Henri Le Sidaner
78000 Versailles
Tl 01 39 23 93 00
Mail info@aid.fr
CONTACT
Arnaud
CONTIVAL
Prsident Directeur Gnral
Instit.
Nos clients tels que AUCHAN, BOUYGUES TELECOM, CRDIT MUTUEL ARKEA, DARTY,
EDF, MOBIVIA GROUPE (NORAUTO, MIDAS...), PMU, PUY DU FOU, RENAULT, SEPHORA,
SFR, SIMPLY MARKET, SYSTEME U, TRUFFAUT, nous recommandent avec une note moyenne
suprieure 8/10
Porteurs du projet
Objectifs
Collecter toutes les interactions clients sur tous les canaux et donner une information actionnable
aux collaborateurs de lentreprise pour les aider dans la prise de dcision.
- Fournir au call center lors dun appel entrant lensemble des interactions du client et leur
motif avec la marque (call center, navigation web, rseau sociaux).
- Analyser les comportements clients (via les interactions) afin de dterminer les situations
risques et prendre les mesures adquates.
Prsentation
Le projet sappuie sur la solution C.I.M. (Customer Interaction Management) conue par A.I.D.
et utilisable en mode SaaS.
Les donnes traites sont de sources multiples :
- E-CRM (signaltique client, activits achats, retours darticles, retours de campagnes
marketing - ouvertures, clics, )
- Call-center (interactions, appels entrants, appels sortants, suivi des tickets )
- Site e-commerce (taggage du site avec la technologie A.I.D.)
- Rseaux sociaux (veille et capture sur le-rputation de la marque)
Les intervenants sur le projet sont pluridisciplinaires : un data scientist, un architecte
Big Data (Hadoop, Hbase), des dveloppeurs (java), un ergonome et un business analyste.
Le projet a t ralis en mode agile (scrum master, product owner).
Les processus mis en place suivent la logique : collecte, stockage, traitement (constitution
des rfrentiels), analyse, modlisation prdictive et restitution.
Aspect novateur
Achat
MAgAsin
E-mail
nEWsLETTER
infos produit
infos produit
WEB
WEB
Achat
WEB
Achat
Offre promo
MAgAsin
Rception
Achat
MAgAsin
infos
CALL CEnTER
Visite
Publication
MAgAsin
Publication
57 456 CLiEnTs
sMs
Rception
sMs
Retour Produit
Like
FACEBOOK
MAgAsin
www.aid.fr
47
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
AMAZON WEB SERVICES INC
Amazon Web Services (AWS) est une compagnie dAmazon.com, cre en 2006, qui offre
ses clients un accs des services dinfrastructure dans le cloud afin de leur permettre de
crer des applications sophistiques et extensibles.
Aujourdhui, AWS offre plus de quarante services ses centaines de milliers de clients,
grandes et petites entreprises, dans 190 pays, tout en tant un rel moteur pour linnovation
dans de nombreux domaines comme les mdias, la finance, le e-commerce,
Tl +33 (0)1 46 17 10 08
Mail lavocats@amazon.fr
Amazon Web Services propose notamment aux scientifiques, dveloppeurs et aux autres
professionnels ayant des problmatiques Big Data, de tirer parti du cloud pour effectuer
leurs analyses et relever les dfis lis laugmentation du volume, de la diversit et de la
vitesse des informations numriques. En effet, Amazon Web Services fournit un catalogue
complet de services cloud afin daider ses clients grer le Big Data pour obtenir un avantage concurrentiel et augmenter leur rythme dinnovations. Plus de dtails sur les services
Big Data du cloud AWS : http://aws.amazon.com/fr/big-data/
CONTACT
Stphanie
LAVOCAT
Marketing Manager, France
Cloud-based services
for Big Data
Manage, Analyze and
Increase Innovation
;sl
pa kk
ihg iuo
uihmginhu
vsgsfgc g
iiegjh kl,
saffynmffd
jgh sd
qwmjkk fd
jgl 0f
mn
g
poillfhla
gfafhlag ag
dsafhfhlag
dsa
dchfhlag g
uaf lak
af lakg
jjuakg
yy6uakg
g
dsa lk;
d fhlaghgg
Lide nouvelle du Big Data est de rassembler la totalit des donnes dusages historiques
disponibles (logs, donnes patrimoniales, rseaux sociaux...) sans pr-formatage ou
pr-filtrage, puis de traiter ces donnes a posteriori sur des historiques de plusieurs mois
voire plusieurs annes.
Se lancer dans un projet de Big Data dans le cloud apporte une valeur unique par rapport
des infrastructures sur site, notamment dans les tapes de stockage et danalyse:
Stockage lastique : le principe est davoir une capacit illimite dans laquelle les clients
ne paient que pour le stockage rellement utilis, sans engagement dans le temps.
Capacit serveurs la demande : les clients ont accs la demande et en quelques
minutes des serveurs virtualiss pour effectuer des traitements sans limite de taille. La
facturation des ressources est lheure dutilisation.
Cest dans ce domaine que les technologies lastiques proposes par le cloud Amazon
Web Services prennent tout leur sens. Larchitecture informatique lastique (stockage, ser-
veurs...) propose par AWS sadapte aux projets Big Data ponctuels ou rcurrents des entreprises de toutes tailles.
dience SEO et le chiffre daffaires de leurs clients tels que Dailymotion, Viadeo, Hotels.com,
BlaBlaCar, ELLE et Venere.com. En effet, Botify gre aujourdhui lanalyse de plus dune centaine de millions de pages ce qui impose la start-up des services afin de mieux dadapter
aux besoins de ses clients en leur permettant de rcuprer les informations indispensables
en termes doptimisation du rfrencement sur les moteurs de recherche. Lorsque Botify
crawl un site de 1 million de pages, ils accumulent plus de 100 Go de donnes. Botify uti-
lise donc la plateforme AWS pour sa capacit de calcul haute performance mais aussi pour
son faible cot, sa flexibilit et sa simplicit, qui permet lentreprise de gagner du temps
en phase de lancement de projets et pour la gestion des requtes. Plus dinformation sur
Botify : www.botify.com
49
BIME ANALYTICS
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
BIME ANALYTICS
1 place Francis Ponge
34000 Montpellier
Tl +33 (0)4 67 41 60 35
Mail stephan.khattir@bimeanalytics.com
CONTACT
Stephan
KHATTIR
Directeur des Ventes EMEA
Weekendesk.com,
Business Analytics 100% en ligne
Porteur du projet
Objectifs
Weekendesk est une agence de voyage 100% en ligne, leader de la vente de courts sjours
en Europe. Le site gnre plus de 46M de Volume dAffaires sur les 3 pays que sont la
France, la Belgique et lEspagne. Port par le dpartement Finance & Business Analytics,
leur projet BigData sarticulait dabord sur une logique de sortie du Reporting en silo, d
lhtrognit de leurs sources de donnes. Il sagissait en priorit dagrger des donnes
financires et de les mixer avec celles du trafic de leurs sites web et du comportement de
leurs consommateurs.
Prsentation
a. Nature des donnes traites : Weekendesk est un site web marchand dont les 25000
commandes par mois gnrent un important volume de donnes transactionnelles entre
les clients et les htels. Weekendesk analyse aussi constamment lvolution de son trafic et
son taux de conversion clients en rapport avec son offre produit et/ou service de son catalogue. Avec plus de 2 millions de visites par mois en moyenne, Weekendesk utilise Google
Analytics. Les donnes transactionnelles de rservation sont stockes dans des bases de
donnes SQL et un ERP propritaire en ligne. Dautres donnes sont disponibles dans le
Google Drive de lentreprise.
b. Ressources et mthodologie (comptences humaines, outils techniques, fonctionnement
du traitement de la donne) : Le Reporting tait prcdemment produit via Excel avec une
multitude de tableaux croiss dynamiques associs et donglets, pour couvrir tous les indicateurs cls des diffrents dpartements mtiers. Ce Reporting a rapidement atteint les
limites techniques dExcel (volumtrie croissante et problme de disparit des donnes),
devenant difficilement exploitable. En slectionnant BIME, Weekendesk peut dsormais reproduire son schma de Reporting initial avec comme amlioration majeure la fluidit de
se connecter nativement toutes les sources de donnes (SQL, Google Analytics et Drive)
depuis un seul et mme endroit, puis dagrger les informations en quelques clics, pour enfin construire et partager des tableaux de bord de pilotage en ligne avec le top management
et les diffrents dpartements.
c. Calendrier de dploiement : Le projet a dmarr en avril 2014. La Direction analyse les
tableaux de bord depuis aot 2014. Weekendesk a fait appel un intgrateur pour travailler
en amont les connexions on premise aux bases de donnes SQL.
Aspect Novateur
Weekendesk est une socit 100% web, oriente cloud et mobilit. Chaque employ doit imprativement accder ses donnes mtiers depuis nimporte o. La solution de Business
Intelligence de BIME, 100% web correspond parfaitement cet ADN. Grce la gestion des
profils et droits utilisateurs, chaque Business Analyst rentabilise son temps de production
des analyses. Un mme tableau de bord, agrgeant plusieurs sources de donnes, peut
en effet tre partag avec le Comit de Direction et les dpartements mtiers. Le Comit
accde aux informations globales de lentreprise tandis que les mtiers (vente, marketing)
ne voient quun primtre autoris.
Exploitation de la richesse du croisement des informations multi sources dans les tableaux
de bord, la vole, au mme endroit et en ligne. Production simplifie de graphiques visuels permettant une comprhension rapide des performances des canaux dacquisition.
Visibilit accrue des rsultats des ventes web par rgion, par canal de vente (force de vente
interne, service client, pur web), par source (ordinateur, tablette, smartphone), dans un
contexte croissant de volume de donnes. Actualisation real time des indices de comptitivit des offres, disponibles en ligne pour les mtiers, chacun tant capable dexcuter des
requtes adhoc pour rpondre leur question.
www.bimeanalytics.com
51
BITTLE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
BITTLE
235 Rue Denis Papin
Domaine du Tourillon Bt C
13 857 AIX EN PROVENCE Cedex 3
Tl +33 (0)4 42 12 54 57
Mail contact@bittle-solutions.com
CONTACT
Christophe
SUFFYS
Prsident
BITTLE est le premier moteur dcisionnel conu et imagin pour fonctionner en mode
Cloud Computing. Loffre est propose en mode web selon le principe du Software as a Service (SaaS), et dispose de capacits de traitement et de stockage quasi illimites.
Fonctionnellement, BITTLE permet de suivre et piloter les indicateurs cls de lensemble
des activits de la socit, en analysant les donnes sources de manire simple, efficace et
ludique. BITTLE sadresse tous types de structures qui recherchent une solution dcisionnelle complte, package et prte lemploi permettant de crer et de partager facilement
des tableaux de bord dans un environnement entirement scuris.
Notre vision est dapporter aux marchs viss une plateforme de Business Intelligence
communautaire, comprhensible par tous (aucune comptence technique en informatique
requise). Marketing, Ventes, RH, Finance, Achats, Informatique quel que soit votre mtier,
Bittle vous permettra de suivre vos indicateurs et analyser vos donnes.
Toutes les organisations, quelque soit leur taille, prives ou publiques, sont de plus en plus
demandeuses de solutions de Business Intelligence pour grer lensemble de leurs activits. Les solutions prsentes sur le march ne rpondent cependant pas leurs besoins,
pour diffrentes raisons, que ce soit la complexit de ces solutions, leur cot, ou encore les
dlais de mise en uvre.
En proposant une solution BI MultiCloud, simple mettre en place, simple utiliser et un
prix attractif sous forme dabonnement mensuel, BITTLE saffranchit de lensemble de ces
freins et simpose comme La solution dcisionnelle pour tous.
MY BIGDATA MY DECISION
Depuis sa cration, Bittle a pour ligne de conduite de vouloir rvolutionner la
faon dapprhender la Business Intelligence. Bittle dcide maintenant daller
encore plus loin en rvolutionnant le march du Big Data avec le mme souci de
dmocratisation.
La plateforme BittleGoBig permet ainsi de travailler sur les donnes de masse qui
peuvent tre gnres au travers de diffrents types dvnements.
La seule solution
intgre de Big Data la
porte de tous!
BittleGoBig
My BigData, My Decision
Depuis sa cration, Bittle a pour ligne de conduite de vouloir rvolutionner la faon dapprhender la Business Intelligence. Bittle dcide maintenant daller encore plus loin en
rvolutionnant le march du Big Data avec le mme souci de dmocratisation.
Prsentation
La plateforme BittleGoBig permet de travailler sur les donnes de masse qui peuvent tre
cres au travers de diffrents types dvnements. Elle permet, entre autres, des utilisateurs de gnrer des donnes qui ne sont actuellement pas traites informatiquement,
comme par exemple des indicateurs dutilisation, de satisfaction, de ressenti, ou encore des
comportements dutilisateurs sur des sites internet, ou sur une application mobile.
Loffre BittleGoBig se dcoupe en deux grandes parties. La premire partie sarticule autour de la cration dun moteur OLAP bas sur des technologies Big Data, appele Bittle
Foundation. La seconde partie est la mise en place de connecteurs permettant la rcupration de donnes simplement au travers dune multitude de sources, appele Data
Mixture.
Socle technologique de BittleGoBig, Bittle Foundation permet Bittle de supporter les
Big Data, sur deux aspects:
- Le stockage et linterrogation des donnes permettant davoir des tableaux de bord toujours aussi ractifs quel que soit le volume trait.
- Lalimentation en masse, permettant le temps rel, lors de limport de donnes.
Data Mixture est une vritable bote outils, permettant aux utilisateurs de collecter et
mixer des donnes la vole provenant de sources multiples, imagine pour les utilisateurs
ne possdant quun lger vernis technique.
Ce module est aussi un puissant middleware destination du dpartement informatique
dsireux de rcuprer facilement les donnes produites par les applications existantes au
sein du SI de lentreprise via des APIs intgres.
Aspect Novateur
Laurat du Concours Mondial de lInnovation 2030, Bittle innove dans sa proposition en intgrant diffrentes composantes permettant de couvrir tous les aspects du Big Data tout en
le rendant plus accessible et plus simple.
Comment ? Les outils ddis au Big Data ncessitent aujourdhui des connaissances techniques, afin de comprendre les concepts utiliss et pouvoir mettre en place de tels systmes.
Bittle ayant dj russi simplifier le dcisionnel standard, pour que des utilisateurs sans
connaissance technique puissent facilement donner du sens leurs donnes, veut mettre
tout son savoir-faire et son exprience pour reproduire ce succs en dmocratisant la mise
en place de systme Big Data.
De plus Bittle, ayant dj dvelopp un ETL accessible
des utilisateurs sans connaissance technique, va rvolutionner la rcupration et la gnration de donnes de
masse au travers de la mise en place de son module Data
Mixture tout en gardant cette phase simple dutilisation
et extrmement graphique.
Bittle deviendra donc par consquent le rceptacle central
des donnes de chaque entreprise, et le meilleur moyen
de communiquer tant en interne quen externe ... le tout
sans tre informaticien.
www.bittle-solutions.com
53
BLUESTONE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
BLUESTONE
55, rue du Faubourg Montmartre
75009 Paris
Tl +33 1 53 25 02 10
Fax +33 1 53 25 02 11
Mail franck.bellenger@bluestone.fr
CONTACT
Franck
BELLENGER
Directeur Commercial
Cre en 1998 pour rpondre des enjeux dexploitation avance de la donne, Bluestone a
toujours considr quune utilisation raisonne des donnes permettait aux entreprises de :
Crer la connaissance en analysant de faon approprie les donnes et informations disponibles
Mobiliser la connaissance dans laction, grce la mise en place dapplications Data Driven .
La rvolution industrielle que constitue le Big Data valide totalement ce point de vue.
Lexploitation avance de la donne est, en effet, dsormais perue par la plupart des entreprises
comme un levier dinnovation extrmement fort tous les niveaux.
Dans ce contexte, et avec une quipe de 130 Data Scientists, nous sommes aujourdhui lun
des acteurs leaders dans ce domaine :
Conseil : Accompagnement des stratgies de Data Innovation et de Management de
lInformation au service des mtiers
Science : Expertise dans les domaines de la statistique, du datamining, du machine-learning,
et de la recherche oprationnelle
Technologie : Conception darchitectures Big Data industrielles, et dveloppement dapplications
Data Driven oprationnelles.
Notre offre de services est organise autour de 3 practices mtier :
Sales & Marketing : Connaissance & exprience clients, tarification & yield management,
marketing produit & mix modelling, pilotage & prvision des ventes
Risque & Finance : Modlisation & gestion du risque, dtection & gestion de la fraude,
planification & consolidation, pilotage de la performance globale
Oprations & Production : Ressource planning & supply chain, maintenance prdictive &
smart alarming, pilotage & exploitation de rseaux complexes.
Dans chacun de ces domaines, nous disposons dune quipe de consultants ayant dvelopp
une comptence et une exprience spcifique en la matire, qui nous permet dassurer un
relais efficace entre les besoins mtier de nos clients et les rponses scientifiques et techniques
que nous leur apportons.
Objectifs
Le march des brevets est ce jour un march encore peu transparent, sur lequel il est
difficile -et coteux- de disposer dune valorisation objective des biens changs.
Le projet sinscrit dans ce contexte, et a pour objectif de dvelopper une plate-forme permettant -sur la base des nombreuses informations publiques disponibles- de noter lensemble des brevets europens, et de mettre cette information disposition du public
concern (industriels, fonds dinvestissement).
Le principe de la notation repose sur une hypothse simple : les dcisions administratives prises par le dposant dun brevet diffrentes tapes de son cycle de vie rvlent
la qualit de linvention que le brevet protge. Ds lors, la modlisation de ces dcisions
administratives , mises en relation avec des caractristiques observables du brevet (le
texte mme du brevet, le schma de citations inter-brevets), permettent dlaborer des
modles prdictifs de la dure de vie des brevets, et ainsi dapprocher leur valeur.
Prsentation
Nature des donnes traites : Les donnes traites portent sur lensemble des brevets
europens. Il sagit pour certaines de donnes structures (classification internationale
pour les domaines technologiques, citations de brevet brevet, cycle de vie administratif
du brevet), et pour lessentiel de donnes non structures (texte des revendications et des
descriptions, en franais, anglais ou allemand). Ces donnes sont collectes partir du
rfrentiel de brevets de Questel (fournisseur de donnes spcialis), et du site de lOffice
Europen des Brevets.
Ressources et mthodologie : Lensemble des donnes collectes est transform puis stock et historis sur une plateforme Hadoop.
Les processus algorithmiques de calcul des notes qui impliquent des traitements statistiques complexes, ainsi que des traitements de type textmining sur de gros volumes- sont
excuts automatiquement sous forme de batch, ou la demande selon le paramtrage
choisi par lutilisateur (slection dun rfrentiel de calibration des modles, modification
des caractristiques des brevets valus).
Calendrier de dploiement : Aprs plusieurs exprimentations et tests en grandeur nature
auprs dutilisateurs pilotes, une premire version accessible au public sera lance au printemps 2015.
Aspect novateur
Le scoring labor dans le cadre de ce projet est le seul qui permette une combinaison algorithmique de nombreuses caractristiques des brevets, dont certaines issues dune approche
textmining peu ou pas utilise jusquici. Laccent est galement mis sur la possibilit de dcomposer le score selon les caractristiques les plus influentes du brevet, ce qui garantit
la transparence des algorithmes de calcul utiliss. Enfin, les utilisateurs les plus avancs
peuvent choisir un univers de rfrence pour la calibration des modles, et obtenir des notes
pour leur portefeuille et ceux de leurs concurrents aussi pertinentes que possible.
La notation des brevets propose permet de nombreux usages pour diffrents types dacteurs de la proprit intellectuelle. Dans le cadre dune revue de portefeuille acqurir, elle
peut par exemple aider des experts valuateurs de brevets identifier plus rapidement les
meilleurs brevets. Elle permet de prendre en compte le portefeuille de brevets dune socit pour aider aux dcisions dacquisition ou de financement. Au sein dun dpartement de
proprit intellectuelle, elle offre aussi un moyen de valoriser son portefeuille par rapport
celui de ses concurrents
Les mois qui viennent vont permettre de porter lensemble des traitements en environnement de production.
En outre, les algorithmes de notation seront probablement encore affins pour tenir compte
des retours des premiers utilisateurs. Pour cela, il est notamment envisag dorienter le
projet vers une logique dopen innovation grce la plate-forme datascience.net.
www.bluestone.fr
55
CAPGEMINI
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
CAPGEMINI
7, rue Frdric Clavel
92287 Suresnes Cedex
Tl 01 49 00 40 00
Mail valerie.perhirin@capgemini.com
Cest l que lexpertise Big Data de Capgemini entre en jeu. Car si le march volue et les
solutions Big Data se dmocratisent rapidement, les entreprises peuvent encore avoir des
interrogations sur les choix technologiques, dinfrastructure ou dorganisation. Capgemini
dispose dun solide savoir-faire avec notamment un centre dexcellence, un lab et des
quipes exprimentes.
A propos de Capgemini
Fort de plus de 130 000 collaborateurs et prsent dans plus de 40 pays, Capgemini est lun
des leaders mondiaux du conseil, des services informatiques et de linfogrance. Le Groupe
a ralis en 2013 un chiffre daffaires de 10,1 milliards deuros.
CONTACT
Valrie
PERHIRIN
Responsable France de loffre Big Data
Avec ses clients, Capgemini conoit et met en uvre les solutions business et technologiques qui correspondent leurs besoins et leur apporte les rsultats auxquels ils aspirent.
Profondment multiculturel, Capgemini revendique un style de travail qui lui est propre, la
Collaborative Business ExperienceTM , et sappuie sur un mode de production mondialis,
le Rightshore .
Plus dinformations sur : www.fr.capgemini.com
technologiques
business.
La division Global Solution dun acteur international dans le secteur des Tlcoms, trs
prsent en Europe et en Amrique du Nord
Objectifs
Notre client a missionn Capgemini pour dvelopper une solution sappuyant sur des outils Big Data afin de : Prdire les futures hausses du trafic sur des marchs et des rgions
spcifiques Identifier les zones o le rseau tait surdimensionn ou sous-dimensionn
Identifier les zones o la croissance du trafic pourrait amener des opportunits de ventes
supplmentaires.
Prsentation
Notre client cherchait optimiser son rseau, amliorer sa qualit de service et identifier des modles de comportements sociaux permettant dinitier de nouvelles activits
gnratrices de revenus. Pour y parvenir, la socit a d convertir ses donnes relatives
lutilisation de son rseau en informations effectivement exploitables. La socit craignait
notamment que le trafic rseau, pour ses offres de gros destines aux entreprises, ne soit
en baisse en raison dune concurrence agressive obligeant les socits offrir des prix plus
bas aux clients.
a. Nature des donnes traites :
Capgemini a fourni au client une solution lui permettant danalyser ses donnes via de
nombreuses sources dont :
le trafic rseau les informations sur les lignes rseau la qualit de service les informations sur les systmes autonomes les donnes dmographiques
b. Ressources et mthodologie (comptences humaines, outils techniques, fonctionnement
du traitement de la donne)
Capgemini a tir parti des modles de thermodynamique sociale qui permettent deffectuer
des analyses et des prdictions sur lutilisation du rseau.
Les rapports ont t produits via la solution SAP Business Objects BI 4.1. Cloudera
Enterprise 4.5 a t utilis comme plate-forme Big Data, tandis que les requtes ont t
traites directement avec Cloudera Impala.
La solution incluait galement :
Lutilisation des mthodes agiles Lintroduction dun outil ESB/ELT pour lintgration des
donnes Lutilisation dun processeur graphique (GPU) pour parallliser grande chelle
les calculs thermodynamiques Lutilisation dun modle thermodynamique pour lanalyse
de donnes
c. Calendrier de dploiement : Confidentiel
Aspect Novateur
Durant la premire phase du projet, les donnes ont t transfres et centralises dans
un Enterprise Data Hub. La solution Enterprise Data Hub de Cloudera offre une plus grande
souplesse et ractivit dans le stockage et lanalyse des donnes, tout en permettant au
client de rduire considrablement ses cots.
Le projet a galement permis au client de dtecter lavance les zones gographiques de
son rseau o il pourrait cibler ses investissements.
Autres bnfices notables pour le client :
Amliorations oprationnelles Identification de nouvelles opportunits commerciales
Amlioration de lappui stratgique aux activits commerciales Rapports dentreprise
plus flexibles, toutes les informations tant disposition dans un rfrentiel unique Prdictions de rsultats plus prcises grce lutilisation des modles thermodynamiques
www.fr.capgemini.com
57
CENTRALESUPLEC
EXECUTIVE EDUCATION
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
CENTRALESUPLEC
EXECUTIVE EDUCATION
Parce que le monde change, parce quil change grande vitesse, les formations de
CentraleSuplec Executive Education sont non seulement axes sur les comptences, mais
aussi sur le dveloppement des capacits des individus et des entreprises changer de
faon continue. Cest un enjeu majeur qui ncessite autant dagilit que de talent.
CentraleSuplec Executive Education hrite de deux cultures frues dexcellence et rputes
pour leurs approches avant-gardistes de la pdagogie. Car Centrale Paris comme Suplec,
les formations dpassent largement la seule acquisition de connaissances : lobjectif est de
former des personnalits conscientes des grands enjeux conomiques, environnementaux et
sociaux de notre poque pour transformer le quotidien.
Tl +33(0) 1 41 13 16 14
Mail info@cf.ecp.fr
CONTACT
Rania
OUARET
Charge daffaires SI
Objectifs de la formation
COMPRENDRE les enjeux des Big Data IDENTIFIER les opportunits travers lopen
data et les cas dusage mtiers ACQURIR le vocabulaire li cet cosystme complexe
ADAPTER la stratgie dentreprise MATRISER les enjeux juridiques et lis la protection
des donnes ACQURIR les technologies des Big Data (acquisition et stockage des
donnes, traitement distribu, analyse de donnes large chelle) MATRISER les
technologies par des tudes de cas concrtes CONCEVOIR un projet Big Data.
Parce que
votre
comptence
est linstrument
privilgi
de votre
croissance.
Documentation et catalogue
www.cf.ecp.fr
Conseil et accompagnement
01 41 13 16 14 / info@cf.ecp.fr
EXECUTIVE
EDUCATION
Le monde change. Nous vous aidons changer.
EXP&RIENCE
Les Big Data constituent un enjeu la fois en termes dopportunits business et de dfis
scientifiques et techniques. Cest un vecteur dinnovation et limpact socio-conomique est
fort. La bonne utilisation des donnes massives peut accroitre la productivit, linnovation
et la comptitivit dans des secteurs conomiques entiers. Dans de nombreux domaines,
tels que lnergie, le commerce lectronique, le secteur public, les mdias, lenvironnement
pour nen citer que quelques-uns, les donnes massives saccumulent. Ces donnes se
caractrisent par une volumtrie importante, une forte htrognit et une provenance
en temps rel. Leur gestion et leur exploitation deviennent des enjeux stratgiques, en
mettant en uvre des mthodes danalyse capable de passer lchelle Big Data. Le
mtier de Data Scientist merge, ncessitant une solide connaissance en statistiques et
mthodes avances danalyse de donnes combine une comprhension de la gestion
de donnes passant lchelle, sur les aspects techniques et implmentation. Un autre
spcialiste des Big Data, le Data Engineer, doit tre capable de dvelopper des techniques,
processus et mthodes pour transformer les donnes en business et gnrer de la valeur.
Cette formation intgre la fois les aspects techniques et managriaux des fonctions lies
aux Big Data. En effet, il est important de comprendre leurs enjeux, les aspects lgaux lis
la scurit et la protection des donnes personnelles mais
aussi dtre en mesure de mettre en uvre un projet Big Data sur
le plan technique. La formation dlivre par CentraleSuplec
Executive Education aborde lensemble des diffrentes
facettes de la gestion et de lexploitation des donnes massives,
des cas dutilisation et de la stratgie dentreprise.
Cette formation est galement modulaire, conduisant des certifications intermdiaires (globale, management ou technique).
www.cf.ecp.fr
59
CLOUDERA
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
CLOUDERA FRANCE SRL
Mail emea-enquiries@cloudera.com
CONTACT
Romain
PICARD
EMEA Regional Director
De belles opportunits la cl
Le Big Data offre aux entreprises de diffrents secteurs une formidable opportunit. En
exploitant de nouveaux gisements de donnes de toutes sortes, elles peuvent poser des
questions nouvelles et originales concernant leurs clients et leur activit. Par exemple, les
entreprises utilisent ces donnes pour amliorer lexprience vcue par leurs clients en vue
de les fidliser tout en gnrant une valeur ajoute accrue. Dans le mme temps, en disposant dune vision pertinente et approfondie des activits commerciales, ces entreprises
peuvent identifier les zones dinefficacit qui, une fois traites, participeront potentiellement la rduction des cots dexploitation.
Lobjectif est simple : acqurir et combiner tous volumes ou types de donnes en conservant fidlement leurs caractristiques initiales en un seul endroit et aussi longtemps que
ncessaire, et offrir des informations pertinentes tous les types dutilisateurs, aussi vite
que possible, en utilisant les investissements et les ressources avec une efficacit maximale. Place la plateforme Cloudera Enterprise Data Hub Edition !
Par rapport aux systmes existants, la plateforme Enterprise Data Hub Edition (EDH) de Cloudera prsente des avantages suivants :
> Des archives actives : Un endroit unique pour stocker toutes vos donnes, tous formats
confondus, sans limite de volume, aussi longtemps que vous le souhaitez. Vous pouvez ainsi
rpondre aux exigences de conformit et fournir des donnes sur demande pour satisfaire
aux exigences rglementaires, internes ou externes. Parce que ce lieu est scuris, vous
savez qui voit quoi, et grce aux services de gouvernance et de lignage, vous pouvez suivre
laccs vos donnes, ainsi que leur volution au fil du temps.
> Transformation et traitement : Les charges de travail ETL qui devaient auparavant tre
excutes sur des systmes coteux peuvent migrer vers la plateforme Enterprise Data
Hub o elles pourront tourner trs faible cot, en parallle et beaucoup plus rapidement.
Loptimisation de lemplacement de ces charges de travail et des donnes associes libre
de la capacit sur les systmes analytiques et les entrepts de donnes haut de gamme.
Ce sont par consquent de solides atouts capables de se concentrer sur les applications
critiques prises en charge, telles que les applications OLAP.
> Informatique dcisionnelle exploratoire (Self-service BI): Les utilisateurs veulent souvent
accder des donnes aux fins de reporting, dexploration et danalyse. Dans de nombreux
cas, les systmes dentrepts de donnes de production doivent tre protgs contre un
usage informel afin dtre en mesure dexcuter les traitements analytiques et oprationnelles quils prennent en charge. Une plateforme EDH permet aux utilisateurs dexplorer
les donnes en toute scurit, en utilisant des outils dinformatique dcisionnelle (BI) interactifs traditionnels au moyen du langage SQL et de recherches par mot-cl.
> Fonctions analytiques avances : Plusieurs environnements informatiques (computing
frameworks) ddis aux fonctions analytiques, la recherche ou au machine learning, apportent une nouvelle valeur aux sources de donnes, nouvelles et anciennes. Au lieu dexaminer des chantillons de donnes ou des instantans correspondant de courtes priodes
de temps, toutes les donnes historiques peuvent tre combines dans des analyses compltes avec une parfaite fidlit. Des donnes tabulaires simples peuvent tre panaches
avec des donnes plus complexes et multi-structures, ce qui tait jusqualors impossible.
SEARCH
ENGINE
MACHINE
LEARNING
STREAM
PROCESSING
3RD PARTY
APPS
GESTION DE LA CHARGE DE TR
AVAIL
Systme de fichier
s
www.cloudera.com
NoSQL en ligne
Administration
du systme
Gestion
des donnes
BATCH
PROCESSING
61
Soft
B.I.
Dataviz
Conseil
COORDONNES
CLUB DCISION DSI
16 Place Vendme
75001 Paris
Tl +33 (0) 1 53 45 28 65
Mail club@decisiondsi.com
Instit.
Le Club Dcision DSI, premier club franais ddi aux directeurs informatiques
Aujourdhui le Club Dcision DSI runit 1 100 membres directeurs Informatique & Tlcoms de socits du secteur priv et du secteur public dont le parc informatique est suprieur 200 pc. Il rassemble des hommes et des femmes dexprience, anims par la volont
de mener des actions qui soutiennent dautres directeurs des systmes dinformation (DSI)
dans la ralisation de leurs projets professionnels.
Le club est administr par Vronique Daval, la prsidente, le vice-prsident, ainsi que par
un conseil central compos de neuf directeurs informatiques.
CONTACT
Vronique
DAVAL
Prsidente du Club
HELP DSI ce sont des DSI, des groupes de DSI et des communauts de DSI qui changent en
associant leurs ides, leur exprience et leurs connaissances Afin doptimiser leurs choix
technologiques.
Le club dispose de son propre rseau social (RSE) sur lequel de nombreuses thmatiques
sont abordes qui permettent aux membres de capitaliser sur lexprience des uns et des
autres. Les ambassadeurs de Club Dcision DSI ont adopt cette solution afin damliorer
la communication entre les membres, de crer des groupes de rflexion sur des thmatiques varies, et de diffuser les comptences travers le rseau des membres au niveau
national et europen.
Ce moteur dexprience permet aux socits adhrentes de se servir des retours dexprience des projets IT mis en place par les membres.
Chaque anne les ambassadeurs identifient des thmatiques auprs des membres et dfinissent un programme annuel consultable sur le site internet du Club :
www.club-decisiondsi.com
CSC
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
CSC
Immeuble Balzac : 10 Place des Vosges
92072 Paris La Defense Cedex
Tl +33 (0)1 55 70 70 70
Mail lguiraud@csc.com
CONTACT
Laurent
GUIRAUD
Responsable Offre Big Data
& Analytics France
CSC est un des leaders mondiaux des solutions et des services informatiques de nouvelle
gnration. Lentreprise se donne pour mission de faire fructifier les investissements technologiques de ses clients, en associant son expertise mtier et sa dimension mondiale aux
meilleures solutions du march
Grce sa large gamme de comptences, CSC fournit ses clients des solutions sur mesure pour grer la complexit de leurs projets afin de leur permettre de se concentrer sur
leur cur de mtier, collaborer avec leurs partenaires et clients, et amliorer leurs performances oprationnelles.
79 000 professionnels dans le monde travaillent chez CSC, au service de clients rpartis
dans plus de 70 pays. CSC a ralis un chiffre daffaires de 13 milliards de dollars au cours
de lanne fiscale clture le 30 mars 2014
STORM
R
HADOOP
D3
NOSQL
ERP
EDW
CRM
HCM
PLM
AUDIO/VIDEO
LOGS WEB
FLUX DE CLICS
DONNES DE CAPTEURS
MDIAS SOCIAUX
DES RSULTATS
TANGIBLES
AVEC LE
BIG DATA
IONS
ICAT
L
P
AP
ILIT
MOB
CLOU
D
CY
BER
SCU
RIT
www.csc.com
CONNAISSANCE
CLIENT
GESTION
DES RISQUES
OPRATIONS
INTELLIGENTES
INNOVATION
PRODUIT
65
DATASTAX
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
DATASTAX FRANCE
121 avenue des Champs Elysees,
Paris, France 75008
DataStax paule les applications en ligne qui transforment lactivit de plus de 300 clients,
parmi lesquels de nombreuses start-ups et 20 des Fortune 100. DataStax offre une technologie de base de donnes massivement extensible, flexible et constamment disponible,
intgrant une version dApache Cassandra certifie pour la production avec analyses, recherches et scurit pour les donnes en temps rel, dans des centres de donnes multiples et dans le cloud. De grandes socits font confiance DataStax pour transformer leur
activit : Adobe, HealthCare Anytime, eBay, ou encore Netflix.
Tl +33 (0)1 72 71 85 85
Fax +33 (0)1 72 71 85 99
Mail svandenberg@datastax.com
CONTACT
Steve
VAN DEN BERG
DataStax Regional Director
Western Europe
Les analystes sattendent ce que le march du NoSQL progresse trois fois plus vite que celui du SQL dans les prochaines annes. Les nouveaux venus dans le Big Data auront donc
coeur de comprendre pourquoi et comment ce type de technologie peut sadapter leur organisation. Les motivations pour passer au NoSQL sont lies aux besoins de performances,
de monte en charge, de trs haute disponibilit, de distribution gographique, de gestion
de tout type de donnes et de rduction des cots. Il existe cependant des obstacles indniables son adoption, aussi bien techniques que non techniques. Il est important dtudier
ceux-ci en mme temps que les amliorations apportes par lcosystme NoSQL. Par ailleurs, il est important de connaitre les cas dutilisation afin de correctement introduire cette
technologie NoSQL dans lentreprise.
Le site Web nosql-database.org liste actuellement plus de 150 bases de donnes NoSQL
diffrentes. Avec une telle liste, comment trouver les candidats qui pourront convenir
votre scnario dutilisation ?
www.datastax.com
67
EDIS CONSULTING
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
EDIS CONSULTING - JEMS GROUP
6 bis rue des Graviers
92 200 Neuillly-sur-Seine
Tl 01 47 89 63 10
Mail mbrancher@edis-consulting.com
CONTACT
Matthieu
BRANCHER
Directeur Commercial
EDIS est une structure spcialise dans les systmes daide la dcision et lun des plus
importants acteurs indpendants du march franais de la Business Intelligence.
EDIS accompagne ses clients dans la dfinition et le choix des technologies, linstallation de
larchitecture BIG DATA ainsi que son intgration au sein de leur systme dinformation (SI).
Associ JEMS Group, entreprise ddie aux systmes dinformation, EDIS dveloppe depuis
10 ans des offres de conseil et dintgration de solutions dcisionnelles couvrant toute la
chane de valeur jusquau pilotage de la performance des processus et des activits mtier.
Avec une politique de partenariat active aux cts des principaux diteurs de Business Intelligence historiques (SAP-BO, IBM, Oracle, MS), et des challengers aux solutions innovantes
et complmentaires (Talend, MAP-R, Tableau...), toutes les quipes EDIS rassembles en
ples dexpertise, maitrisent leurs outils, et sont formes aux meilleures mthodes et pratiques de conception, ralisation et de management de projets.
LE ple BIG DATA, conoit et met disposition des clients, de tous secteurs dactivits, des
solutions innovantes permettant la collecte, le stockage, lanalyse en temps rel, la diffusion et la visualisation de donnes structures ou non structures.
EDIS propose une mthodologie de metadata enhancement permettant dextraire de la
pertinence et dexplorer de nouveaux axes danalyses dintrts pour les mtiers.
Cr galement en 2002, JEMS Group est LE cabinet en systmes dinformation, fond sur
des valeurs humaines solides pour ses clients et ses consultants.
Renforc en 2012 grce au rapprochement avec EDIS, JEMS possde un savoir-faire et un
savoir-tre qui assurent la russite de chaque projet. JEMS Group compte 260 collaborateurs et ralise 24,5 M de chiffre daffaires
BIG DATA
Datawarehouse
DATAvIsuAlIsATIon
DashboarDing
DATAvAlorIsATIon
haDoop
Datalake
Lun de nos clients, grand acteur du secteur bancaire, souhaite sappuyer sur une innovation
technologique majeure de gestion et de management de donnes (Hadoop) pour centraliser
et partager les donnes internes et externes de ses diffrents mtiers.
Objectifs
Lobjectif du projet est de dvelopper les synergies par un accs et une exploitation plus
transversale du capital dinformations conomiques. En favorisant laccs, lenrichissement, le partage et le traitement de linformation, le projet doit lui permettre de promouvoir
lchange dinformation entre les diffrents acteurs.
Prsentation
Ce projet majeur vise regrouper dans un espace unifi et mutualis (DATA LAKE reposant
sur le framework Hadoop) des donnes conomiques en provenance de plusieurs sources.
EDIS, spcialiste du traitement de linformation et des infrastructures Big Data, accompagne cette transition technologique et organisationnelle. Nos quipes mnent de front les
chantiers organisationnels, fonctionnels et technologiques.
a. Nature des donnes traites : La plateforme BigData accueille un grand nombre de donnes htrognes provenant de diffrents producteurs internes/externes, avec des structures et formats diffrents et des systmes de codification htrognes.
b. Ressources et mthodologie (comptences humaines, outils techniques, fonctionnement
du traitement de la donne) : EDIS, apporte son avoir faire la mthodologie, ralise le
cadrage et la dfinition des besoins, assure la bonne mise en uvre du projet et participe
la dfinition et la mise en uvre de linfrastructure.
EDIS apporte galement son expertise sur larchitecture Big Data :
- Collecte et stockage de gros volume de donnes dans Hadoop sur des bases de donnes
NoSQL (HBase, MongoDB, Casandra)
- Mise disposition rapide (HDFS, NFS, YARN, MapReduce)
- Analyse, Valorisation & Visualisation (Hive, Pig, Impala, Mahout, Logstash, ElasticSearch,
Shark, Spark, R, Tableau, Kibana etc).
Notre mthodologie pour la constitution de DATALAKE, repose sur un processus dintgration de donnes qui sont ensuite enrichies en mtadonnes afin de disposer dinformations
contextuelles insres dans un rfrentiel. Cet enrichissement sappuie sur un dictionnaire
de mtadonnes et contribue matrialiser les adhrences entre les catgories de donnes issues de sources diffrentes.
Une fois intgres, ces donnes enrichies peuvent tre consultes et exploites par les
utilisateurs :
- Interrogation / recherche du contenu partir dun langage naturel
- Utilisation du moteur de recherche et dindexation ElasticSearch.
Aspect Novateur
Ce projet, par sa taille et ses ambitions est trs certainement lun des plus grands chantiers
BIG DATA men par un acteur Franais de porte internationale. Il doit permettre notre
client sur plusieurs annes de collecter, stocker, intgrer des donnes volumineuses, htrognes et varies dans le but de les analyser et les visualiser en temps rel.
Au-del de rassembler des donnes aussi varies, le projet permet de les enrichir avec
des mtadonnes ad-hoc (tag spcifiques, rfrentiels, synonymes, traductions, mthodologies..) qui facilitent laccs et lanalyse de linformation contenue dans les donnes produites par les mtiers depuis lIHM pose sur le socle commun.
Autres informations
www.edis-consulting.com
69
EKIMETRICS
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
EKIMETRICS
CONTACT
Franois
POITRINE
Directeur Gnral. Responsable
de la practice BigData
Ekimetrics est un des rares cabinets de conseil en stratgie spcialis dans lutilisation
doutils statistiques de pointe permettant loptimisation de la stratgie Marketing et Data de
grandes entreprises franaises et internationales (CAC 40 / Fortune 500)
Grce notre triple expertise : stratgique,
statistique et technologique ; nous sommes
mme de livrer des recommandations actionnables par les CMOs et les CIOs.
Nos 70 consultants ont tous un double
profil consultant / statisticienData Scientist ( X, Mines, HEC, ENSAE).
Nous sommes indpendants de tout organisme de mdias et dditeurs de logiciels,
ce qui nous permet une grande agilit dans
le choix des outils et des mthodes, ainsi
quune relle impartialit dans nos recommandations .
Eki SocialWeb Lab est un laboratoire de R&D au sein dEkimetrics. Le laboratoire a pour
vocation de comprendre et danalyser les grandes tendances du SocialWeb, en sappuyant
sur lexpertise en Datascience et la comprhension mtier de ses consultants. Grce notamment des algorithmes de classement smantique propritaires, les analystes du SocialWeb Lab sont mme de dcrypter le bruit autour de grands vnements culturels et
politiques pour le compte de marques et de grands mdias (Libration, LeLab Europe1,
TheMediaShaker ). Ainsi, durant lanne coule, notre Lab a notamment analys la
Fashion Week, les lections municipales Paris, le festival de Cannes et la Coupe du Monde
de football.
Durant les deux dernires annes, Ekimetrics a accompagn des leaders de lindustrie des
tlcommunications, de lautomobile et de lnergie dans lexcution de projets BigData.
Nous nous diffrencions par la maitrise de lensemble de la chane de valeur de la data: en
phase de conseil, en phase de data discovery, en phase de data factory et surtout en
phase de valorisation.
Notre philosophie sur les projets Big Data : lapproche PoC Proof of Concept
Dans le Big Data, nous observons un biais consistant construire des systmes pour ensuite chercher les valoriser (DMP, clusters..), nous faisons le contraire :
Nous avons une approche agile de test et dapprentissage pour mettre jour des
initiatives rellement industrialisables.
Nous partons de lusage mtier pour ensuite construire une architecture sur mesure.
Nous navons pas de contraintes sur la technologie ni sur la mthodologie : nous choisissons la solution la plus adapte en fonction des besoins exprims par nos clients.
Les APIs sont une source de donnes de plus en plus stratgiques et servent de socle
lInternet des objets. Chez Ekimetrics nous suivons avec intrt lvolution des APIs et de
lOpen Source depuis 2006. Nous avons t parmi les premiers utiliser les outils Big Data,
pour tirer profit de ces nouvelles sources denrichissement de donnes, notamment dans le
cadre danalyses du SocialWeb.
Aujourdhui, lenjeu ne consiste dj plus valoriser sa propre donne, mais trouver des
logiques de partenariat et de complmentarit pour avoir une offre complte.
Au sein dEkimetrics, nous matrisons les mthodologies statistiques et algorithmiques
pour mener bien de tels projets, la couche technologique apporte par le Big Data nous
permet de passer de la thorie la production.
www.ekimetrics.com
71
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
EXALEAD DASSAULT SYSTMES
10 place de la Madeleine 75008 PARIS
Tl +33 (0) 1 55 35 26 26
Fax +33 (0) 1 55 35 26 27
Mail www.3ds.com/fr/contact
CONTACT
Axel
BRANGER
Sales Director EXALEAD
South Europe, Russia & Middle East
EXALEAD Dassault Systmes rompt avec 25 ans de tradition dans le dveloppement dapplications,
jusquici centr sur des bases de donnes : sa technologie de recherche et dindexation, couple
des technologies Web, offre un accs unifi et un traitement haute-performance de linformation.
Les organisations ont dsormais besoin de 3 niveaux dexprience de linformation :
Accder agilement et rapidement un grand volume de donnes disperses et htrognes
Croiser, rconcilier, contextualiser les donnes pour crer de nouvelles solutions mtier
et offrir de nouveaux services leurs clients
Aller plus loin dans lanalyse pour en extraire encore plus de valeur et transformer leur
entreprise
EXALEAD Dassault Systmes rpond ces dfis et offre des applications personnalises ou
packages, volutives, parfaitement adaptes aux environnements actuels de Big Data et
qui permettent de le transformer en vrais bnfices pour lentreprise.
Les solutions EXALEAD valorisent simplement et agilement vos donnes mtiers pour dcider
mieux et agir vite. Elles adressent trois grandes problmatiques :
Interaction client : EXALEAD OneCall
Digital assets : EXALEAD CloudView / EXALEAD OnePart
Machine Data : EXALEAD CloudView
EXALEAD propose galement la Web Mining Exprience qui sappuie sur le moteur exalead.com
et offre la puissance de la recherche Web et de lanalyse smantique pour le dveloppement
dapplications partir de donnes pur Web.
www.3ds.com/products/exalead/
@3dsEXALEAD
Porteur du projet
Objectifs
Offrir aux villes et oprateurs de parkings un outil de pilotage (ventes, dures) et faciliter
la maintenance des horodateurs Parkeon.
Les dfis taient de rester performant malgr les volumes importants, dtre trs simple
dutilisation et de permettre aux villes ou oprateurs de mieux comprendre les usages
grces de nouveaux tableaux de bords intgrant de la cartographie.
Prsentation
Analytics est un service dvelopp par Parkeon grce la technologie EXALEAD CloudView.
En indexant et analysant plus dun milliard de tickets de stationnement mis par les horodateurs mis en place par une ville ou une communaut urbaine, Parkeon offre un outil de
suivi la fois global et dtaill du parc install des machines pour permettre aux diffrents
services dagir, interagir et ragir pour amliorer le fonctionnement du stationnement dans
une ville.
Horodateurs : Listes - Revenus des terminaux - Vue dtaille par terminal agrgeant de
nombreuses informations (ventes, alarmes, tats de la batterie)
Parking : Evolution des revenus dans le temps, par zone - Evolution en fonction des jours ou des heures
Maintenance : Terminaux avec des problmes de fonctionnements identifis - Terminaux o
des actions prventives sont ncessaires (changement de rouleau de papier)
Transactions : Accs aux transactions par pices ou cartes - Vues plus dtailles possibles
sur les cartes pour filtrer par type de carte (Mastercard)
Malgr les volumes de donnes importants (en centaines de millions pour certaines villes), loutil devait rester aussi simple utiliser que les sites grands publics, cest dire sans formation.
EXALEAD apporte son savoir-faire et ses outils correspondants aux meilleures pratiques ergonomiques telles quun set de facettes pour filtrer les donnes, un champ de recherche unique
sur toutes les pages configur pour lutilisation des requtes en langage naturel et trusted
queries ce qui permet aux utilisateurs de prendre en main trs facilement loutil.
La visualisation et lanalyse sont facilites grce des cartes manipulables par zones, des filtres
par priode et date, une cration flexible de rapports, des exports Excel sous format standard
Les temps de rponse, les rsultats clairs et en contexte augmentent lefficacit des diffrents utilisateurs de lapplication.
Lapplication peut tre utilise par nimporte quel utilisateur de lentreprise, quasiment
sans formation. Chaque fonction peut accder facilement aux donnes dont elle a besoin
dans son activit quotidienne.
Analytics offre de grandes performances : une grande scalabilit, une indexation et un traitement puissant des donnes, un temps de rponse adapt aux challenges de la comptition
Les gestionnaires de parcs peuvent ainsi accder et traiter des milliards denregistrements
partir de tout type de sources En quasi temps rel.
www.3ds.com
73
GFI INFORMATIQUE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
GFI INFORMATIQUE
La Porte du Parc - 145 boulevard
Victor Hugo, 93400 Saint-Ouen
Tl +33 (0)1 44 04 50 08
Mail alvin.ramgobeen@gfi.fr
CONTACT
Alvin
RAMGOBEEN
Gfi Informatique,
architecte ensemblier
de vos projets Big Data
Parce quil nest pas de Mega Structure qui se ressemble, parce que chaque projet
Big Data est lexpression de votre essence et de votre culture, nous sommes vos
cts pour relever ces dfis avec une passion claire et pragmatique.
Gfi Informatique, acteur innovant en systme dinformation, propose une approche autour des thmatiques Big Data contre sens des
normes du secteur. Aprs des travaux conjointement mens auprs dAirbus depuis 2010 portant sur des exprimentations NoSQL dans des
contextes analytiques et prdictifs, Gfi base sa stratgie Big Data en oprant un couplage fort entre le monde des startups et ses comptences
propres. Seul acteur proposer une offre de service la pointe du savoir-faire franais alli lapproche industrielle dun groupe polyvalent en
intgration de systme et en diteur de logiciel, Gfi opre la ralisation de vos programmes Big Data en tant quarchitecte ensemblier.
www.gfi.fr
fotolia.com
La posture de larchitecte
ensemblier
Les demandes en Big Data sont extrmement varies : chargement et stockage de donnes
massives, traitement de donnes en temps rel, analyse de donnes textes ou son, laboration de moteurs de recommandation, de corrlation, de prdiction analyses rcursives ou de
rseaux (base graph), Data Visualisation spcifique, algorithmie avance, etc. De plus, les demandes de ralisations Big Data sont souvent couples un existant IT et doivent galement
irriguer les systmes oprationnels et les terminaux de travail quils soient fixes ou mobiles.
Cette diversit en besoins pointus amne Gfi, avec lappui de son cosystme de startups,
se positionner en tant que garant de lassemblage des comptences spcifiques pour
chaque nature de besoin en Big Data.
Loffre
Big Data de Gfi
Conseil outill
en Data Exploration
Loffre Big Data de Gfi est multi entre et permet de couvrir une grande majorit des attentes du march sur les volets :
Conseil outill en exploration de la donne qui permet en quelques semaines de faire
merger et de quantifier un use case afin de valider sa pertinence face vos enjeux business
Conseil en aide au choix de solutions et en architecture full & hybride Big Data
Centre de service expriment pour la ralisation de prototypage Big Data
Mise disposition de Framework acclrant le dploiement en environnement de production de plateformes Hadoop scurises
Ralisation de projet sur mesure Big Data, en mode agile/Dev Ops, intgrant lexposition
de services sur les terminaux digitaux
Aide au choix de
solutions et Architecture
Big Data
Centre de service de
prototypage Big Data
Fort du constat march que derrire les termes de Datascientist ou dExpert Hadoop, il est
plus que difficile de trouver le profil comptent chez une seule et mme personne, nous
avons dvelopp une approche en quipe pluridisciplinaire.
Cette quipe regroupe lensemble des profils spcialiss en Consultants Mtier, Dveloppeurs Big Data et Data Analysts, Experts BI & CRM analytique et Consultants Digital et
Mobilit.
Afin de sassurer de gagner en scurit et performance, nous allions les comptences de
nos quipes avec lexpertise pointue de startups en Datascience, Data Visualisation, Clustering Hadoop, Text mining, etc.
Framework de dploiement
de production de plateformes
Hadoop scurises
Ralisation de projet sur
mesure Big Data avec
exposition de services digitaux
www.gfi.fr
75
HEWLETT-PACKARD
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
HEWLETT-PACKARD FRANCE
20, Quai du Point du Jour
92100 Boulogne-Billancourt
Tl 0820 211 211
Mail bigdata.france@hp.com
Collecter, agrger et comprendre les informations issues des machines et des humains
requiert une approche et des technologies nouvelles, pour connecter intelligemment des
donnes de nature disparate, dune manire comparable au fonctionnement du cerveau
humain faire travailler la technologie et non linverse.
HP dcline sa stratgie Big Data au travers de HAVEn, plateforme ouverte, intgre mais
modulaire, qui permet nos clients de traiter 100% des informations leur disposition.
Hadoop est le support idal pour stocker de trs grands volumes de donnes faible cot.
Autonomy IDOL est un moteur extrmement puissant dindexation et danalyse des informations humaines : texte, mails, social media, vido, audio, etc.
CONTACT
Florence
LAGET
Vertica est une plateforme analytique temps rel (architecture en colonnes) capable dingrer les donnes et de traiter des requtes complexes 50 1000 fois plus rapidement
quune base de donnes traditionnelle
Enterprise Security (Arcsight Logger) collecte et analyse en temps rel (1.000.000 dvnements par seconde) les logs des applications et des quipements (Badgeuse, Login.).
Le n de HAVEn reprsente les applications dveloppes par HP et son cosystme
partenaires diteurs et intgrateurs.
Lensemble de cette plateforme est supporte par des infrastructures innovantes et spcifiquement adaptes au Big Data. Nous sommes en mesure daccompagner nos clients dans
la conception de leurs cas dusage, la mise en uvre, lexploitation ou lexternalisation de
ces solutions.
Cette banque europenne de12 millions de clients, dispose de prs dun millier dagences
et gre plus de 100 milliards de capitaux en 2013. Elle dtient une distinction pour la qualit
de son centre dappels et de ses plateformes internet, mobiles et rseaux sociaux.
La banque avait comme objectif dacclrer lanalyse des risques de scurit, la rponse
aux requtes et audits du rgulateur, tout en se donnant les moyens damliorer lefficacit
de ses campagnes marketing.
Tous les types de donnes sont capts: applications mtiers, DAB, agences, rseaux sociaux,
logs qualit de service.
Le projet est implment sur la plateforme HAVEn telle que dcrite dans larchitecture
ci-dessous :
Le projet se droule en 3 phases qui rpondent aux 3 enjeux auxquels doit faire face la socit :
Conformit - identifier les accs frauduleux aux comptes clients et rduire drastiquement
le temps de rponse aux requtes de conformit
Scurit - corrler les donnes entre les diffrents systmes pour dcouvrir et mieux
comprendre les potentielles failles de scurit
Gnration de revenus - amliorer la connaissance clients pour optimiser lefficacit des
campagnes marketing et lacquisition de nouveaux clients
Ce projet est innovant dans la diversit des sources et des formats de donnes utiliss.
www8.hp.com
77
IBM FRANCE
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
Instit.
IBM FRANCE
17 avenue de lEurope
92275 Bois Colombes
Tl +33 (0)1 58 75 00 00
Mail lucile.hyon@fr.ibm.com
Big Data permet de comprendre, avec plus de prcision que jamais, comment fonctionne
notre monde afin de produire une plus grande croissance conomique et du progrs social.
Il constitue une opportunit dobtenir des connaissances sur des types de donnes et de
contenus nouveaux, afin de rendre les entits plus agiles. Plateforme Big Data IBM IBM
seul propose une plateforme complte qui permet de rsoudre les dfis Big Data qui se
posent aux organisations. Le principal bnfice dune telle plateforme est de tirer parti de
composants pr-intgrs afin de rduire le cot et le temps dimplmentation.
CONTACT
Lucile
HYON-LE GOURRIEREC
Senior Marketing Manager
www.ibm.com
KEYRUS
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
KEYRUS
155 rue Anatole France
92300 Levallois- Perret - France
Tl +33 (0)1 41 34 10 00
Mail bigdata-keyrus@keyrus.com
CONTACT
Xavier
DEHAN
Sales Director - Data Intelligence
Big Data Analytics
Fort dune capacit unique mobiliser conjointement lexpertise mtier, analytique et technologique indispensable au succs des ambitions analytiques et Big Data de ses clients, Keyrus rpond
aux dfis daujourdhui par des modalits bien tangibles et pragmatiques, ancres dans la
ralit de lentreprise et cibles sur des projets concrets et accessibles, construisant ainsi
les fondations dun avantage concurrentiel dans la dure.
www.keyrus.fr
<<www>>
81
MICROPOLE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
Micropole lance la 1re offre Big Data as a Service destination des entreprises.*
MICROPOLE
Loffre Data Science Platform est le rsultat dune troite collaboration entre de grands acteurs du march : Micropole, entreprise internationale de conseil en technologies innovantes,
spcialise dans les domaines de la Transformation Digitale et du Pilotage de la Performance
et les entreprises de Cloud Souverain, producteurs de puissance numrique pour les entreprises, au travers de leurs solutions dinfrastructure performantes et innovantes.
Indite, loffre de services Data Science Platform est destine dmocratiser le Big Data en
France en mettant disposition de chaque entreprise sa plateforme Big Data sur-mesure.
Data Science Platform intgre un studio de Data Science (qui combine des outils de gestion
de donnes, de statistique, de visualisation et danalyse prdictive), permettant dintgrer, de
manipuler, danalyser et de prsenter rapidement linformation issue de larges quantits de
donnes.
Spcialistes mtiers, les quipes Micropole accompagnent les quipes clientes tout au long
du projet. Leur valeur ajoute et leur vision fonctionnelle adapte au Big Data, leur permettent
de produire des cas dusages mtiers, gages de ROI et gnrateur davantages conomiques
ou concurrentiels pour lentreprise.
Innovante et comptitive, loffre Data Science Platform rvolutionne les offres traditionnelles
existantes sur le march. Une rponse totalement nouvelle qui va permettre toutes les entreprises de tirer parti de la puissance du Big Data.
Loffre Data Science Platform se dploie en 24h au sein de nos infrastructures. Nos quipes
vous accompagnent sur la dfinition de votre application Big Data, et tout au long du projet
dans la prise en main des outils.
Pour des questions de scurit et de transparence, notre offre est propose sur les plateformes dployes au sein de Cloud Publics Souverains. Cela signifie que vos donnes sont
protges par la lgislation franaise, et localises sur le territoire national.
CONTACT
Charles
PARAT
Directeur recherche & Inovation
*Pour des questions de rversibilit, loffre Data Science Platform est base sur des briques
standards du march et peut donc tre installe sur le site de votre choix (on premise).
Le cycle de cadrage du besoin permet davancer rapidement sur les besoins remplir et
le travail des sources associes. Lavantage est que les dcouvertes faites pendant ltude
dtaille des donnes sont rpercutes sur les besoins initiaux. Ce processus est rpt
autant de fois que ncessaire.
A lissue de cette phase, les cycles de cadrage des donnes dbutent. Une phase de ralisation technique a lieu entre chaque point de cadrage et chaque prsentation.
Pendant la prsentation des rsultats, les quipes fonctionnelles peuvent suivre et prvalider les ralisations. Les quipes techniques peuvent remonter des problmes rencontrs
pendant les dveloppements. Dans les 2 cas, les points discuts sont inclus dans le cadrage
des donnes. Il est possible de remonter au cycle prcdent si la situation lexige.
La phase de validation du primtre clture le processus. Elle prend un temps minime,
compte tenu du travail effectu en amont.
Les rsultats
Sur une phase dexprimentation de 3 mois, il ne nous a fallu que 3 semaines sur un gisement de donnes de plusieurs centaines de gigaoctets, pour mettre en vidence les premiers comportements clients et dfinir les parcours clients associes.
Lusage dun logiciel de Data Science (solution combinant des outils de gestion de donnes,
de statistique, de visualisation et danalyse prdictive), a permis de modliser facilement
les parcours clients, dindustrialiser le processus et de prsenter les rsultats en utilisant
une solution de Data Visualisation (lutilisation de techniques visuelles et interactives pour
valoriser ses donnes).
A lissue de la phase dexprimentation, la solution a t dploye en production. Les outils
de Data Science utiliss dans le cadre du Datalab ont quant eux naturellement intgr le
panorama des outils standard du service Marketing pour la production des analyses bases
sur la plateforme Big Data.
www.micropole.com
83
NEO TECHNOLOGY
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
NEO TECHNOLOGY
Tl +33 (0)8 05 08 03 44
Mail Cedric.Fauvet@neotechnology.com
CONTACT
Cedric
FAUVET
Business Development France
Neo4j vous permet de reprsenter les donnes connectes naturellement, en tant quobjets
relis par un ensemble de relations, chacun possdant ses propres proprits. La base de
donnes de graphes, permet au dveloppeur de commencer immdiatement coder, car
les donnes stockes dans la base font le parallle direct avec les donnes elles mmes.
Compar aux bases relationnelles, la base de donnes de graphe Neo4j peut tre jusqu
plusieurs milliers de fois plus rapide pour traiter les donnes associatives, tout en simplifiant considrablement les requtes qui peuvent stendrent plus facilement de larges
ensembles de donnes, car elles ne ncessitent pas de recourir aux coteuses jointures
du monde SQL. Les traverses utilisent un langage spcialement adapt pour parcourir
les connections trs simplement, et trs rapidement. Vu quelles ne dpendent pas dune
modlisation rigide, Neo4j est plus propice pour la gestion de donnes changeantes et de
schmas voluant frquemment.
Les bases de donnes de graphes sont un outil puissant pour excuter des requtes de type
parcours de graphe. La recherche du plus court chemin entre deux points du graphe permettant, par exemple, de rsoudre facilement les requtes sociales ainsi que de gographie
et danalyse dimpact.
Si vous vous arrachez les cheveux avec de nombreuses jointures et les procdures stockes
complexes, il est fort possible que vous soyez en train de construire un graphe sans le savoir :
car les graphes sont partout. Depuis les applications sociale web jusqu lanalyse dimpact
sur un rseau Telecom en passant par la recherche en biologie, les recommandations, la
scurit, et la dtection de fraude, de nombreuses organisations ont adopt la bases de
donnes de graphes Neo4j pour augmenter leurs capacits et leurs performances. Cest un
systme conu pour grer les donnes connectes que vous rencontrez de plus en plus au
quotidien, qui est nanmoins fortement matur avec plus de 10 ans en production.
Dcouvrez avec nous ce quapporte la puissance de Neo4j une large varit de clients tels
que Walmart, SFR, Cisco, eBay et Glowbl.
venements: neo4j.com/events
Training: neo4j.com/graphacademy
Neo4j dans votre socit: neo4j.com/brownbag
Tlcharger Livre: neo4j.com/books
Venez rencontrer
Paris lquipe
franaise de Neo4j
loccasion du salon
Big Data 2015,
stand 404!
Neo4j
Le leader mondial
des bases de donnes de graphes
LA SOCIETE
Spcialise depuis 2009 dans la livraison rapide dachats raliss sur internet, cest tout
naturellement que la socit londonienne Shutl a t rachete par eBay, qui en a fait sa
plateforme nouvelle gnration pour redfinir le e-commerce en acclrant et en simplifiant la livraison des commandes passes sur Internet ou appareil mobile. eBay limine
ainsi le plus gros obstacle entre vendeurs et acheteurs en ligne en proposant une livraison
le jour mme.
LE DFI
POURQUOI NEO4j?
Le choix sest port sur Neo4j, considre comme la meilleure solution pour sa flexibilit,
sa vitesse et sa simplicit dutilisation. Fort de son modle de graphe proprits parfaitement compatible avec le domaine modlis, et avec sa base de donnes ne ncessitant
pas de schma, Neo4j a simplifi son extensibilit et a permis dacclrer la phase de dveloppement.
Cypher a de son ct permis dexprimer les requtes sous une forme trs compacte et
intuitive, ce qui a encore acclr le dveloppement. Lquipe a ainsi pu exploiter le code
existant laide dune bibliothque Ruby pour Neo4j prenant galement en charge Cypher.
Comme aime le dire Volker Pacher : Notre systme fonctionne sur 7 lignes de Cypher .
LES AVANTAGES
Base sur jRuby, Sinatra, MongoDB et Neo4j, la nouvelle plateforme garantit des transactions rapides avec des performances relativement constantes. Par ailleurs, son modle de
donnes permet aux requtes de rester localises lintrieur de leurs portions respectives
du graphe.
Notre solution Neo4j est littralement des milliers de fois plus rapide que la solution
MySQL prcdente, avec des requtes qui ncessitent de 10 100 fois moins de code. Dans
le mme temps, le ct flexible de Neo4j nous a permis dimplmenter lenemble en peine
une anne et il nous permet encore dajouter des fonctionnalits jusquici impossibles, ce
qui permettra laccompagnement du service eBay Now dans ses futurs dveloppements.
Volker Pacher, eBay
Aujourdhui et grce Neo4j, la plateforme Shutl orchestre les livraisons entre les boutiques,
les coursiers et les acheteurs 24 h/24 et 7 j/7. Les envois seffectuent directement depuis les
points de vente. Le service organise la collecte et la livraison des articles selon les prfrences des clients, gnralement dans un dlai de 2 heures, ou dans une fentre de livraison dune heure choisie par les clients. Le rsultat : une prestation innovante qui amliore
la qualit de service pour les clients ainsi que la productivit des partenaires revendeurs et
transporteurs. Tous les acteurs sont gagnants : les clients disposent de plus de choix pour
la livraison, les coursiers ne perdent plus de temps attendre et les boutiques peuvent
proposer des services supplmentaires leurs clients sur Internet.
www.neo4j.com
85
PENTAHO
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
Instit.
PENTAHO
Paris France
Pentaho Business Analytics pour exploiter plus rapidement et moindre cot les Big Data grce :
Tl +33(0)6 38 38 06 33
Fax 1 407 517-4575
Mail ebrochard@pentaho.com
CONTACT
Emmanuel
BROCHARD
Responsable France
Lutilisation de Pentaho Business Analytics avec Hadoop offre une conception graphique hautement productive associe une analyse et une visualisation des donnes instantanes:
Une plate-forme danalyse Hadoop complte
Une meilleure productivit de lquipe informatique grce la rutilisation des comptences existantes ; sans formation particulire pour les informaticiens, analystes dentreprise et scientifiques spcialistes des donnes
Une protection contre les risques : fonctionne avec toutes les principales distributions
Hadoop, les bases de donnes NoSQL et les entrepts de donnes traditionnels
Productivit et performance : gain en productivit de dveloppement et en performance
dexcution multipli par 10 ou par 15 par rapport au codage manuel MapReduce
Analyse et visualisation NoSQL : Pentaho supporte nativement les bases de donnes NoSQL
Big Data Analytics Center : www.pentahobigdata.com pour en savoir plus sur Pentaho et Big
Lintgration et lanalyse des Big Data pour concevoir une proposition de valeur commerciale
Soyons clairs, montiser les Big Data ne se limite pas vendre plus facilement des assurances additionnelles sur des crdits immobiliers. Il sagit doffrir des services et expriences
personnaliss exceptionnels qui conduisent terme une proposition de valeur commerciale, ou de maximiser la valeur totale dun client au travers de toutes ses interactions et transactions. En dterminant les diffrents besoins des clients et en intgrant cette connaissance
dans toutes ses transactions, une banque devrait tre capable damliorer le service client et
la fidlisation ainsi que daugmenter sa propre profitabilit en optimisant ses prix en fonction
de la valeur client. Aussi simple que cela puisse paratre, ceci a chapp aux banques de dtail
pendant des annes parce quelles ont tabli leurs prix sur des suppositions trop gnriques
et se sont davantage concentr sur la croissance des revenus plutt que sur lenrichissement
de la valeur client. Contrairement dautres marchs tels que les fournisseurs daccs internet qui offrent des services leurs clients, les banques de dtail sont les seules dtenir
des donnes concrtes sur ce que leurs clients ont exactement dpens, quand et quelle
frquence. Elles disposent donc des meilleures donnes pour tablir des profils de clients
dtaills et concevoir en consquence des produits et services sur mesure.
Le service fondamental qui profite la banque de dtail et ses clients est la capacit
fournir cette vue intgre 360 degrs du portefeuille complet de chaque client dcrit
prcdemment. Cette vue ncessite de fonctionner de deux faons ! En effet, les banques
devraient avoir cette vue holistique de leurs clients, mais simultanment les clients demandent la mme visibilit de leurs produits et services. Cela implique de pouvoir utiliser
un seul mot de passe pour se connecter et de tout visualiser au travers dun tableau de bord
clair et simple. Les clients prfrant traiter en face face ou par tlphone devraient obtenir une exprience intgre similaire sans tre transfrs vers dautres services utilisant
des systmes informatiques non intgrs. Cette vue 360 est le prrequis qui permettra
de montiser les donnes avec plus de profit. Comme voqu plus haut, de nombreuses
banques craignent que leurs donnes schappent de leurs silos scuriss si elles tentent
de les intgrer de nouvelles applications qui amliorent lexprience des clients ou des
responsables de la banque. Cependant, de nouveaux outils dintgration de donnes sophistiqus permettent aux banques de mlanger les donnes la source sans devoir les
transfrer au pralable dans une zone de transit . Ces mmes outils permettent galement dtablir des rgles simples qui garantissent que les donnes soient traites selon les
rgles de gouvernance des donnes locales ou europennes, ce qui liminent virtuellement
les risques de failles de conformit et de scurit.
www.pentaho.fr
87
PIVOTAL
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
PIVOTAL / EMC
80 Quai Voltaire - CS 21002
95870 Bezons - France
Tl +33 (0) 1 39 96 96 37
Mail info@pivotal.io
Instit.
La prise de dcision en temps rel est essentielle au succs de lentreprise. Pourtant, les
donnes de votre entreprise continue de crotre de faon exponentielle danne en anne,
ce qui rend lanalyse plus difficile. Pour transformer les donnes structures et non structures en intelligence dcisionnelle, votre entreprise a besoin dune intelligence efficace
pour exploiter le Big Data. Pivotal propose, au travers de Pivotal Big Data Suite, une solution
logicielle de Business Data Lake permettant le stockage et le polymorphisme de traitement
de tout type de donnes. General Electric, American Express, Axel Springer, NTT, Monsanto
et SouthWest Airlines comptent parmi nos rfrences.
Pour plus dinformation sur Pivotal Big Data Suite :
http://www.pivotal.io/big-data/pivotal-big-data-suite
Farid
AADIM
EMEA Inside Sales Manager
A propos de Pivotal :
N dune spin-off de EMC et de Vmware, Pivotal est un diteur de logiciel offrant une approche technologique moderne afin de permettre aux Entreprises dinnover dans de nouveaux business. A lintersection du Cloud, Big Data et du dveloppement Agile, Pivotal permet de mieux utiliser ses donnes, dacclrer la cration dapplication et de rduire les
couts, tout en proposant ces Entreprises, la vitesse et la dmultiplication dexcution dont
elles ont besoin pour tre plus comptitifs.
Description
Spring
Spring helps development teams build simple, portable, fast, and flexible JVM-based systems and applications. Spring is
the most popular application development framework for enterprise Java.
RabbitMQ
Increase application speed, scalability and reliability by delivering asynchronous messaging to applications. A message
broker for applications.
GemFire
Pivotal GemFire is a distributed data management platform designed for many diverse data management situations, but is
especially useful for high-volume, latency-sensitive, mission-critical, transactional systems.
Scale-Out Performance Consistent database operations across globally distributed applications High
availability, resilience, and global scale Powerful developer features Easy administration of distributed nodes
GemFireXD
Data Consistency with Cloud Scalability Extreme Performance and Continuous Uptime with Predictable Performance
Data Aware Parallel Function Execution Data Stream with Enterprise Data Store Correlation Relational Technology
Based on Apache Derby Referential Integrity Standards-Compliant Powerful Querying Engine - ANSI Data-Dependent
and Data-Aware Java Stored Procedures
Pivotal HD
Simple and Complete Cluster Management: Command Center Big Data + Big Computing: GraphLab on OpenMPI
Hadoop In the Cloud: Pivotal HD Virtualized by VMware Spring Data: Build Distributed Processing Solutions with Apache
Hadoop
HAWQ
A Fast, Proven SQL Database Engine for Hadoop Big Data Analytics Capability and Productivity Parallel Data Flow
Framework Dynamic Pipelining Extension Frameworks with Hbase, Hive, etc PXF Big Data Analytics Capability
and Productivity - MADlib
(Hadoop)
www.pivotal.io/contact
89
QLIK
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
QLIK
93, avenue Charles de Gaulle
92200 Neuilly-Sur-Seine
Tl +33 (0) 1 55 62 06 90
Mail infoFR@qlik.com
CONTACT
Stphane
BRIFFOD
Instit.
Qlik (NASDAQ : QLIK), leader en matire de Data Discovery, propose des solutions intuitives
de visualisation en libre-service et danalyse guide. Environ 33 000 socits sappuient
sur les solutions de Qlik pour extraire des informations essentielles de sources diverses et
explorer des relations invisibles qui donnent naissance des ides novatrices. Le groupe,
dont le sige se trouve aux Etats-Unis, possde des bureaux dans le monde entier et compte
plus de 1 700 partenaires dans plus de 100 pays. En France, la filiale a t cre en 2007 et
compte parmi ses clients des socits telles que 3M, la Socit Gnrale, le CNRS, Bayer
Healthcare, Meetic, Essilor, RueDuCommerce, le Groupe SEB, etc.
Le dploiement de lenvironnement danalyse en libre-service des solutions Qlik ne ncessite que quelques jours ou quelques semaines et rpond aux besoins des PME comme des
plus grandes entreprises internationales.
Le modle orient applications des solutions Qlik est compatible avec les solutions de BI
existantes et offre une exprience base sur limmersion et la collaboration et intgrant une
dimension collaborative et mobile.
Director Presales
www.qlik.com/fr
www.qlik.com
91
SAP FRANCE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
Leader des applications dentreprise, SAP (NYSE : SAP) fournit aux entreprises de toutes
tailles et de tous secteurs les moyens logiciels dune meilleure gestion. Du back office la
direction, de lentrept la vente, quel que soit le terminal dutilisation (ordinateur, terminal mobile), les applications SAP permettent aux collaborateurs et aux organisations de
travailler plus efficacement ensemble et de sappuyer sur des tableaux de bord personnaliss afin de conserver leur avance dans un contexte concurrentiel. Les applications et
services SAP offrent plus de 281 000 clients la possibilit dtre rentable, de sadapter
continuellement et de crotre durablement
SAP FRANCE
Tour SAP - 35 rue dAlsace
92300 Levallois-Perret
Tl 0805 800 023
Mail jean-michel.jurbert@sap.com
Didier Mamma
Nouvelle approche et vision stratgique : comment le Big Data bouleverse notre conomie
CONTACT
Jean-Michel
JURBERT
Directeur de March Solutions SAP
HANA, BI - Big Data
Didier Mamma
Didier Mamma est Vice-President of Big Data Sales Emea chez SAP. Fascin par le pouvoir
des donnes, il tient en tudier la porte stratgique et les grands blocs fonctionnels.
Le Big Data nest certainement pas une nouvelle technologie mais bien un moyen de repenser son avantage concurrentiel. Comme la remarquablement dcrit Jeremy Rifkin nous
sommes entrs de plain-pied dans la 3e rvolution industrielle, digitale et hyperconnecte.
On ne peut plus apprhender le prsent avec les paradigmes du pass.
La digitalisation remet galement en cause tous les modles conomiques. Amazon, Netflix, Nest, eBay, Apple, Crito, Houzz, Google sont quelques exemples dentreprises qui
sont en train dtablir un nouvel ordre conomique trans-industries.
La question demeure dans la capacit des entreprises capter et traiter cette multitude
dinformations dsormais leur disposition. Comment imaginent-elles lavenir de leur business ? Dans ce contexte, la rpartition des dpenses des principaux groupes du CAC40
semble alors dsquilibre. En moyenne, ils ddient 72% de leurs investissements la
maintenance de leur systme dinformation. Dramatiquement, une faible partie des dpenses est alloue linnovation.
Pour librer une part de cet important budget, lide de SAP est de simplifier lexistant.
Cest lobjectif de SAP HANA. La Plateforme HANA est capable daccueillir et de traiter la
varit des donnes de lentreprise, analytiques ou transactionnelles, structures ou non.
Finie la frntique duplication des donnes et laccroissement du plat de spaghettis
informatique. Parmi les 3V qui dfinissent le Big Data, on se focalise souvent sur le V de
volume, or cest la notion la plus simple grer. La complexit des traitements ou calculs,
la vlocit des oprations suffisent justifier une approche Big Data. Comme le dit Didier,
on peut faire du Big Data avec des gigabites ! . En dfinitive, le Big Data en mouvement
ncessite quatre dimensions. La premire est lie la puissance de calcul pur et rapide. La
seconde, la capacit dextraire linformation cache des donnes. La troisime rendre
intuitive le rsultat des analyses grce la visualisation. Et la dernire dimension est lexpert qui connat la nature de la donne et sa valeur potentielle.
Interviews
Frderic PUCHE
www.sap.com
Frderic PUCHE
93
SAS
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
SAS INSTITUTE
Domaine de Grgy
Grgy-sur-Yerres
77257 BRIE-COMTE ROBERT CEDEX
Tl 01 60 62 11 11
Fax 01 60 62 11 20
Mail comsas@fra.sas.com
CONTACT
Serge
BOULET
Directeur Marketing
SAS, leader mondial des solutions de business analytics, propose des outils analytiques
puissants, des solutions de pilotage de linformation et de business intelligence, pour vous
aider faire face aux challenges daujourdhui et anticiper les opportunits de demain.
Vous avez besoin dune solution spcifique adapte votre secteur ? Dune solution fonctionnelle transverse pour rpondre vos challenges ? Quelle que soit votre problmatique,
SAS a une rponse.
Nous vous aidons valoriser votre relation client, piloter vos risques, combattre la
fraude et optimiser vos rseaux informatiques. Nos solutions sappuient sur un socle
technologique avec trois composantes cl : la gestion des donnes, les outils danalyse et
la restitution de linformation.
Avec SAS, la business analytics est accessible et simple : SAS Visual Analytics vous permet dexplorer visuellement et rapidement vos donnes, de crer vos rapports et partager
les rsultats sur le web ou sur tablette.
Les enjeux analytiques des projets Big Data sont la fois dordre technologique et mtier
avec des problmatiques lies la nature, au volume et la localisation des donnes, des
architectures extensibles, des comptences varies, une agilit et une prcision danalyse,
et de nouveaux besoins relatifs ces donnes.
La nouvelle plateforme analytique de SAS permet danalyser interactivement toutes les
nouvelles sources de donnes pour crer des modles prdictifs intgrs un cycle analytique complet. Elle permet aux analystes de travailler en faisant appel une riche bibliothque dalgorithmes et de mthodes analytiques pour crer et modifier dynamiquement
les modles prdictifs.
Cette plateforme obtient des performances remarquables car les traitements sexcutent
en-mmoire, au plus prs des donnes et en mode distribu lorsque possible.
Hadoop reprsente la plateforme majoritairement utilise pour les projets Big Data, par le
faible cot de stockage, larchitecture volutive, lagilit de laboratoire qui la caractrise.
Votre succs est notre succs.
sas.com/tdwi
SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. indicates USA registration. Other brand and product names are trademarks of their respective companies. 2014 SAS Institute Inc. All rights reserved. S117789US.0114
Porteurs du Projet
Ce projet a t dirig par Kerem Tomak, Vice-Prsident Analytics de Macys.com, avec son
quipe danalystes.
Objectifs du projet
Lobjectif tait de mesurer lefficacit des campagnes marketing et les paramtres de navigation sur le site, connatre la Valeur Client, identifier les clients les plus fidles, et adresser
des promotions cibles aux meilleurs dentre eux.
Prsentation du projet
a. Nature des donnes traites
Macys.com exploite des donnes varies : donnes clients, suivi de campagnes de-mailings
de promotion, suivi de navigation, prfrences clients (ce quils aiment et naiment pas).
b. Ressources et mthodologie
Toutes les donnes analyser sont stockes sur une plateforme de donnes Hadoop Cloudera.
Elles sont analyses avec les solutions analytiques de SAS pour segmenter finement les
clients et calculer les scores propres chaque segment.
Lquipe analytique est aussi responsable du reporting destination des quipes marketing
et finance. Lautomatisation du cycle analytique a permis de rduire le temps de production
de ces rapports et dgager du temps pour gnrer plus danalyses et en accrotre la finesse
et la pertinence.
c. Calendrier de dploiement
Ce projet qui a dmarr en 2012 est en production depuis plusieurs mois et en perptuelle amlioration : ainsi, Macys.com a pu rduire le taux de dsabonnement ses campagnes marketing
de 20% et accrotre la productivit des analystes. Le gain est estim 500 000 USD par an.
Aspect Novateur
La capacit de comprendre le comportement multicanal des clients est critique pour amliorer
lexprience client et SAS est utilis pour analyser les donnes et crer les modles analytiques
qui valident et adaptent les algorithmes de up et cross sell .
Cette capacit analyser en profondeur et tirer parti des donnes est importante pour supporter la stratgie et le pilotage des volutions du sites Macys.com, commente Kerem Tomak.
Lquipe analytique de Macys.com tudie ladoption de solutions doptimisation des processus mtier pour maximiser lefficacit des campagnes promotionnelles en amliorant
encore le ciblage et en accroissant la ractivit.
La volont de Macys.com est de gnrer des informations plus prcises et en temps rel sur
les prfrences des clients afin de personnaliser dynamiquement les promotions.
Plusieurs clients SAS utilisent SAS et Hadoop conjointement pour valoriser leurs sources
de donnes (web, log machines, rseaux sociaux, verbatim Service Clients etc.), par
exemple dans des projets damlioration dutilisation de machines industrielles (Predictive
Asset Maintenance), pour fournir des recommandations cibles (produits, contenu) ou pour
accrotre lefficacit des messages publicitaires et des campagnes promotionnelles par un
ciblage prcis.
SAS Institute, socit prive cre en 1976. 70 000 sites clients, dont 2600 en France, plus
de 3 milliards de dollars de CA et 14 000 employs.
www.sas.com/france
95
SCINETIK
SCINETIK
+
IN T ELLIGENCE
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
SCINETIK
78 rue Taitbout
75009 Paris
Tl +33 673 804 708
Mail lively@scinetik.com
CONTACT
Xavire
TALLENT
CEO
E-BUSINESS
Instit.
Scinetik est un cabinet de conseil dont la mission est dassurer pour ses clients, le dveloppement prenne et rentable de leur activit de commerce connect.
Notre mission est daccompagner nos clients dans la dfinition et la mise en uvre de
stratgies de dveloppement sur lensemble des drivers de business de la conqute la
fidlisation en passant par la conversion. Pour y parvenir et afin de sassurer de lefficacit
des actions, Scinetik fonde lensemble de ses recommandations sur lanalyse de la donne.
Cette donne vient de multiples sources : le webanalytic, les comportements dachat, les
donnes CRM, des donnes externes...
Scinetik a t cr en raction au manque de pilotage des activits de commerce connect
au sein des retailers. Beaucoup dambitions, peu dexpertise data ou un manque de perception de lenjeu vital de lexploitation de la donne avant mme tout enjeu de branding et
dimage de marque.
Aprs plusieurs annes de veille sur la monte du Big data, beaucoup de lecture, la participation des confrences, la rencontre avec des entreprises ayant dmarr leur rflexion
big data en France mais surtout ltranger, notre client a dcid de mettre son entreprise
sur le chemin du big data.
En quoi le big data peut-il impacter vritablement lentreprise dans ses diffrentes dimensions ? Comment ne pas limiter le Big Data un super CRM comme cest le cas dans un grand
nombre dentreprises, notamment en France ?
Le dfi
La dmarche
Cration dun groupe de rflexion highlevel, ayant la fois la vision de lentreprise dans
son ensemble et ses particularits et galement le pouvoir de faire bouger les lignes.
Dfinition dune vision stratgique centrale
Dclinaison de cette vision sur les diffrents mtiers de lentreprise
Lide force : Cration de prototypes. Chaque prototype adresse une dimension de la big
data dans une dynamique vertueuse et apprenante
Dfinition de la mthodologie de rcupration et danalyse des donnes internes et externes
Dfinition de diffrents scnarios pour la mise en place de linfra, lenjeu ntant pas de
lancer de lourds investissements ds le dmarrage mais de tester plusieurs options pour
permettre les meilleurs choix terme
Lancement des prototypes
www.scinetik.com
97
SEMDEE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
Quelles proviennent directement de lentreprise (CRM, ECM, CMS, RSE, back office,
E-mails, dossiers textes, voir mme des DATA WAREHOUSE) ou de lextrieur (Sites Internet, Blogs, Forums, Rseaux Sociaux) les donnes non structures sont partout.
Confront ce dluge les Entreprises entendent parler de formidable opportunit , de
gisement de valeur ou de cration de valeur.
SEMDEE
15, Rue Jean Baptiste BERLIER
75013 PARIS
Tl +33 (0)1 55 43 79 60
Mail contact@semdee.com
CONTACT
Brice
HOARAU
CEO
Ces modules sont utilisables de manire autonome pour rpondre un simple besoin technique (recherche, classification etc) ou dune manire plus complte dans le cadre de la
solution SEMDEE SMART DATA FACTORY .
Dune manire gnrale, SEMDEE SMART DATA FACTORY se propose dindustrialiser lacquisition et lutilisation de la connaissance. SMART DATA FACTORY sadresse directement aux clients et aux intgrateurs qui souhaitent constituer leur propre plate-forme
danalyse de donnes.
Solution SEMDEE
SMART DATA FACTORY
SEMDEE SEO
PERSOnALiZED
COnTEnT
Web ferm
SEARCh
Blogs / Forums
Urls
RELATED COnTEnT
Flux Rss
Web ouvert
MOniTORing
ECM
Data marehouse
CMS
Composants du SI
RSE
E-mails
TAggER
SEnTiMEnT
AnALYSiS
CRM
Txt
Espace
Smantique
SEMDEE
PREDiCTiVE
AnALYSER
PROFiLER
CATEgORiZER
Prsentation
Voici les principales tapes qui seront menes dans le cadre de ce projet :
A) Rcupration des historiques des donnes des clients qui ont quitt le service.
Ces donnes peuvent provenir :
a. Du web
b. Des rseaux sociaux
c. Des plates-formes de service
d. Des emails
e. Des posts dans les forums
B) Agrgation des donnes par client
C) Indexation smantique de ce contenu
D) Pondration des contenus en fonction des connaissances mtiers
E) Gnration de lensemble des profils des clients
F) Dtermination dun seuil d alerte (proximit par rapport ces profils)
G) Rcupration de contenus mis par les clients actuels du service dans
a. Les formulaires
b. Les emails
c. Les rseaux sociaux
d. Les forums
e. Les plates-formes de services
Aspect Novateur
Fonctionnement instantan
(pas de besoin de dictionnaire, de lexique etc)
Fonctionne sur lensemble du contenu (pas limit
un groupe de mots ou de phrases mais sur des
textes entiers) - Fonctionne dans toutes les langues.
Machine learning : plus le systme va fonctionner
plus il va devenir prcis.
Toutes les tapes cognitives sont intgres en une
seule solution = Cohrence cognitive accrue.
Comptences humaines :
Calendrier de dploiement :
Les dures sont donnes titre indicatif car elles dpendent videmment du volume de donnes, de la diversit des supports et de la qualit de la connaissance mtier mis disposition.
A partir du moment o les sources de donnes sont prcisment identifies :
Extraction des donnes (1 2 semaines selon complexit et le nombre de support)
Indexation smantique et paramtrage (1 semaines).
Paramtrages des profils et alertes (1 semaine)
Mise en place des modules connexes permettant un meilleur confort (recherche,
enrichissement de linformation, suggestion de profils etc (1 semaine/module)
Intgration, personnalisation dans lenvironnement utilisateur (intgrateur)
www.semdee.com
99
SENTELIS
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
SENTELIS
31 Rue du pont
92 200 Neuilly-sur-Seine
Tl +33 (0)6 76 09 82 46
Mail i.regnier@sentelis.com
CONTACT
Isabelle
REGNIER
Associ Fondateur
Instit.
www.sentelis.com
Mettre en place un socle Big Data cross-mtiers pour servir les nouveaux usages 3.0 :
Analyse ractive (contextualisation temps rel de la relation client sur tous les canaux)
Analyse historique du portefeuille client sur lensemble des donnes disposition
(micro-segmentation, qualit et volution de la relation, segmentation comportementale)
Analyse prdictive du portefeuille client (dtection dopportunits, prvention des risques)
Prsentation
Intgration dans un lac de donnes dune trs grande varit de donnes reprsentatives du
systme dinformation (donnes transactionnelles, vnementielles, conversationnelles,
sociales rfrentielles, dcisionnelles) pour un volume avoisinant plusieurs milliards de
donnes.
Ralisation en 2 tapes majeures pour scuriser la mise en uvre de la fondation Big Data :
Identification de cas dusage candidats.
Conduite dune preuve-de-concept valeur mtier et architecturale sur une infrastructure Commodity Hardware et des composants Open Source de lcosystme Hadoop
Ralisation dune preuve de concept sur un usage emblmatique (Vision 360 Client) au
sein dune quipe mixte mtier-SI en mode agile (Utilisateur mtier, Ergonome, Analyste
Donne, Statisticien, Architecte Big Data, Dveloppeur Big Data) incluant :
Lingestion en masse des donnes dans une logique Schema-less/Store-first-Ask-Later
Lingestion de donne unitaire haute vlocit et sans latence
Le traitement en masse des donnes pour corrler lensemble des donnes clients
Lindexation en masse des donnes pour permettre leur exploration
Lexposition de services pour banaliser laccs aux donnes et aux traitements
Calendrier de dploiement
Aspect Novateur
Le projet permet denvisager une exploitation de toutes les donnes disponibles structures et
non-structures comme jamais auparavant, sans frontire de temps ni despace (ex : analyse
des commentaires clients dans les questionnaires de satisfaction et corrlation avec la notation
; dtection de nouvelle segmentation via des algorithmes danalyses non propritaires).
Les tapes venir sont : Industrialisation du socle Big Data (pratiques et solutions) - Mise
en production des premiers usages.
Ces tapes saccompagnent en parallle de la dfinition de loffre de service associe la
fondation Big Data et de lorganisation pour en assurer la prennit et le dploiement dans
lentreprise.
Autres informations : La mise en place du lac de donnes a t un rvlateur et un catalyseur
de nouveaux usages pour lensemble des mtiers, encourags par des cots et une performance de traitement sans commune mesure avec lexistant. Elle ouvre la place, au-del de
lamlioration de la Business Intelligence et du dveloppement de la Business Analytics, au
dveloppement de la Data Science pour tirer le maximum de valeur du capital informationnel
de lentreprise. Elle a mis en vidence la ncessit dune gouvernance de la donne resserre pour matriser lexplosion des donnes et des usages. Le lac de donnes est la premire
tape vers la construction dune infrastructure fdre des donnes entre monde oprationnel et monde analytique (Shared Data Backbone), dont la frontire disparait.
www.sentelis.com
101
SINEQUA
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
Instit.
SINEQUA
Le dfi du Big Data : Plus de 80% de ces donnes sont non structures - des textes en
Tl +33 (0)1 70 08 71 71
Fax +33 (0)1 45 26 38 92
Mail pornain@sinequa.com
CONTACT
Xavier
PORNAIN
VP Sales & Alliances
Notre mission :
Notre solution :
Une analyse de contenu unique, base sur une analyse smantique brevete (traitement
du langage naturel) et sur une exprience en traitement de donnes structures provenant
dapplications mtier
Une architecture informatique trs performante et scalable, permettant de grer des
dizaines de milliers dutilisateurs et des milliards de documents en temps-rel
Une intgration scurise et homogne avec plus de 140 sources de donnes
Notre exprience :
Lun des principaux oprateurs de tlcommunication en Europe utilise Sinequa pour dlivrer instantanment aux employs de ses centres dappels une vue 360 des clients. Il
rduit ainsi de manire significative la dure moyenne des appels, diminue le cot daccs
linformation et rend possible le dveloppement dInfo Apps en mode agile pour rpondre
lvolution du business.
Porteurs du projet
Cot client, le projet a t port par la DSI de la Relation Client, avec une implication forte
du Mtier de la Relation Client notamment pour son impact sur lergonomie des Chargs
de Clientle (CC).
Objectifs
La nouvelle interface de travail des CC leur permet de rpondre directement 80% des requtes client. Libr dune navigation chronophage entre plusieurs applications (plus de 30
dans certains cas), le CC peut traiter la demande du client plus efficacement.
Le dcouplage entre la lecture des donnes et laccs aux applications back-office amliore
les performances et rduit les temps de rponse, mme durant les piques dactivit.
Le systme dinformation gagne en agilit puisque des applications (Info Apps) peuvent tre
dveloppes rapidement afin de sadapter aux volutions du business.
La complexit du Back-Office existant (ERP, CRM, etc.) sefface devant la nouvelle interface
du CC rduisant le besoin de connaissance des outils Back Office.
Prsentation
b. Ressources et Mthodologie
c. Calendrier de dploiement
Aspect Novateur
Fdrer de la donne structure et non-structure afin de crer une vue 360 client en
temps-rel pour des milliers de CC est lun des cas dusage du Search et de lAnalyse de
donne Big Data les plus innovants raliss aujourdhui. Le Search joue dsormais un
rle dterminant au cur de processus mtiers stratgiques. Offrant un vritable levier de
comptitivit, il ouvre la voie des innovations qui nauraient pu voir le jour dans des architectures informatiques classiques .
En peine neuf mois, le projet a t dploy auprs de 10 000 CC. Le ROI en satisfaction
client et en temps gagn par appel sest fait sentir trs rapidement aprs le dploiement.
La mise en place du nouvel accueil client permet de rduire de prs de 20% la dure
moyenne des appels donnant ainsi aux 10 000 CC la capacit de traiter environ 40.0 000 appels supplmentaires par jour, et daugmenter lARPU (Average Revenue Per User) grce
une meilleure connaissance du Client (permettant de proposer les offres les plus adaptes).
A lavenir, encore plus de sources de donnes pourront tre indexes, y compris des donnes
non structures provenant par exemple des rseaux sociaux (Data-profiling, Data-scoring).
www.sinequa.com
103
SPLUNK
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
SPLUNK
Tl 01 55 68 12 61
Mail emea_france@splunk.com
CONTACT
Pierre
GOYENEIX
Directeur Commercial EMEA South
Splunk Enterprise 6.1 est notre dernire version et offre des fonctionnalits conues pour
amliorer la manire dont vous analysez vos donnes et interagissez avec elles, tout en
proposant une disponibilit continue de votre dploiement distribu de Splunk Enterprise.
Recueillez et indexez les donnes machines de toutes les sources ou presque en temps
rel. Explorez, surveillez, analysez et visualiser vos donnes pour obtenir de nouveaux renseignements. Indexez toutes vos informations pour bnficier dune meilleure visibilit et
renforcer vos capacits dinvestigation et de dpannage. Travaillez plus intelligemment en
partageant des recherches entre quipes et en accumulant des connaissances propres
votre organisation. Crez des rapports cibls pour identifier des tendances ou rpondre
des contrles de conformit. Composez des tableaux de bord interactifs pour surveiller les
incidents de scurit, les niveaux de services et autres indicateurs cls de performance.
Analysez les transactions des utilisateurs, le comportement des clients, celui des machines, les menaces de scurit et les activits frauduleuses, le tout en temps rel.Indexez
toutes les donnes
T:190 mm
T:124 mm
SECTEUR
RSULTATS
Meilleure exprience utilisateur avec une rduction de 82 % des temps de rponse des pages.
Amlioration du rfrencement naturel par lidentification et la rparation ou la suppression des liens non trouvs. Identification en temps rel des divergences de configuration,
permettant dviter des pertes de recettes. Relation proactive avec les oprateurs pour
rectifier les erreurs humaines du processus.
SOURCES DE DONNES
Dfis
Karavel attache une grande importance la haute qualit de service offerte ses clients,
mais souffrait dun manque de visibilit dtaille sur son architecture informatique. Des
outils de surveillance taient bien utiliss, mais ils ne fournissaient pas une vision suffisamment prcise. Karavel pouvait par exemple connatre le temps de rponse moyen des
pages principales dun site donn, mais pas la distribution dtaille des temps de rponse
; il ntait donc pas possible de savoir combien dutilisateurs recevaient un service infrieur
aux accords internes sur les niveaux de service, ni didentifier prventivement les situations
o ceux-ci taient sur le point dtre enfreints. Ce manque de visibilit avait en outre des
consquences sur le processus de rservation en ligne, car Karavel ntait pas en mesure
de dtecter certains problmes : par exemple, des divergences entre les configurations
dun produit cr par loprateur, import sur la plateforme de Karavel et offert aux clients
via le site web. Certaines erreurs rendaient impossible la finalisation de lachat par le client.
Intervention de Splunk
Karavel a choisi Splunk Enterprise pour garantir la qualit de ses services de rservation en
ligne, mieux comprendre et amliorer les temps de rponses de ses pages web, et assurer
le respect de ses accords sur les niveaux de service. Les logiciels Splunk sont maintenant
utiliss tant par lquipe technique que par lquipe commerciale de Karavel, et servent
amliorer le service offert aux clients par toutes les marques de lentreprise. Lquipe technique surveille en temps rel le processus de rservation en ligne, et utilise des alertes automatiques qui se dclenchent lorsque quun nombre anormalement lev derreurs se produit.
Elle examine dautre part chaque semaine les rapports de Splunk exposant les temps de
rponse des pages web. Lquipe commerciale observe elle aussi les rapports de Splunk, pour
identifier et rectifier prventivement tout problme. En outre, les tableaux de bord de Splunk
fournissent lquipe de direction des indices hebdomadaires de performances.
Karavel envoie Splunk Enterprise les logs de son proxy inverse Varnish et de Tomcat. Un
relayeur envoie ces donnes deux indexeurs ayant une tte de recherche unique. Karavel utilise les logiciels Splunk conjointement avec AppDynamics, effectuant les recherches
avec Splunk et utilisant ensuite AppDynamics pour des investigations en temps rel. Karavel a aussi construit des applications Splunk ddies : une pour le processus de rservation
en ligne et une pour laccord de service de chaque site web.
Progrs
Une meilleure vision relative aux accords sur les niveaux de service des sites web a diminu
les temps de rponse de 82 % Identification en temps rel des divergences de configuration
des rservations en ligne Optimisation du rfrencement naturel quipe commerciale
En rsum, lutilisation de Splunk Enterprise pour obtenir une intelligence oprationnelle
dtaille sur son architecture web a apport Karavel une nouvelle comprhension approfondie de la performance de ses sites. Les quipes de toute lentreprise, la fois techniques
et fonctionnelles, utilisent Splunk Enterprise pour amliorer la qualit de service fournie
aux clients des sites du catalogue de Karavel.
Nous proposons aujourdhui une meilleure exprience de navigation sur notre catalogue
de sites de voyages, avec des temps de rponse rduits et une identification immdiate de
divergences de configuration potentiellement coteuses.
Architecte technique
Karavel
www.splunk.com
105
SYNCSORT
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
SYNCSORT
Tour Ege - La Dfense
17, avenue de lArche
92671 Courbevoie Cedex - France
Tl +33 (0)1 46 67 46 10
Mail syncsortsamkt@syncsort.com
CONTACT
Florence
RABUEL
Regional Director
Fort de 40 ans dinnovation, dexpertise et de russite, Syncsort aide les entreprises travers
le monde intgrer les Big Data plus intelligemment.
Syncsort propose des solutions logicielles fiables, performantes, fonctionnant aussi bien
sur Hadoop que sur le mainframe. Nous aidons nos clients, partout dans le monde collecter, traiter et distribuer plus de donnes, en moins de temps, avec moins de ressources et
en optimisant les cots. Une majorit des entreprises du Top 100 sont clients de Syncsort
et nos solutions sont utilises dans plus de 85 pays pour off loader des applications legacy, onreuses et inefficaces, acclrer les traitements dans votre data warehouse et votre
mainframe et optimiser lintgration de vos donnes dans le cloud.
En 1968, sept ingnieurs et mathmaticiens se sont runis pour rduire les cots et la complexit lis aux donnes et leur traitement. En perfectionnant une srie dalgorithmes qui
rationalisrent le tri mainframe, utilisrent moins de ressources, sadaptrent selon des
variables denvironnement spcifiques et assurrent une scalabilit pour faire face des
volumes de donnes toujours croissants, ils changrent jamais la manire dont les entreprises pouvaient envisager lconomie des donnes et ils fondrent Syncsort.
Aujourdhui, avec des milliers de dploiements travers le monde sur toutes les platesformes majeures dont le mainframe, Syncsort fournit des solutions dintgration Big Data
aux entreprises grant dnormes quantits de donnes tout au long du Big Data Continuum, une manire plus ingnieuse de collecter, traiter une avalanche de donnes toujours
croissantes..
Le sige social de Syncsort est situ au Nord Est du New Jersey. Syncsort est prsent
linternational avec des filiales au Royaume-Uni, en France et en Allemagne, avec un centre
de support aux Pays-Bas et des distributeurs. Syncsort dispose dun rseau international
de partenaires, revendeurs et distributeurs qui incluent ses solutions comme composants
de leur offre informatique.
Syncsort est cette entreprise unique qui a brillamment fait voluer son
business model de lre du mainframe celui dHadoop. En capitalisant
sur cette exprience, Syncsort a dvelopp des solutions sur mesure
pour permettre aux entreprises doptimiser leurs charges de travail
travers lensemble de leur architecture de donnes. Elles ralisent ainsi
des conomies et allgent la charge sur le datawarehouse et le mainframe, ce qui acclre les traitements par ceux-ci.
Notre portefeuille de solutions innovantes comprend notamment :
DMX-h. Le premier moteur ETL qui fonctionne en mode natif au sein
du cluster Hadoop, ce qui permet aux entreprises de mettre en place
des flux de donnes complexes dans Hadoop et acclrer sans
heurt les processus MapReduce tels que HiveQL et Pig sans
devoir rdiger, gnrer ou optimiser du code manuellement.
SILQ. Le premier et unique outil conu pour aider les clients comprendre des tches complexes dintgration de donnes SQL et les
offloader du datawarehouse vers Hadoop.
Lonne Jaffe,
PDG
En tant quoprateur tlcom majeur comptant plus de 21 millions de clients, SFR collecte
quotidiennement une quantit norme de donnes. Lobjectif du projet Hadoop chez SFR
tait en premier lieu de rduire les cots dexploitation de ces donnes. Au fur et mesure
que le volume de donnes augmente, il est de plus en plus difficile et coteux de stocker
et traiter les donnes. En utilisant de faon optimale le cluster Hadoop et les outils puissants de tri et ETL de Syncsort, il est possible de limiter linvestissement dans du nouveau
hardware.
SFR a dcid de lancer le projet Hadoop la fin de 2013. Dans une premire phase, le choix
sest port sur la distribution Hadoop Cloudera et dbut 2014, il a t dcid de travailler
avec DMX-h de Syncsort pour loader et offloader des donnes partir du cluster Hadoop.
SFR utilisait dj loutil ETL DMX de Syncsort pour quatre autres projets, pour lesquels il
avait fait ses preuves. Les trs bonnes performances de DMX-h de Syncsort ont ensuite pu
tre dmontres dans le cadre du Proof of Concept pour le projet Hadoop. Nous travaillons
encore en mode batch, explique Franois Nguyen, en charge de la division Connaissance
Client chez SFR. Cela implique que nous disposons dune fentre de traitement rduite.
Nos engagements prcdents avec Syncsort se sont rvls trs efficaces. Leurs capacits
de tri nont pas dquivalent sur le march, et nous sommes trs heureux que Syncsort soit
lun des vritables innovateurs sur le march Hadoop. Leur mcanisme de tri est incorpor
la distribution Hadoop que nous utilisons.
Au cours de lt 2014, les premires sources de donnes ont t loades dans le cluster
Hadoop, et davantage de sources seront ajoutes toutes les deux ou trois semaines. Il
ne sagit pas dun projet avec un horizon dtermin, nous allons continuer ajouter des
sources de donnes en permanence, explique Franois Nguyen.
A lheure actuelle, la division Connaissance Client gre une base de donnes trs volumineuse , qui narrte pas de crotre. Les donnes traites dans le cadre du projet Hadoop
sont principalement des donnes structures mais on y retrouve galement des donnes
semi-structures provenant de logs.
En primeur
Le projet chez SFR est lune des premires vritables expriences Big Data et Hadoop sur
le march franais. Le projet permettra SFR de raliser des conomies, grce la performance des solutions implementes.
Lune des premires russites du projet a t la capacit concrtiser les premires tapes
dans le dlai imparti et selon le budget, ce qui est une prouesse compte tenu quil sagit de
lintroduction de technologies de pointe. La mise en route aussi rapide du projet est principalement due au fait que SFR na pas eu effectuer une phase de tuning avant de commencer utiliser DMX-h pour manipuler les donnes ni raliser de codage supplmentaire.
Les rsultats seront valus en permanence au fur et mesure que de nouvelles sources
de donnes sajoutent au cluster Hadoop.
Lutilisation des puissantes capacits de tri de Syncsort DMX h nont pas rendues ncessaires lacquisition de hardware supplmentaire.
www.syncsort.com
107
TABLEAU SOFTWARE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
TABLEAU SOFTWARE
Blue Fin Building
110 Southwark Street
SE1 0SU London - ROYAUME-UNI
Tl +33 9 70 44 93 95
Mail jsigonney@tableausoftware.com
CONTACT
Julien
SIGONNEY
Sales Area Manager
Connectez-vous nimporte quelle source de donnes, quelle que soit son type ou sa taille.
Analysez et crez des tableaux de bords et partagez-les en quelques clics. Tout cela en
respectant votre architecture de donnes et vos protocoles de scurit.
Rencontrez le nouveau visage des solutions dcisionnelles : Tableau Software. Tableau aide
les utilisateurs visualiser et comprendre leurs donnes. Quel que soit la source, le format
ou le sujet de vos donnes, le logiciel prim de Tableau vous permet dobtenir rapidement des
analyses pousses et visuelles. Le rsultat ? Chacun peut obtenir facilement des rponses,
sans notion de programmation. Des tableaux de bords pour excutifs aux rapports ponctuels,
Tableau vous permets de partager vos analyses interactives en quelques clics. Plus de 21
000 entreprises et organisations, incluant certaines des plus importantes au monde, font
confiance Tableau pour obtenir rapidement des rsultats, au bureau ou en dplacement.
Laissez de ct les solutions de dcision traditionnelles et optez pour la plus facile dutilisation, la plus rapide et la plus agile des solutions dcisionnelles du march. Avec tableau, les
employs obtiennent ce quils dsirent et votre service informatique conomise du temps
et de largent.
Tableau Software concentre son offre autour de trois produits principaux pour les entreprises : Tableau Desktop, Tableau Server et Tableau Online. Nos quipes ventes et marketing France sont votre disposition pour rpondre vos questions et vous aider choisir la
solution la mieux adapte vos besoins comme elles lont fait pour dautres clients prestigieux tels que : La Croix Rouge, Unilever, BNP Paribas, Nokia ou encore eBay.
Rpondez aux questions aussi vite quelles vous viennent grce Tableau Desktop
Tableau Desktop utilise une technologie innovante de luniversit de Stanford qui vous permet de glisser-dposer des donnes pour les analyser. Vous pouvez accder aux donnes,
visualiser et crer facilement des tableaux de bord interactifs que vous pouvez ensuite partager en quelques clics. Et tout cela sans rien programmer !
Tableau se connecte en direct la majorit des bases de donnes et feuilles de calculs
et offre galement une architecture en mmoire rvolutionnaire qui augmente la rapidit
des analyses. Quiconque sachant se servir dExcel peut apprendre rapidement utiliser
Tableau.
La conception de lavenir de
lune des principales socits de
services financiers dEurope
Partner : BNP Paribas
Contact : Pierre Thebault (BNP Paribas) et Edouard Beaucourt (Tableau Software)
Innover pour dvelopper des parts de march, remporter de nouveaux clients et augmenter
la part du portefeuille de clients existants.
Prsentation du projet
Le gant bancaire franais a mis sur Tableau pour recueillir et analyser ses donnes en
seulement quelques minutes. La division BNP Paribas du Sud-Ouest de la France dispose
maintenant de la capacit de visualiser les tendances de gocodage utilises dans le cadre
des campagnes commerciales et marketing de la banque. Et laperu partag et dtaill de
la performance de 2 000 agences travers la F contribue renforcer la comptitivit.
Pierre Thebault, goanalyste, est charg danalyser et didentifier les tendances de gocodage au sein dune rgion. Grce Tableau, il traque les opportunits de prospecter de nouveaux clients et de dvelopper de nouvelles campagnes marketing extrmement cibles :
Tableau est le moyen le plus rapide de passer des donnes aux dcisions . Il est mme
de localiser et de visualiser le nombre de prospects dans la rgion de Toulouse, et de les
segmenter par revenus, par risques et selon les services financiers de BNP Paribas dont
ils disposent dj. Sils ont souscrit un prt immobilier, ils constituent un candidat potentiel
pour la souscription dune assurance habitation ou dune carte de crdit. Tableau permet
de visualiser lensemble des donnes en quelques secondes, ce qui permet son quipe
de transmettre ce public cible segment aux quipes commerciales internes de la banque
pour un suivi immdiat.
BNP Paribas recherche constamment des manires de diffrencier ses services en offrant
une exprience plus localise. Tableau permet la banque dtudier la localisation des distributeurs automatiques de billets des concurrents et didentifier les sites potentiels pour
de nouveaux distributeurs : Comparer la localisation de nos clients avec la disponibilit du
rseau existant de distributeurs automatiques de billets nous permet de cibler de nouveaux
emplacements de distributeurs , dclare Pierre Thebault.
Malgr lexpansion des services bancaires en ligne, les franais restent attaches aux
agences physiques. Tableau reprsente la source primaire pour les rapports sur la performance des 2 000 agences BNP Paribas franaise. Directeurs et responsables partagent un
aperu dtaill de la performance de chacune des agences : chiffre daffaires, rentabilit,
personnel, adoption des services bancaires en ligne de la part des clients, etc. Laccs
rapide des donnes fiables, grce Tableau, se traduit par une prise de dcision vive
et fiable concernant les agences , affirme Pierre Thebault. Il poursuit, Avant Tableau,
nous utilisions des feuilles de calcul et une base de donnes Access. Cela nous prenait des
heures, des semaines, voire des mois, pour trouver les donnes correctes et les rponses
dont nous avions besoin. Dsormais, grce Tableau, lintgration homogne et la simplicit dutilisation signifient que nous obtenons les rponses en quelques minutes. Cela rend-il
la banque plus perspicace ? Oui, sans lombre dun doute.
Prochaines tapes
www.tableausoftware.com
109
TIBCO
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
TIBCO JASPERSOFT
25, rue de Balzac 75008 Paris
France
Tl + 33 (0)1 44 51 70 90
Mail gcarbonnel@jaspersoft.com
CONTACT
Lela
BOUTALEB BROUSSE
TIBCO Software Inc. (NASDAQ : TIBX) est un leader mondial dans le domaine des logiciels
dinfrastructure et dcisionnels. Quil sagisse doptimisation des stocks, de vente croise
ou de prvention des crises, TIBCO offre un concept unique nomm Two-Second Advantage, autrement dit la possibilit de capturer la bonne information au bon moment et
de ragir en fonction de cette information plus vite que la concurrence. Grce son vaste
ventail de produits et services novateurs, TIBCO est un partenaire technologique stratgique plbiscit par les entreprises dans le monde entier. Pour en savoir plus sur TIBCO,
rendez-vous sur www.tibco.com.
TIBCO, Jaspersoft, Two-Second Advantage et TIBCO Software sont des marques commerciales ou des marques dposes de TIBCO Software Inc. et/ou de ses filiales aux Etats-Unis
et/ou dans dautres pays. Amazon Web Services, AWS et Redshift sont des marques commerciales dAmazon.com, Inc. ou de ses filiales aux Etats-Unis et/ou dans dautres pays.
MongoDB est une marque commerciale de MongoDB, Inc. Tous les autres noms de produits,
dentreprises et de marques mentionns dans ce document appartiennent leur propritaire respectif et ne sont mentionns qu des fins didentification.
YOUR ACCESS TO
FAST DATA
BEGINS NOW.
Integrate
Analyse
Act
people, processes,
and systems
for actionable
insights
on key events
in real time
Les priphriques mobiles sont devenus partie intgrante de nos habitudes de travail et de
loisirs. Pour garantir leur comptitivit, les fournisseurs de services de tlcommunications/par cble doivent assurer leurs clients un accs aux contenus vido sur tous leurs
priphriques.
Leader du secteur des tlcommunications, Ericsson a rpondu aux besoins de TV multi-cran des oprateurs grce sa solution Multiscreen TV : elle permet en effet aux fournisseurs de services tlvisuels de contrler et de grer la fourniture des contenus, de
manire centralise, vers quasiment tous les types de priphriques grand public.
Ericsson a spcifiquement conu sa solution Multiscreen TV pour aider les fournisseurs de
services tlvisuels rduire les cots et gnrer de nouvelles sources de revenus. Cette
solution inclut des rapports intgrs sur deux volets :
Oprationnel donnes sur lutilisation et lintgrit du systme pour loptimiser.
Marketing donnes sur le contenu consult et utilis par les clients afin de soutenir les
prises de dcision concernant les offres et le marketing, ainsi que pour calculer les redevances.
Ericsson a remplac sa prcdente base de donnes relationnelles par MongoDB (open
source NoSQL). Cela lui a permit de rduire les dlais de rponse, les temps de latence, la
goredondance et les indisponibilits lors des mises jour.
LorsquEricsson a dvelopp la toute dernire version de sa solution Multiscreen TV, la
socit avait besoin dun moteur dcisionnel puissant, capable dinterroger de grands volumes de donnes dans MongoDB. Auparavant, Ericsson utilisait JReport, qui ne permettait
pas lintgration avec MongoDB ni ne produisait les types de formats attendus par les fournisseurs de services tlvisuels : les fichiers CSV.
Nous recherchions un produit qui permettrait une intgration directe avec MongoDB,
explique Jon Anderson, responsable de la stratgie produits pour Ericsson Multiscreen TV.
Nous souhaitions pouvoir produire de beaux rapports tout en disposant de capacits dexportation consquentes. Nombre de nos clients exportent vers un entrept de donnes plus
vaste.
Si Ericsson a choisi Jaspersoft, cest pour pouvoir proposer des fonctionnalits de reporting
plus riches dans sa solution Multiscreen TV. Avec JasperReports Server, la socit remplit
un grand nombre de ses objectifs :
Compatibilit avec MongoDB : le connecteur Jaspersoft intgre MongoDB la suite dcisionnelle Jaspersoft, pour fournir des fonctionnalits flexibles et abordables de reporting,
danalyses ad hoc et de tableaux de bord, partir de donnes MongoDB.
Intgration sans ETL : Jaspersoft permet lintgration directe avec MongoDB, sans environnement ETL (Extract, Transform, Load), ce qui acclre et facilite lobtention des donnes depuis Jaspersoft.
www.tibco.com
FAST FACTS
CUSTOMER
Ericsson AB
SECTEUR
Technologie
REPRES TECHNOLOGIQUES
JasperReports Server et iReport Designer
Redhat Enterprise Linux sur VMware
Interface utilisateur sur Ruby on Rails
Serveur dapplications JBoss
Base de donnes MongoDB
Javascript
LE DFI
Ericsson recherchait un puissant moteur
dcisionnel de reporting pour permettre aux
utilisateurs de sa solution Multiscreen TV
dinterroger de grands volumes de donnes
dans MongoDB.
LA SOLUTION
JasperReports Server rpond aux exigences
de lenvironnement technologique de la
socit ; il offre des fonctionnalits de
reporting Big Data et dintgration avec
MongoDB, sans ETL.
RSULTATS
Economies de cots : la socit
conomise des milliers de dollars et
dheures de travail en saffranchissant de
la maintenance de deux bases de donnes
distinctes, MongoDB et une base de
donnes relationnelles.
Cration rapide de rapports : en
quelques heures seulement, les
dveloppeurs Ericsson peuvent crer un
rapport laide diReport Designer.
Vision anticipe : dans certains cas,
les clients peuvent obtenir une vision
anticipe de plusieurs semaines grce au
reporting ad hoc en libre-service.
111
TALEND
Hard
Soft
B.I.
Dataviz
Conseil
COORDONNES
TALEND
9 rue Pags 92150 Suresnes
Instit.
Les solutions dintgration de Talend aident les entreprises tirer le meilleur parti de leurs
donnes. A travers le support natif des plates-formes modernes de Big Data, Talend rduit
la complexit de lintgration, tout en permettant aux dpartements informatiques de rpondre plus rapidement aux besoins mtiers, le tout pour un cot prvisible. Reposant sur
des technologies open source, les solutions hautement volutives de Talend rpondent
tous les besoins dintgration, actuels et mergents.
Tl +33 1 46 25 06 00
Fax +33 1 42 04 36 67
Mail ccornavin@talend.com
A la diffrence des solutions dintgration hrites, Talend rside nativement dans un environnement Hadoop, sans empreinte de dploiement. Nativement intgr dans les distributions Hadoop majeures comme Cloudera, Hortonworks ou MapR, Talend utilise la scurit
native de Hadoop et fait de la qualit de donnes dans Hadoop.
CONTACT
Charlotte
CORNAVIN
Marketing Manager
Comme Hadoop, Talend est engage sur de lOpen Source et des standards ouverts et les
avantages que ceux-ci apportent : un cosystme innovant, pas de dpendance vendeur,
dveloppement plus rapide et plus agile, ainsi que le support dune vaste communaut.
Lutilisation des standards et du large cosystme de Talend signifie que les dveloppeurs
peuvent trs facilement adopter les solutions Talend et que les ressources Talend peuvent
facilement tre trouves sur le march.
Prvisibilit
Le modle de prix des souscriptions sans conteneur dexcution permet de faire voluer
de manire prvisible les donnes et les projets, sans avoir faire voluer le cot de lintgration. La conformit aux standards Java, Eclipse et Big Data rduit le temps de dveloppement et de maintenance des projets. Ainsi, les cots oprationnels sont galement
prvisibles.
A lpreuve du futur
Comme laventure Big Data passe des tests lanalytique et au temps rel/aux cas oprationnels, Talend livre une plateforme dintgration unique, complte et unifie rpondant
tous les besoins daujourdhui et de demain.
Talend facilite
lintgration des
Big Data:
CONTACTEZ-NOUS:
info@talend.com
EN SAVOIR PLUS:
www.talend.com
Barry Sohl, Chief Technology Officer chez Buffalo Studios et son quipe informatique
Objectifs
Prsentation
Dans le monde du jeu virtuel sur les rseaux sociaux, chaque activit effectue par un
joueur est automatiquement enregistre et transmise lditeur ce qui lui permet ensuite
de mieux orienter les offres envoyes aux joueurs (crdit supplmentaire, bonus, outils,
etc). En termes de volume, cela reprsente plus de 10 000 vnements traits toutes les
secondes et la prise en charge de plus de 100GB dinformations par jour.
Buffalo Studios utilise un Data Warehouse de haute performance pour lancer ses rapports
SQL sur les donnes de joueurs. Dans leur cas, ils utilisent Apache Flume pour ingrer le
million de lignes de donnes quils rcuprent chaque jour (environ 100GB), le charger dans
leur Data Warehouse grce Talend pour ensuite le rutiliser dans un systme de reporting
et de visualisation.
Aspect Novateur
Aujourdhui Buffalo Studios utilise la solution dintgration Big Data de Talend, et a obtenu
la flexibilit qui lui manquait auparavant. Quand nous avons des besoins danalyse spcifiques, nous pouvons maintenant crire nos propres composants Java et les incorporer la
solution Talend explique Sohl. Et quand il sagit dajouter de nouveaux points de mesure
des donnes, nous ne bloquons plus le processus notre niveau, car nos dveloppeurs
travaillent simplement avec les outils sans avoir effectuer manuellement de laborieuses
modifications.
Ce type de gestion allge, son tour, permet Buffalo Studios dajouter de nouveaux
points de donnes chaque semaine. Le problme des blocages au niveau des fichiers logs
bruts est dsormais totalement rsolu.
Cet avantage revt une importance capitale pour Buffalo Studios. En effet, si leur service
technique narrive pas livrer les informations cruciales la direction, les dcisionnaires
restent dans lincertitude. Nous avons besoin de mesurer la performance de nos fonctionnalits, quelle soit bonne ou mauvaise, presque en temps-rel. Plus lexploitation des
donnes sera simple pour nous, plus lquipe BI pourra en tirer parti. Talend nous aide
optimiser les processus, amliorer la rapidit et accrotre la valeur que nous pouvons
tirer de nos donnes, prcise Sohl.
De plus, les ingnieurs de lquipe technique gagnent en productivit, puisquils nont plus
de problmes dintgration rsoudre et peuvent de nouveau se concentrer sur la construction de technologie innovante. Cest ce qui assure la croissance et la fidlisation des clients.
Nous portons beaucoup dintrt lexploration des nombreuses possibilits offertes par
Talend en termes de qualit des donnes. Je pense quil y aura un vrai potentiel exploiter en largissant le savoir-faire de Talend dautres applications, et que nous pourrons
alors bnficier de nombreux avantages au fur et mesure que nous progresserons,
dclare Sohl. Buffalos Studio annonce que limplmentation de Talend fonctionne si bien
que dautre socit du groupe Cesar Interactive Entertainement rflchissent le mettre
en place.
Autres informations
Plus dinformations :
http://fr.talend.com/resources/customer-reference/buffalo-studios-maximizes-data-value-to-build-competitive-edge-in
http://fr.talend.com
113
TERADATA FRANCE
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
TERADATA FRANCE
Antony Parc I : 2-6 place du Gnral
de Gaulle - 92160 Antony
Tl +33 (0)1 81 89 15 00
Mail severine.vigneron@teradata.com
CONTACT
Sverine
VIGNERON
Marketing Manager Teradata France
Teradata helps companies get more value from data than any other company. Our big data
analytic solutions, integrated marketing applications, and team of experts can help your
company gain a sustainable competitive advantage with data. Teradata helps organizations
leverage all of their data so they can know more about their customers and business and
do more of whats really important. With more than 10,000 professionals in 43 countries,
Teradata empowers organizations to become data-driven businesses that exploit data for
insight and value. More than 2,500 customers worldwide span industries including automotive and industrial; communications; consumer goods; e-commerce; financial services;
government; healthcare and life sciences; hospitality and gaming; insurance; manufacturing; media and entertainment; oil and gas; retail; transportation, distribution, and logistics;
travel; and utilities.
A future-focused company, Teradata has driven innovation for thirty-five years. Teradatas
workload-specific platforms integrate an organizations data into a unified view of the business. Our database software includes the unparalleled Teradata Database, and, for big
data analytics, the Teradata Aster Discovery Platform and Hadoop Portfolio. The unique
Teradata Unified Data Architecture helps customers discover and operationalize insights
by integrating multiple technologies, including Hadoop, into a robust, hybrid architecture.
Teradatas marketing and analytic applicationsavailable on premise or in the cloud leverage data to improve marketing effectiveness, determine profitability, and forecast demand.
These powerful solutions, along with years of hands-on experience working with the worlds
leading enterprises, enable customers to maximize the value of their data and serve their
customers better. Teradata is recognized for technological excellence, sustainability, corporate social responsibility, ethics, and business value.
Cardinal Health : Cardinal Health has used data to optimize the supply chain ensuring that the complicated array of raw materials that
are essential for high quality healthcare arrive in good condition,
when the patients need them.
McCain Foods : McCain Foods is a global food giant, with great pizzas, vegetables, appetizers and desserts. And theyve transformed
their culture with data. McCain has taken more than 22,000 reports
and 3,000 personal reporting systems and put the data in one place.
We took 30,000 versions of the truth, and brought it down to one
version of the truth.
Verizon Wireless : How does the biggest wireless carrier in the
United States keep their customers happy? Provide the best
network with the best customer experience and listen. How does
Verizon Wireless listen? With an Unified Data Architecture.
Barnes and Noble : Taking data from more than 1,300 stores and one
of the largest loyalty programs in the US, Barnes and Noble combines it with data from their e-commerce site. Using data analytics,
Barnes and Noble knows exactly who their customers are, and what
they want to buy or read next.
With increasing scope for analytics, and recognition of the competitive advantage of being data-driven, it becomes ever more important
for companies to find efficient processes and supporting technolo- Discover More Insights and Outcomes through our customer data
gies to derive business value from the data lake in the timeliest driven business Success Stories:
http://blogs.teradata.com/customers/ or visit Teradata.com
possible manner. This is exactly where Teradata comes in.
Teradata combines the most advanced, highly scalable Big Data Contact us to learn more on Teradata, solutions and our unique
technologies under one umbrella in an integrated manner. We call approach to Big Data.
this the Unified Data Architecture, blending in with what leading
analyst firm Gartner refers to as the Logical Data Warehouse.
With the Teradata Database, Hadoop, and the Aster Discovery Platform the Teradata Unified Data Architecture provides organisations
with a rich set of capabilities to support them in their pursuit of deriving value from analytics based on ALL the data.
Quants
Customers/Partners
Front-Line Workers
Engineers
Business Analysts
Executives
Operational Systems
Teradata Applications
Integrated Marketing Management
Teradata
Integrated
Data Warehouse
Teradata Aster
Discovery
Platform
Audio/Video
www.teradata.com
Images
Text
Web/Social
Machine Logs
CRM
SCM
ERP
115
VISEO
Hard
Soft
B.I.
Dataviz
Conseil
Instit.
COORDONNES
VISEO
38 rue de Ponthieu 75008 Paris
Tl 01 56 56 71 00
Mail contact@viseo.com
CONTACT
Yves
COINTRELLE
Directeur de la stratgie et
du dveloppement Business Intelligence
En sappuyant sur ses expertises dans les domaines du digital, des technologies, des process et de la data, VISEO vous accompagne dans vos chantiers de transformation et vous
aide faire merger de nouvelles ides, de nouvelles offres, de nouveaux modes de collaboration, de nouvelles manires de produire et de vendre.
Avec 1 100 collaborateurs rpartis sur quatre continents et un chiffre daffaires suprieur
110 millions deuros, VISEO vous propose une alternative aux intgrateurs, agences et
cabinets de conseil, en imposant une approche unique, souple, innovante et structurante.
VISEO vous apporte ainsi une rponse globale et vous aide mettre en uvre des projets
complexes pour faire face aux enjeux numriques qui impactent les systmes dinformation, les mtiers ou les organisations
Adresser aujourdhui les enjeux structurants de demain : VISEO mobilise lensemble de ses
expertises pour vous permettre de comprendre et anticiper les sujets cls dans lvolution
de vos activits.
VISEO et le BIG DATA : et si nous parlions conseil plutt que Technologie ?
Le Big Data offre un nouveau regard sur les donnes en ouvrant de nouveaux moyens
pour les saisir, les stocker, les grer, les traiter et les analyser.
www.viseo.com
117
www.bigdataparis.com
by
4e dition
RCS SAP France Paris B 342 631 207 2012 SAP AG; SAP et le logo SAP sont des marques dposes par la socit SAP AG en Allemagne et dans plusieurs pays. O&M SAP EU 41/12
PLUS DE RSULTATS.
E
TR
VO
Z
E
R
F
IN
E
M
A
L
L
A
MA
AL
WALGEZ V
RE OTRE
HO DAT
US A
E
NOUS SOMMES
LES SPCIALISTES
DE LOFFLOAD !
RAPIDE
FIABLE
SECURISE
syncsort.com/guide
HADOOP