Professional Documents
Culture Documents
Octobre 2014
LE MOT DU PILOTE
La donne est devenue, avec le capital, les ressources humaines, les clients, les processus et le
systme dinformation, lun des principaux actifs de lentreprise, quel que soit son secteur
dactivit.
Mais au contraire des autres actifs, la donne nest pas gre en tant que tel, de manire
professionnelle et organise tout au long de son cycle de vie dans lentreprise. Ce constat est
partag par toutes les socits qui ont contribu au groupe de travail sur les enjeux business
des donnes.
Ce constat est exacerb par la transformation numrique qui est aussi la rvolution de
linformation, devenue plus Volumineuse , plus Varie et plus Vloce , pour reprendre
les fameux 3V qui dfinissent le Big Data. Mais le Big Data est aussi associ une srie de
termes qui voquent des catastrophes : tsunami , explosion , avalanche , dluge ,
infobsit , etc. qui illustrent bien le dfi auquel toutes nos organisations sont confrontes :
faire des donnes la mine dor de lre numrique.
Linformation ne constituera une nouvelle richesse pour lentreprise que si on sait lexploiter et
la valoriser. Une donne peut tre vue comme un actif numrique ds lors quelle comporte un
potentiel de cration de valeur pour lentreprise. La question qui se pose est donc bien de
savoir comment on optimise lexploitation de ses donnes pour crer de la valeur.
Ce qui est nouveau dans cette rflexion sur les donnes, cest la dmultiplication des potentiels
de combinaison des donnes dans une perspective de cration de valeur pour le business. Mais,
on ne peut pas prdfinir la valeur de linformation, on ne peut pas prvoir lavance lusage
que feront les utilisateurs des informations mises leur disposition.
Ainsi, sur cette question de la valeur des donnes, on cherchera identifier en quoi les donnes
contribuent la ralisation dun des axes stratgiques de lentreprise. La responsabilit de
lutilisateur portera alors sur la production et la mise disposition de donnes de qualit.
Il existe plusieurs manires pour une entreprise de tirer de la valeur de ses donnes, quelle soit
financire ou pas. Dans tous les cas, il faudra sappuyer sur une bonne matrise du cycle de vie
de la donne, et sur quelques prrequis : tout au long de la chane, linformation doit tre
collecte, contrle, protge, partage et analyse, pour contribuer mieux dcider ou
innover.
Tout cela concourt la mise en place dune vritable gestion des donnes (Data Management,
Enterprise Data/Information Management), dautant que le cadrage rglementaire et normatif
Octobre 2014
volue et continuera dvoluer sur ce sujet. Cette dmarche dentreprise implique la fonction SI
autant que les Mtiers, et devrait tre pilote en interne par une instance ddie.
Le prsent livrable propose une mthodologie de gestion des donnes, avec des exemples
concrets de mise en uvre et de bonnes pratiques, ainsi quune ouverture sur une dmarche
de valorisation des donnes. Est galement associ ce document un outil dauto-valuation
de la maturit des entreprises en matire de gestion des donnes (document Excel. Les critres
dauto-valuation sont disponibles en annexe pour information. A partir des rsultats,
prsents sous forme de radar, le lecteur peut facilement identifier ses zones de maturit et de
progrs, et le cas chant dfinir et mettre en place un plan damlioration de la gestion des
donnes au sein de son organisation. A titre dillustration, le groupe de travail a utilis cet outil
pour valuer la maturit de leur entreprise sur le management des donnes. La figure cidessous agrge les rsultats individuels : on voit bien que si les fondamentaux sont bien
matriss (oprations et scurit), un long chemin reste parcourir sur la qualit, larchitecture,
les mtadonnes, la gouvernance et la valorisation
2,5
2,0
Rfrentiels
1,5
1,0
0,5
Exploitation et Analyse
0,0
Mtadonnes
Echelle de notation
0 = Inexistant
1 = Dbutant (en phase d'initialisation)
2 = Avanc (en cours de mise en uvre)
3 = Confirm (dispositif oprationnel
et/ou en phase d'amlioration)
Scurit
Architecture
Avec ces deux livrables, le lecteur trouvera sans nul doute matire valider son niveau
davancement et dterminer ses priorits daction.
Bonne lecture !
Rgis DELAYAT
DSI de SCOR et pilote du groupe de travail
Octobre 2014
REMERCIEMENTS :
Le groupe de travail Enjeux business des donnes a t pilot par Rgis DELAYAT, DSI de SCOR et
Administrateur du CIGREF. Nous remercions les personnes qui ont particip aux changes et
contribu la rdaction du prsent document :
Pierre-Etienne BARDIN AXA GROUP SOLUTIONS
Michel BENARD GPMT DES MOUSQUETAIRES
Dominique CUPPENS RFF
Isaure DE CHATEAUNEUF SAINT GOBAIN
Bruno DUCROS GEODIS
Jean-Louis GHIGLIONE RENAULT
Anne-Laure JACQUEMIN MALAKOFF MEDERIC
Marc MEYER MINISTERE DE LECONOMIE
Patrick MOLE SCOR
Franois NGUYEN SFR
Ce rapport a t rdig par Sophie BOUTEILLER (CIGREF), avec la contribution des membres.
Sites internet :
http://www.cigref.fr/
http://www.fondation-cigref.org/
http://www.histoire-cigref.org/
http://www.questionner-le-numerique.org
http://www.entreprises-et-cultures-numeriques.org
SOMMAIRE
Le mot du pilote ........................................................................................................................ 2
1.
Introduction ....................................................................................................................... 3
1.1. Donne, information, connaissance, savoir : pas seulement une question de
terminologie .......................................................................................................................... 4
1.2. Linformation est un actif stratgique qui doit tre identifi et gr comme tel dans
lentreprise ............................................................................................................................ 5
1.3. Contexte ..................................................................................................................... 7
1.4. Approche retenue....................................................................................................... 9
2.
Prrequis : mettre en place une gouvernance et une gestion des donnes ................... 11
2.1. Gouvernance des donnes ....................................................................................... 11
2.1.1. quoi sert la gouvernance des donnes ? ....................................................... 11
2.1.2. Rles et comptences dvelopper ................................................................. 14
2.1.3. Standards auxquels se rfrer........................................................................... 15
2.2. Rfrentiels et donnes cls .................................................................................... 15
2.2.1. Enjeux lis aux rfrentiels de donnes............................................................ 15
2.2.2. Standards auxquels se rfrer........................................................................... 18
2.3. Mtadonnes............................................................................................................ 19
2.3.1. Donnes structures ou non structures : dfinitions ..................................... 19
2.3.2. Enjeux de la gestion des mtadonnes............................................................. 19
2.4. Scurit et conformit .............................................................................................. 22
2.4.1. Protection des donnes: la classification .......................................................... 22
2.4.2. Le cas des donnes personnelles ...................................................................... 28
2.5. Architecture .............................................................................................................. 32
2.5.1. Elaborer un modle de donnes dEntreprise .................................................. 33
2.5.2. Dfinir des rgles de propagation des donnes dans le SI ............................... 36
2.5.3. Standards auxquels se rfrer........................................................................... 36
3.
4.
Octobre 2014
Conclusion ........................................................................................................................ 56
Octobre 2014
1. INTRODUCTION
Dans quelque activit que ce soit, la donne est devenue un actif cl de lentreprise. Cela va
sans dire dans la finance, o linformation est la fois la matire premire et le produit fini
sur lesquels sappuient les services proposs. Mais cest aussi le cas dans lindustrie et les
services, o linformation sous-tend galement toute prise de dcision, tout choix
dorientation stratgique. Il nest pas besoin de convaincre : chacun reconnait aujourdhui la
valeur de la donne pour les entreprises et les administrations qui sorganisent pour
optimiser sa gestion et son usage. Le groupe de travail mis en place cette anne par le
CIGREF sest attach matrialiser ces Enjeux Business des donnes , dcrire les
lments qui contribuent crer de la valeur, depuis la collecte jusqu la prise de dcision,
en passant par le contrle de la qualit de la donne, sa protection, son stockage, son
partage entre les experts concerns, tous ces maillons du cycle de vie de la donne au sein
de nos entreprises qui, mis bout bout, constituent lindispensable Data Management
qui reste encore largement dfinir et mettre en place.
La rvolution numrique ouvre une re nouvelle, celle de linformation, dornavant
volumineuse et partage au-del des frontires mmes de lentreprise ou de
ladministration. Les exigences de qualit, de transversalit et de protection apparaissent
ou pour le moins, sont exacerbes, pour des raisons defficacit oprationnelle, commerciale
et/ou lgale.
Comment mesurer cette valeur de la donne pour le Business ? Les nombreuses entreprises
membres rassembles loccasion de ce groupe de travail ont essay dapporter une
rponse la question. Lambition de ce livrable nest pas de donner chaque socit ou
chaque lecteur intress une liste dinstructions suivre la lettre, mais en fonction du
niveau de maturit sur ces sujets, de permettre chacun dinvestiguer plutt tel ou tel
composant de ce puzzle de la gestion de la donne pour optimiser son usage et sa valeur
pour lentreprise.
Le prsent document essaie ainsi de balayer lensemble des lments susceptibles de crer
de la valeur, dont lillustration ultime va pour certains jusqu la montisation. Chacun y
trouvera les lments de rponse ses proccupations principales.
Octobre 2014
Big Data : La CSTIC recommande dans le Journal Officiel du 22 aot 2014 de prfrer l'appellation
mgadonnes ou donnes massives . Le Big Data est une dmarche qui consiste extraire linformation
pertinente dun ensemble de donnes, cet ensemble de donnes se caractrisant par le Volume, la Varit, la
Vlocit et la Vracit. Le volume lui seul nest pas une relle problmatique, tant dj au cur des
proccupations de nombreuses entreprises depuis longtemps. Seule la combinaison de deux ou plus de ces
axes correspond une dmarche de Big Data. Ces 4V sont apparus avec lvolution du web de ces
dernires annes : les rseaux sociaux, linternet des objets, lexplosion des vidos en ligne Des quantits
gigantesques de donnes (Volume) sont publies en continu (Vlocit), dans des formats structurs ou non,
provenant de sources diverses (Varit) et dont la lgitimit nest pas toujours vrifie (Vracit) (source : Big
Data : la vision des grandes entreprises , CIGREF 2013)
2
Octobre 2014
Octobre 2014
Capital
RESSOURCES / ACTIFS
Donnes
Chaine de valeur
Systme dinformation
Stratgie
Produits et
services
Production
Fonctions
support
Ventes
Management &
Contrle
Actionnaires
Fournisseurss
Rgulateurs
Clients
PARTENAIRES
Agences de
Mdia
notation
Marchs et
investisseurs
Il sagit donc de :
Traiter linformation comme un actif qui a une valeur quantifiable (le principal actif
de Facebook est son information !)
Rflchir la manire dont linformation trouve sa place dans la stratgie
(linformation nest pas un driv de lactivit de lentreprise mais elle contribue sa
performance)
Penser linformation globalement et penser linfrastructure pour la grer : dfinir un
Information Capabilities Framework
Dmarrer avec des cas dusages et en fonction des besoins Mtiers (approches par
petits pas ), dautant que les initiatives de Big Data peuvent tre freines par la
complexit et le morcellement du paysage technologique, ainsi que par la
fragmentation de linformation (favorise par le Cloud).
Octobre 2014
1.3. Contexte
Le sujet de la valeur business des donnes pose de nombreuses questions contextuelles,
complexes et qui dpendent beaucoup de la lecture que lon en a et de limportance que
lon y accorde un moment donn.
Avec la transformation numrique, lentreprise est rsolument ouverte, poreuse et
linformation est au cur de cette transformation porte par le numrique. Selon Gartner,
les volumes massifs dinformations complexes deviendront la norme dans lavenir. La varit
dinformations traiter (structures et non structures, Open Data, donnes
dmographiques, statistiques, provenant des rseaux sociaux, tablettes et autres
supports), ainsi que la vlocit des donnes (smart meters 3, donnes GPS collectes en
temps rel, ) et la consommation de ces donnes contribuent au dveloppement de la
masse des informations disponibles, et sont autant dlments prendre en compte pour
innover dans les mtiers. Ainsi, ce dveloppement des volumes dinformations disponibles
est surtout li la rvolution internet (avec lInternet des Objets notamment), la
prdominance de linformation, et au Big Data 4.
Cependant, la prise de conscience des dcideurs sur la nature stratgique des donnes est
rcente et progressive, et les investissements dans ce domaine restent encore limits.
Beaucoup dentreprises sont actuellement en phase de prototypage, de Proof Of Concept,
mais trs peu ont encore mis en place des projets de grande envergure autour de
lexploitation des donnes.
Pourtant, elles observent toutes que les pratiques et les habitudes de consommation des
informations changent, tant chez leurs clients quen interne. Face cette ralit, quelques
entreprises ont compris que leur diffrenciation viendra de leur capacit innover, et que
les donnes ont un rle majeur dans cette dynamique dinnovation. Car le Big Data permet
certes de prendre de meilleures dcisions, mais il est aussi (surtout ?!) une opportunit pour
crer de nouvelles offres et de nouveaux produits.
Smart Meter (compteur communicant) : compteur disposant de technologies avances, dites AMR
(Automated Meter Reading) qui identifient de manire dtaille et prcise, et ventuellement en temps rel la
consommation nergtique dun foyer, dun btiment ou dune entreprise, et la transmettent, par tlphone
(ou par courants porteurs en ligne (CPL)
Voir le rapport CIGREF, paru en 2013 : Big Data, la vision des grandes entreprises
Octobre 2014
Dans le domaine de la relation client par exemple, linternet des contextes et des
personnes permet de personnaliser les produits et services, de localiser les clients via
des capteurs RFID insrs dans leurs cartes de fidlit. Les entreprises personnalisent
leur relation client par la contextualisation des interactions quelles entretiennent
avec eux. Elles crent ainsi de nouvelles lignes de produits et de nouveaux services,
et cherchent fidliser leur clientle par le dveloppement dune exprience unique.
Ceci leur permet la fois daccroitre la performance de lacte de vente, mais aussi
dinscrire la relation dans la dure et de sassurer un potentiel de ventes futures.
Fondation CIGREF, 2012 : Les Essentiels Modles daffaires dans lespace numrique
Octobre 2014
Si ces quelques exemples soulvent des questions thiques dimportance, ils mettent aussi
en vidence limpact majeur que les informations peuvent avoir sur nos prises de dcision
personnelles et professionnelles.
Dans ce contexte, cet actif cl quest la donne doit imprativement tre gr de faon
professionnelle et industrielle. Le groupe de travail du CIGREF a entrepris de poser les bases
dune vritable gestion des donnes en menant une rflexion sur leur valeur pour
lentreprise, leur exploitation et leur protection. Il a identifi une liste de thmes relatifs
la donne, contribuant la valoriser et qui sont repris dans les diffrents chapitres du
livrable, chacun illustr par des tmoignages de socits qui ont particip aux travaux.
Interview de Matthias Fille (Conseiller TIC la CCI Paris le-de-France) sur le Big Data et le 4me Forum Europe
qui sest tenu Paris le 13 mai 2014 : http://www.entreprises.cci-paris-idf.fr/web/international/4eme-forumeurope-profitez-des-opportunites-offertes-par-le-big-data-le-13-mai-2014
9
Octobre 2014
10
Octobre 2014
Dfinition du Business Data Steward (DAMA DM BOK) : travailleur du savoir et manager, le Business Data
Steward est reconnu comme un expert de la donne et se voit attribue la responsabilit de spcifier les
donnes (commerciales, bases de donnes, ) et den assurer la qualit. A ce titre, il : :
1. Participe aux runions de comit de pilotage sur la gestion des donnes. .
2. Identifie et dfinit les besoins Mtiers en matire dinformation.
3. Propose, modlise, precise et affine les informations (noms, dfinitions, ), modles de donnes et
autres attributs relatifs aux diffrents Mtiers de lentreprise.
4. Garantit la validit et la pertinence des modles de donnes associs aux diffrents Mtiers.
5. Dfinit les rgles Mtier respecter pour les attributs de donnes et vrifie que les exigencies sur la
qualit des donnes est respecte.
6. Valorise les donnes de rfrence et les significations associes.
7. Contrle la qualit des donnes de test et participle la conception des jeux de donnes de test.
8. Identifie et aide la resolution de tout problme sur les donnes.
9. Participe l'analyse de la qualit des donnes et leur amlioration.
10. Contribue llaboration des politiques de donnes, des normes et procdures.
11
Octobre 2014
12
Octobre 2014
La nouvelle rglementation Solvency 2 dfinit la faon dont doit tre dtermin le niveau des fonds propres
afin de couvrir les risques pris en charge par les compagnies dassurance. Cette rglementation sappliquera
compter du 1er Janvier 2016, et suppose des volutions importantes des systmes dinformation.
13
Octobre 2014
Octobre 2014
10
Le rfrentiel COBIT5 est consacr la gouvernance SI : il dcrit cinq principes et dfinit les sept inducteurs
de base qui le composent. Plus dinformations :
http://www.isaca.org/COBIT/Pages/default.aspx?cid=1003566&Appeal=PR
15
Octobre 2014
16
Octobre 2014
qui lenregistrent. Les rfrentiels sont donc globaux, et ils sont aussi partags entre les
diffrents mtiers.
De plus, la mise en conformit avec Solvency 2 dune part, et la poursuite de lunification
des systmes front-office dautre part, conduisent pousser un cran plus loin le primtre
et lusage de rfrentiels partags, en intgrant les systmes de gestion des risques et le
dcisionnel (les datawarehouses et les outils de reporting).
Lapproche Data Quality ncessaire Solvency 2 conduit aussi prciser les
responsabilits relatives la qualit des donnes de rfrence, en faisant appel aux
concepts MDM de point dacquisition / point de vrit. Enfin, les services daccs aux
donnes de rfrence doivent aussi senrichir.
GIP MDS
Dans le secteur public, le schma stratgique du systme dinformation de la scurit
sociale et de la protection sociale (SSSI), dfinit parmi ses objectifs stratgiques la ncessit
dacter le principe dun rfrentiel-socle des employeurs pour la sphre sociale .
limage des donnes individus, lidentification des employeurs constitue un besoin
commun aux acteurs de la sphre sociale. La fiabilit, lunicit et la mise disposition de
cette donne sont les ingrdients ncessaires la mise en uvre de nombreux processus
(dclarations sociales pour diffrents cas retraite, maladie, chmage , recouvrement
des cotisations) ainsi quau maintien de leur cohrence transverse.
Cet objectif se traduit par la mise en uvre dune architecture de consolidation des
donnes employeurs autour des rfrentiels socles (REI/ACOSS Rfrentiel Entreprises et
Individus et RNE/MSA Rfrentiel National des Entreprises) qui sont unis dans le
cadre du rpertoire RCD Rpertoire Commun de Dclarants.
L'identification des employeurs pour la scurit sociale est porte par deux rfrentiels
socles : les employeurs agricoles dans le RNE et les employeurs du rgime gnral
dans le REI. Ces rfrentiels sont articuls avec les informations en provenance des
diffrents Centres des Formalits Entreprises (CFE) et de la base SIRENE de lINSEE qui
consolide les informations.
Pour les besoins lis la mise en uvre de la DSN (Dclaration Sociale Nominative),
qui est une procdure unique, un rpertoire des dclarants (RCD) adoss ces
rfrentiels a t mis en uvre, qui enregistre leurs caractristiques et fait le pont
entre la scurit sociale et les organismes complmentaires.
17
Octobre 2014
CFE
CFE
CFE
CFE
RNE
RUBENS
Rgimes de retraite
complmentaires
REI
RNEMSA
RCD
SIRENE
Rgimes complmentaires
Maladie/Prvoyance
(Mutuelles, assurances,
Inst. de Prvoyance et autres
caisses professionnelles)
Assurance Chmage
et Ple Emploi
Cette dmarche peut tre rapproche dune dmarche de gestion de donnes de rfrence
(Master Data Management ou MDM). Les processus mis en uvre visent dfinir, stocker,
et diffuser des donnes rfrentielles au sein du systme dinformation de la sphre
sociale.
11
18
Octobre 2014
2.3. Mtadonnes
Ce sujet couvre tout le primtre des donnes de lentreprise, structures et non
structures.
12
19
Octobre 2014
20
Octobre 2014
quel niveau de description des donnes grer les diffrentes mtadonnes (niveau du
modle / niveau des flux, niveau modle dentreprise / niveau modle applicatif, niveau
document / niveau dossier, etc.)
o Des mtadonnes sont associer aux diffrents niveaux de description des
donnes, mais pour les donnes structures cls de lentreprise, la plupart des
mtadonnes sont attacher au niveau conceptuel Entreprise (notamment les
dfinitions et la gouvernance) ; de mme que pour les donnes non structures,
une gestion par ensemble dlments de contenus est plus simple administrer
quune gestion lment par lment (par exemple au niveau dun document) ;
o Il est essentiel de grer les liens entre les diffrents niveaux, et de mettre en place
des logiques dhritage entre le niveau le plus haut et les niveaux bas (niveau
applicatif notamment), afin de simplifier une gestion qui peut savrer trs lourde
eu gard aux volumes concerns.
Quelle organisation pour grer les mtadonnes ?
o Une quipe de gestion, proche des quipes de modlisation et de gestion des
connaissances doit apporter du support, fournir des outils et des processus ;
o La description et les volutions doivent tre autant que possible dcentralises
auprs des propritaires des donnes, outilles, et faire partie des processus de
gestion des changements du SI.
Comment piloter lquilibre effort / rtribution ?
o Faire porter leffort prioritairement sur des ensembles de donnes dont le besoin
de partage est fort (donnes de rfrence par exemple) ;
o Grer les mtadonnes par ensembles de donnes, et non a priori au niveau de
chaque donne lmentaire ;
o Tirer parti des projets qui sont des opportunits de mettre en place des
mtadonnes moindre cot car celles-ci sont partie intgrante du projet ;
o Outiller pour limiter leffort ;
o Communiquer beaucoup pour promouvoir les usages.
Quels outils pour grer les mtadonnes ?
o La plupart des outils de gestion de documents comprennent leur propre gestion de
mtadonnes, ainsi que des outils de recherche sappuyant sur les mtadonnes
gres ;
o Pour les donnes structures, les outils qui permettent de grer un rfrentiel
darchitecture permettent en gnral de grer un mtamodle et des
mtadonnes.
Tmoignage SCOR
21
13
22
Octobre 2014
14
23
Octobre 2014
15
16
17
24
Octobre 2014
ce jour). Lchelle dimpact, indicative, est celle qui avait t dfinie pour la gestion des
risques mtiers du Groupement des Mousquetaires lis linformatique. Le primtre de
classification concerne ce jour les informations gres par les applications.
Niveau
d'impact
Critique
Fort
Moyen
Faible
Dans un second temps, si au moins un impact dpasse un seuil critique, une analyse de
risques, adapte de la mthode E-BIOS 18, est mene par le RSSI qui prconise un plan de
rduction des risques informatiques dans un dossier de scurit. La dcision finale de
ladoption partielle ou totale du plan de rduction des risques revient aux mtiers.
La dmarche de classification des donnes gres par les applications informatiques est en
voie de systmatisation, elle sera porte par la mthode interne de gestion des projets
informatiques. Le rsultat de la classification des donnes sera intgr dans le dictionnaire
des donnes dentreprise.
Renault
18
Cre en 1995 par lANSSI et rgulirement mise jour, la mthode EBIOS (Expression des Besoins et
Identification des Objectifs de Scurit) permet dapprcier et de traiter les risques relatifs la scurit des
systmes dinformation (SSI).
25
Octobre 2014
Classification
Interne
Sensible
Enjeux en cas
de fuite
Risque de
perte
relle,
mais
limite
Critique
Risque de perte
significative pour
lentreprise, par
dsavantage
commercial, crise
dimage, mise en
cause judiciaire, ou
autre.
Stratgique
Risque de perte ou
de crise majeure,
de nature
impacter le rsultat
financier ou la
valorisation
boursire.
Chaque mtier a opr la classification des donnes / informations selon cette grille et
produit un catalogue des donnes confidentielles. Les niveaux de classification sont
marqus sur les documents, et dterminent les moyens de protection utiliser.
La classification a ensuite t tendue aux SI, partir de lanalyse du niveau de
classification des donnes traites, et en prenant en compte les rglementations sur les
donnes caractre personnel. La PSSI dfinit les rgles de scurisations en fonction de la
catgorie des donnes traites dans chaque SI.
Pour les nouveaux projets, la mthode de projet intgre un passage en comit SSI qui met
un avis de PSSI.
Pour les SI existants, un inventaire des traitements informatiques selon la classification des
donnes traites est tenu jour. A partir de cette classification sont ensuite analyses les
chaines de confidentialit et les tudes de scurisation des SI
26
Octobre 2014
27
Octobre 2014
19
20
28
Octobre 2014
Comme le souligne le G29, une anonymisation correcte des donnes, i.e. une anonymisation
qui empche toute ridentification, est difficile obtenir et doit tre value selon trois
axes :
Quelle est la possibilit de ridentifier un individu partir dun jeu de donnes ?
Quelle est la possibilit dinfrer des informations sur un individu partir dun jeu de
donnes ?
Quelle est la possibilit de relier des jeux de donnes diffrents appartenant un
mme individu ?
Figure 2 : Anonymisation des donnes, cas des donnes de sant
Le G29 estime galement que les risques de ridentification doivent tre rgulirement
valus, et les dispositifs danonymisation revus si cela est ncessaire.
Avec le dveloppement du Big Data, lentreprise met en place des traitements qui collectent
et mettent en corrlation des donnes de plus en plus volumineuses et de plus en plus
granulaires. La valeur cre pour lentreprise est potentiellement trs leve. Ces
croisements doivent pouvoir tre raliss tout en apportant aux personnes concernes la
garantie de respect de leur vie prive grce lutilisation de techniques danonymisation
efficaces.
29
Octobre 2014
21
22
notre connaissance, seule le CNIL anglaise - lICO - a publi un guide sur ce sujet :
http://ico.org.uk/for_organisations/data_protection/topic_guides/anonymisation
23
http://blog.netflix.com/2010/03/this-is-neil-hunt-chief-product-officer.html
24
http://www.forbes.com/sites/firewall/2010/03/12/netflix-settles-privacy-suit-cancels-netflix-prize-twosequel/
25
30
http://ukanon.net/
Octobre 2014
31
Octobre 2014
lassurance sant .
La dmarche adopte pour ces exprimentations a t dcline comme suit :
2.5. Architecture
Les mthodes de conception de SI ont longtemps donn la priorit aux processus et aux
traitements plutt quaux donnes, souvent vues comme des sous-produits des traitements
32
Octobre 2014
26
Quest-ce quun modle de donnes dEntreprise ? Il sagit dune dfinition et dune reprsentation des
principaux objets mtiers de lentreprise (le client, le produit, le contrat, lemploy etc.), de la faon didentifier
ces donnes, de leurs inter-relations (liaison 1 1, 1 n ). Le modle de donnes dEntreprise peut tre
formalis en utilisant des techniques de modlisation habituellement appliques la conception de SI (MCD
Merise, UML ). Il prsente lavantage de donner une vision densemble des donnes les plus largement
partages et qui constituent le socle du systme dinformation, notamment les donnes de rfrence.
33
Octobre 2014
27
34
Octobre 2014
mtiers)
o Initiative conjointe mtier et IT comprenant la dfinition et la reprsentation
en UML des donnes les plus utilises
En sappuyant sur les modles du march;
En grant des versions du modle ;
En utilisant des attributs communs toutes les fonctions : statut li
au positionnement de la donne dans son cycle de vie par exemple,
dfinition du niveau de sensibilit (priv ou non), donne externe ou
interne.
o Recensement des flux fonctionnels et des applications utilisant les donnes
rfrences dans le modle ;
o Dfinition dindicateurs sur les niveaux de reprsentation (connu, normalis,
informatis, contrl, ..).
Loutil utilis est Power Designer qui est utilis galement pour la modlisation de
donnes de niveau applicatif (modle CDM 28, LDM 29, PDM 30) et la DSI dveloppe plus
largement un rfrentiel darchitecture (intgrant non seulement les donnes, mais aussi
les fonctions et les applications) pour rpondre aux diffrents besoins mtier. Les modles
sont publis sur lintranet, versionns et archivs via le rfrentiel.
28
35
Octobre 2014
31
36
Octobre 2014
32
37
Principe 10 : Data is an Asset (Data is an asset that has value to the enterprise and is
managed accordingly);
Principe 11 : Data is Shared (Users have access to the data necessary to perform their
duties; therefore, data is shared across enterprise functions and organizations);
Principe 12 : Data is Accessible (Data is accessible for users to perform their
functions);
Principe 13 : Data Trustee (Each data element has a trustee accountable for data
quality);
Principe 14 : Common Vocabulary and Data Definitions (Data is defined consistently
throughout the enterprise, and the definitions are understandable and available to all
users);
Principe 15 : Data Security (Data is protected from unauthorized use and disclosure.
In addition to the traditional aspects of national security classification, this includes,
but is not limited to, protection of pre-decisional, sensitive, source selection-sensitive,
and proprietary information).
Octobre 2014
Conservation
Transformation
Analyse
Valeur pour
lentreprise
Contrle de la Qualit
38
Octobre 2014
39
Octobre 2014
Octobre 2014
Octobre 2014
42
Octobre 2014
43
Octobre 2014
44
Octobre 2014
4.2. Valorisation
La question de la valorisation renvoie celle de la valeur des donnes, et ce questionnement
est aussi gnrique que celui relatif aux brevets, marques, ou encore aux SI. Mais quels
critres associer la valorisation des donnes ? Pour une organisation, quelle quelle soit,
quelle valeur crer partir de lexploitation de cet actif ?
Pour une entreprise, un actif est une ressource dont elle contrle lusage ( travers des
droits de proprit spcifiques). Une donne peut donc tre vue comme un actif numrique
ds lors quelle comporte un potentiel de cration de valeur pour lentreprise. Ce qui est
nouveau dans la rflexion sur les donnes, cest la dmultiplication des potentiels de
combinaison des donnes dans une perspective de cration de valeur pour le business.
LAccluction 33 marque le mode de production dominant dans lentreprise de demain
(acclration de liens et plateforme de services). Ce nouveau modle de cration de valeur
va au-del des 3 espaces classiques du lean production, que sont les fournisseurs, les clients
et les entreprises. Dans ce contexte mergent, ces 3 catgories dacteurs doivent dsormais
grer une dizaine despaces diffrents, dont les donnes.
Or, la valeur nest pas intrinsque linformation : elle rside dans lusage que les
utilisateurs en font. On ne peut pas prdfinir la valeur de linformation, on ne peut pas
prvoir lavance lusage que feront les utilisateurs des informations mises leur
disposition. Ainsi, sur cette question de la valeur des donnes, un des axes cl est didentifier
en quoi les donnes valoriser contribuent la ralisation dun des axes stratgiques de
lentreprise. La responsabilit de lutilisateur portera alors sur la production et la mise
disposition de donnes de qualit.
Selon le Pr Bounfour, Rapporteur gnral du programme ISD de la Fondation CIGREF, la
donne est un actif numrique qui peut tre de 3 natures diffrentes :
Actif numrique propritaire (carte de fidlit par exemple),
Actif numrique conjoint (partenariats et alliances),
Actif numrique non propritaire sur lequel lentreprise na aucun contrle (ou actif
numrique externe non propritaire).
33
LAccluction est un concept dvelopp par le Pr Ahmed Bounfour, Rapporteur du programme international
de recherche ISD de la Fondation CIGREF, et qui caractrise lmergence dun nouveau systme de
production acclre de liens , marque la fois par lextension des espaces de cration de valeur et par
lacclration considrable des liens (transactionnels ou organiques) comme source de cration de valeur . In
LAccluction en action, programme international de recherche ISD : premier rapport dtape, une mise en
perspective des projets Vague A , Fondation CIGREF Octobre 2011, p. 8
45
Octobre 2014
OECD (2013), Exploring Data-Driven Innovation as a New Source of Growth: Mapping the Policy Issues
Raised by "BigData", OECD Digital Economy Papers, No. 222, OECD Publishing.
http://dx.doi.org/10.1787/5k47zw3fcp43-en
46
Octobre 2014
Sil apparat vident aujourdhui que la donne doit tre considre comme un actif
immatriel essentiel de lentreprise, force est de constater cependant que peu de modles
existent pour estimer la valeur de ces donnes. LOCDE a ainsi rcemment valu diffrentes
mthodes pour calculer la valeur montaire des donnes personnelles dtenues par les
entreprises 35. Elle conclut que les diffrentes mthodes dvaluation sont trs dpendantes
du contexte, que les mthodes doivent tre combines pour viter tout biais, et que leurs
rsultats doivent tre utiliss avec prudence. LOCDE souligne galement que la valeur
montaire ne rsume pas elle seule la valeur de ces donnes.
Si le CIGREF a trait de manire pionnire et extensive le sujet du capital immatriel 36, les
tudes ont essentiellement port sur les notions de savoir-faire, de patrimoine applicatif, de
valeur pour les mtiers, sans focus sur les donnes elles-mmes.
Figure 3 : Niveau de maturit des entreprises, relativement au traitement de leurs actifs immatriels SI
Liste des actifs immatriels, Cahier de recherche du CIGREF n4 (2008)
Le think-tank Futur Numrique 37 (Institut Mines Tlcom / Fondation Tlcom) dans son
programme Business models numriques du futur , reconnaissant limportance des
35
OECD (2013), Exploring the Economics of Personal Data: A Survey of Methodologies for Measuring
Monetary Value, OECD Digital Economy Papers, No. 220, OECD Publishing.
http://dx.doi.org/10.1787/5k486qtxldmq-en
36
47
Octobre 2014
37
http://willstrategy.com/download/MinesTelecom/2014-Will_IMT-BusinessModelsNumeriques.pdf
38
40
A Bounfour, G Epinette : Valeur et performance des SI : Une nouvelle approche du capital immatriel de
l'entreprise , Dunod, Paris, 2006 ; Publication Cigref, Cahier n4, Capital immatriel et Systmes dInformation
http://www.cigref.fr/cigref_publications/RapportsContainer/Parus2008/Cahier_recherche_4_SI_Immateriel_2
008.pdf
48
Octobre 2014
41
Le Pr Bounfour est Rapporteur scientifique du programme ISD de la Fondation CIGREF et titulaire de la Chaire
europenne de Management de lImmatriel lUniversit Paris Sud 11 : http://www.chairedelimmateriel.upsud.fr/tiki-index.php
42
Les informations contenues dans cette partie sont tires du rapport Pour une politique ambitieuse des
donnes publiques , de lEcole des Ponts Paris Tech (2001)
43
Une donne ouverte est une donne numrique d'origine publique ou prive. Elle est produite par une
collectivit ou un service public (ventuellement dlgu). Elle est diffuse de manire structure selon une
mthodologie et une licence ouverte garantissant son libre accs et sa rutilisation par tous, sans restriction
technique, juridique ou financire. L'ouverture des donnes (en anglais open data) reprsente la fois un
mouvement, une philosophie d'accs l'information et une pratique de publication de donnes librement
accessibles et exploitables. Elle s'inscrit dans une tendance qui considre l'information publique comme un
bien commun (tel que dfini par Elinor Ostrom) dont la diffusion est d'intrt public et gnral. En Europe et
dans certains pays, des directives et lois imposent aux collectivits de publier certaines donnes publiques sous
forme numrique. (source : Wikipedia)
49
Octobre 2014
50
http://www.etalab.gouv.fr/
Octobre 2014
45
Eric RIES est un entrepreneur de la Silicon Valley, blogueur et auteur reconnu sur le lean
startup movement .
51
Octobre 2014
52
Octobre 2014
Des publications rcentes visant estimer limpact de la mise disposition des donnes
publiques sappuient sur une modlisation empirique (voir figure 4 ci-aprs) en trois phases :
Les prcurseurs seraient plutt dans la seconde phase, la troisime phase reste devant nous.
53
Octobre 2014
En synthse
Il est trs difficile de mesurer limpact Business rel de louverture et de la rutilisation des
donnes publiques, car ce sont les usages finaux qui en font la valeur, sans lien direct avec
les volumes tlchargs. Nanmoins, cette valeur est considrable sur le plan conomique
direct et est un vecteur dinnovation et de dynamisme pour de nombreux acteurs innovants.
Les clefs de succs sont :
Un accs ais aux donnes brutes (cots faibles et formats rexploitables),
La rapidit dexcution,
La scurit juridique.
Faut-il mettre les donnes disposition gratuitement ou adopter un modle payant ? Ce
dernier permettrait, selon ltat, dobtenir un complment budgtaire pour couvrir les cots
de diffusion, voire une partie des cots de la mission de service public. Il correspondrait aussi
la volont de proposer une offre, et pour certains de rguler le volume des demandes. Ce
point de vue est celui dun nombre important de producteurs de donnes publiques.
Cependant, la tendance actuelle nest pas celle-ci car les avantages du modle de gratuit
semblent lemporter si lon considre les gains sociaux et conomiques .
54
Octobre 2014
Octobre 2014
5. CONCLUSION
Avec la rvolution numrique qui est aussi celle de linformation, avec le phnomne Big
Data, avec le renforcement des exigences de qualit des rgulateurs, la donne est devenue
lun des principaux actifs de toute entreprise ou organisation. Les autres actifs, comme le
capital, les ressources humaines, les processus, les clients ou mme le systme
dinformation sont lobjet dune gestion organise, professionnelle et industrielle.
Puisque la donne est unanimement reconnue comme la nouvelle richesse de lentreprise,
un dispositif de gestion ( data management ) de mme nature doit tre mis en place, pour
accompagner toute dmarche de valorisation.
Veiller la mise en place dune gouvernance et dune gestion des donnes dans lentreprise
est donc une dmarche devenue indispensable pour tout dirigeant dsireux de tirer de la
valeur des donnes disponibles, internes et externes. Les gisements de valeur contenus dans
les donnes aujourdhui encore insuffisamment exploites sont importants, et les
entreprises qui sauront anticiper et prendre en compte cet actif dsormais stratgique, en
tireront un avantage comptitif durable.
Mettre en place un systme de data management , tel que dcrit dans le prsent livrable,
est indispensable pour tirer tout le profit possible de ses donnes, innover et in fine, prendre
de meilleures dcisions, et proposer de nouveaux produits et services aux clients finaux.
Nous esprons que ces quelques pages auront contribu vous convaincre de la ncessit
de passer laction !
56
Octobre 2014
Critres d'valuation
Gouvernance
Rfrentiels
Mtadonnes
Scurit
57
Octobre 2014
Axes
Critres d'valuation
Architecture
Exploitation et
Analyse
Oprations
58
Octobre 2014
CIGREF
21 avenue de Messine
75008 PARIS
Tel. : +33 1 56 59 70 00
cigref@cigref.fr
www.cigref.fr