Professional Documents
Culture Documents
Un systme d'information dcisionnel (SID) doit tre capable d'assurer quatre fonctions
fondamentales : la collecte, l'intgration, lorganisation et la restitution des donnes.
ces quatre fonctions s'ajoute une fonction d'administration, soit le contrle du SID
lui-mme.
I. Processus global
Liste des phases dun projet dcisionnel
La phase de collecte
La phase dintgration
La phase dorganisation
La phase de restitution
1. La phase de collecte
La collecte sffectue partir de donnes appeles : donnes sources. Ces donnes peuvent
se prsenter sous diffrents formats. Il peut sagir de fichiers "plats" (fichiers CSV avec
sparateurs, fichiers XML, fichiers ASCII...) mais aussi de systmes de bases de donnes (export
de base MySQL, PostgreSQL, DB2, ORACLE...). Ces sources de donnes sont donc en
gnral htrognes cest pourquoi il va falloir passer par une phase dites dintgration pour
pouvoir les manipuler avant de les stocker dans notre systme daide la dcision.
2. La phase dintgration
savoir lETL. Cette couche offre des fonctions dextraction de donnes issues de diffrents systmes
Elle garantit la dlocalisation de la charge de calcul et une meilleure disponibilit des sources.
La deuxime couche logicielle est lODS qui fait office de structure intermdiaire destine
stocker les donnes issues des systmes de production oprationnelle. Ce sont en quelque sorte
des zones de prparation avant lintgration des donnes dans le DW : priodicit journalire,
donnes qualifies, premier niveau de filtrage et dagrgat. En gnral, il existe deux types de
schma : un schma "ODS brut" qui contient les tables qui recoivent les donnes brutes des
diffrentes sources et un schma "ODS final" qui contient des tables avec une structure (champs et
contraintes associes) le plus proche possible du schma du DW (mme si les tables de celui-ci
peuvent contenir plus de champs que les tables du DW) car ces donnes vont ensuite tre figes
dans lentrept. LODS ne contient des donnes que sur une faible priode et ces donnes vont
tre manipules, transformes, traites, modifies plusieurs fois avant dtre copies dans le DW.
On peut se passer dutilisation dun ODS dans un seul cas : si les donnes du DW sont une simple
copie (cest--dire quil ny a pas de traitements faire et que les donnes extraites ne vont pas
voluer) des donnes de production (sources) ce qui nest malheureusement pratiquement jamais
appel : Datawarehouse. Cet entrept contient les donnes orientes mtier, non volatiles
gnralement dnormalise pour pouvoir optimiser les temps de rponses lorsque lon fait des
analyses de type OLAP qui se rfre une base de donnes multidimensionnelle (aussi appele
cube ou hypercube). Elle est constitue de dimensions ou axes danalyse (laxe temporel ou
gographie sont des exemples courant) et de faits ou indicateurs (tels que le chiffre daffaires).
Un lment important vient du fait que les donnes stockes dans le DW ne doivent plus changer
une fois lintrieur. Ce sont des donnes consolides et figes qui vont nous permettre de faire
Une fois ces donnes stockes dans le Datawarehouse, on va pouvoir crer des magasins de
ddi une fonction de lentreprise pour des raisons daccessibilit, de facilit dutilisation ou de
performance. Les donnes sont gnralement quivalentes celles prsentes dans le DWprincipal
mais elles sont reprsentes de faon adapte aux besoins spcifiques de la fonction et/ou du
Commercial). Le DM peut avoir une implmentation physique (cube) ou ntre quune vue logique
("multiprovider").
4. La phase de restitution
La dernire phase concerne la restitution des rsultats, on distingue ce niveau plusieurs types
doutils diffrents :
La phase de Datamining
priodiques, pr-formats et paramtrables par les oprationnels. Ils offrent une couche
dabstraction oriente mtier pour faciliter la cration de rapports par les utilisateurs eux-mmes
Les outils danalyse OLAP permettent de traiter des donnes et de les afficher sous forme de
cubes multidimensionnels et de naviguer dans les diffrentes dimensions. Cet agencement des
donnes permet dobtenir immdiatement plusieurs reprsentations dun mme rsultat, en une
seule requte sous une approche descendante des niveaux agrgs vers les niveaux dtaills (Drill-
down, Roll-up).
Les outils de Datamining offrent une analyse plus pousse des donnes historises
permettant de dcouvrir des connaissances caches dans les donnes comme la dtection de
prvisions. Le Datamining est bas sur des algorithmes statistiques et mathmatiques, et sur des
hypothses mtier.
FonctiondAdministration :
Le meta-dictionnaire
Le meta-dictionnaire (ou mta data), a pour rle de dcrire lensemble des donnes gres
dans le systme, depuis les sources de donnes jusquaux restitutions. Il permet aussi de grer les
de grer les droits et les restrictions pour les accs aux applications et aux donnes selon les
utilisateurs.
Schma dtaill