Professional Documents
Culture Documents
Thme
Conception et ralisation dun Data Warehouse pour
la mise en place dun systme dcisionnel
Document de base
Ralis par
Encadr par
FILALI ABDERRAHMANE
MERABET SOUAD
KEDJNANE SOFIANE
MEDJAOUI NADJI
Promotion : 2009/2010
Remerciements
Nos remerciements vont tout spcialement nos familles, qui ont sus nous supporter et
encourager tout au long de notre vie, ainsi que pour leur aide inestimable, leur patience et
leur soutien indfectible.
Nous tenons aussi, remercier tout les enseignants qui ont contribu de prs ou de loin
notre formation.
Nous remercions Mme Souad Merbet et M. Nadji Medjaoui pour avoir assur
lencadrement de ce projet, qui na pas toujours t de tout repos. On remercie monsieur
Medjaoui pour nos sances de travail agrables et fructueuses, ses remarques pertinentes,
mais aussi pour son coute et son discours bienveillants.
Nous remercions Mme Merabet pour la confiance quelle nous a accord et de nous
avoir donn lopportunit de travailler sur un projet dune tel envergure.
Nous remercions Mme Ait Ali Yahia pour ces critiques constructives qui nous ont
permis damliorer ce mmoire.
Nous nous devons de mentionner la prcieuse et totale collaboration que nous avons
reu au sein de ELIT, de part les moyens mis notre disposition et laide et le support apport
par lensemble des employs et des cadres.
On remercie vivement Mesdames et Messieurs les membres du jury davoir accepter
dvaluer ce travail.
Pour finir, et afin de noublier personne (amis, membre de la famille et tous ceux qui
nous sont chers) nous utiliserons la formule : Merci .
^xw}tx 9 Y|t|
Ddicaces
Je ddie ce modeste travail :
M es parents, qui nont jamais cess de mencourager et me soutenir,
M on frre : M oham med, et m es surs :A mina et Soum ia
M on binm e et ami Sofiane et sa famille,
M es amis : Amine, M ouhata, M oham med, Lotfi
Tous les m embres de ma famille,
Ceux qui me sont chers,
M on cousin : Samir, puisse dieu laccueillir dans son vaste paradis.
Tuwxt{tx
Ddicaces
A:
M es parents, pour leur soutient indniable et leur aide prcieuse
Pourrais-je jamais vous dire tous mon am our,
M a grand-mre, pour sa patience et pour avoir su me supporter,
M a sur Linda, et mes frres Tareq et Yacine, pour leurs
encouragements et leur amour,
Tous les m embres de la famille, pour lintrt quils mont montr,
M on binme (et ami) Abderrahmane H amza et toute sa famille,
pour ce quils mont apport,
M es amis, pour tous ce quon a partag ensemble,
Toutes les personnes proches que je nai pas cites
Je ddie ce travail.
fy|tx
Sommaire
Rsum :..I
Abrviations :.II
Liste des tableaux .IV
Liste des figures ...VI
Introduction gnrale ................................................................................................................. 9
1. Problmatique .............................................................................................................. 10
2. Objectifs du projet ........................................................................................................ 11
Introduction ...................................................................................................................... 15
I.1.
II.2
II.3
II.4
II.5
III.1.1
III.1.2
III.1.3
III.2
III.3
III.3.1
Gnralits ......................................................................................................... 29
III.3.2
III.4
III.4.1
III.4.2
IV.1.2
IV.1.3
IV.2.2
IV.2.3
II.2
II.3
tude prliminaire des systmes sources et interviews sommaires avec les DBA.... 65
2.
3.
4.
5.
II.2
II.3
II.4
II.2
II.3
IV.3.2
I.
II.3
II.4
II.5
III.2
IV.
Conclusion ...141
Rsum :
Le groupe SONELGAZ, premier oprateur nergtique en Algrie, assure plusieurs missions
dans le domaine de lnergie. Ces dernires, allant de la gestion du rseau lectrique et gazier
la distribution et commercialisation de llectricit et du gaz au profit tant des professionnels
que des particuliers, font de SONELGAZ un acteur incontournable de lconomie nationale.
Le groupe SONELGAZ rencontre, dans le cadre de son activit de distribution, quelques
problmes dans sa politique de Reporting clientle. Ces difficults sont lies notamment la
lenteur et au cot de la procdure, du fait du nombre important dintermdiaires et/ou
intervenants. Ces difficults ont rendu tout effort danalyse vain ; et cest pourquoi les
dirigeants du groupe aspirent la mise en place dun systme qui procure aux dcideurs les
informations ncessaires et fiables, les aidant ainsi pendre dans les meilleurs dlais les
dcisions les plus appropries. Dans ce contexte, et afin de rpondre ces attentes
grandissantes le groupe a sollicit sa filiale spcialise dans les systmes dinformation et les
nouvelles technologies Elit .
Le But recherch tant daller vers la mise en place dun systme sinscrivant dans le cadre
du Systme de Gestion de la Clientle S.G.C . Ce systme sera construit autour dune
base de donnes ddie totalement aux dcisionnel un Data Warehouse et rpondant
tout les besoins danalyse du groupe dans sa fonction de distribution. Ce prsent projet a donc
pour vocation premire de raliser une telle base de donnes.
Mots cls : Data Warehouse Entrept de donnes , Dcisionnel, Business Intelligence
B.I , intgration de donnes, solutions BI Open Source.
Abrviations :
BI : Business Intelligence.
BT : Basse Tension.
BP : Basse Pression.
CTI : Centre de Traitement Informatique.
DAP : Direction Analyses et Prvision.
DAR : Direction Affaires De Rgulation.
DBA : Data Base Administrator.
DCF : Direction Comptabilit et Finance.
DCM: Direction Commercial Et Marketing.
DD : Direction de Distribution.
DED : Dpartement Etudes et Dveloppement.
DGDS : Direction Gnrale du Dveloppement et de la Stratgie.
DIM : Dimension.
DR : direction rgionale(DD).
DRD : Direction de Distribution Rgionale.
DW : Data Warehouse (Entrept de donnes).
ED : Etude et dveloppent.
EDW : Entreprise Data Warehouse.
EGA : Electricit et Gaz dAlgrie.
ELIT : EL-djazar Information Technology.
EPIC : Etablissement Publique caractre Industriel et Commercial.
ETL : Extract, Transform and Load (ETC).
FK: Foreign Key.
FTP : File Transfer Protocol.
HOLAP: Hybrid On Line Analytical Process.
HP : Haute Pression.
HT : Haute Tension.
MOLAP: Multidimensional On Line Analytical Process.
MP: Moyenne Pression.
MT : Moyenne Tension.
OLAP : On Line Analytical Process.
OLTP: On Line Transactional Process.
II
III
Tableau II.2 :
Tableau II.3 :
Tableau II.4 :
Tableau II.5 :
Tableau II.6 :
Tableau II.7 :
Tableau II.8 :
Tableau II.9 :
Tableau II.26 : Tableau descriptif des agrgats potentiels du modle Suivi abonns ....... 89
Tableau II.27 : Tableau descriptif des agrgats utiles du modle Suivi abonns .............. 89
Tableau II.28 : Tableau donnant les nivaux hirarchiques de chaque dimension ................... 10
Tableau II.29 : Listes des cubes dimensionnels .................................................................... 107
Figure I.2 :
Figure I.3 :
Figure I.4 :
Figure I.5 : Les Data Mart dans un entrept de donnes selon larchitecture propose par
B. Inmon dite Entreprise Data Warehouse ........................................................................... 11
Figure I.6 : Les Data Mart dans un entrept de donnes selon larchitecture propose par
R. kimball dite approche bus ................................................................................................ 13
Figure I.7 :
Figure I.8 :
Figure I.9 :
VI
Figure II.10 : La place de ltape de dfinition des besoins dans un projet Data
Warehouse.52
Figure II.11 :
Figure II.12 :
Figure II.13 :
Figure II.14 :
Figure II.15 :
Figure II.16 :
Figure II.17 :
Figure II.18 :
Figure II.19 :
Figure II.20 :
Figure II.21 :
Figure II.22 :
Figure II.23 :
Figure II.24 :
Figure II.25 :
Figure II.26 :
Figure II.27 :
Figure II.28 :
Figure II.29 :
Figure II.30 :
Figure II.31 :
Figure II.32 :
Figure II.33 :
Figure II.34 :
Figure II.35 :
Figure II.36 :
Figure II.37 :
Figure II.38 : DCU navigation dans les mtadonnes et administration des MAJ
utilisateurs ........................................................................................................... 116
Figure II.39 :
Figure II.40 :
Figure II.41 :
Figure II.42 :
VII
Introduction gnrale
Contexte gnral
Cest dans un environnement fortement complexe et hautement concurrentiel
quvolue la majeure partie, si ce nest la totalit, des entreprises. Ce climat de forte
concurrence exige de ces entreprises une surveillance trs troite du march afin de ne pas se
laisser distancer par les concurrents et cela en rpondant, le plus rapidement possible, aux
attentes du march, de leur clientle et de leurs partenaires.
Pour se faire, les dirigeants de lentreprise, quelque en soit dailleurs le domaine
dactivit, doivent tre en mesure de mener bien les missions qui leur incombent en la
matire. Ils devront prendre notamment les dcisions les plus opportunes. Ces dcisions, qui
influeront grandement sur la stratgie de lentreprise et donc sur son devenir, ne doivent pas
tre prises ni la lgre, ni de manire trop htive, compte tenu de leurs consquences sur la
survie de lentreprise. Il sagit de prendre des dcisions fondes, bases sur des informations
claires, fiables et pertinentes. Le problme est de savoir donc comment identifier et prsenter
ces informations qui de droit, sachant par ailleurs que les entreprises croulent dune part
sous une masse considrable de donnes et que dautre part les systmes oprationnels
transactionnels savrent limits, voire inaptes fournir de telles informations et
constituer par la mme un support apprciable la prise de dcision.
Cest dans ce contexte que les systmes dcisionnels ont vu le jour. Ils offrent
aux dcideurs des informations de qualit sur lesquelles ils pourront sappuyer pour arrter
leurs choix dcisionnels. Pour se faire, ces systmes utilisent un large ventail de technologies
et de mthodes, dont les entrepts de donnes (Data Warehouse) reprsentent llment
principal et incontournable pour la mise en place dun bon systme dcisionnel.
De part sa dimension conomique et sa position sur le march nergtique algrien,
lactivit journalire de la SONELGAZ gnre des donnes complexes et volumineuses. Ces
donnes reprsentent une source prcieuse dinformations, qui serait mme damliorer de
faon significative le processus de prise de dcision. Cependant, ces donnes ne sont pas
exploites de manire satisfaisante, hypothquant ainsi le processus de prise de dcision
tous les niveaux du groupe.
Le prsent projet tend la mise en place dun systme en mesure de consolider les
donnes issues des systmes transactionnels, et doffrir des informations de qualit pour les
dcideurs. Il sagit en fait de mettre la disposition des dcideurs des donnes mme de
les clairer et leur faciliter une prise de dcision prompte en connaissance de cause. Un tel
systme requiert la mise en place dun entrept de donnes fiables contenant les informations
ncessaires laccomplissement des processus dcisionnels.
1. Problmatique
Le groupe SONELGAZ est loprateur historique et leader du domaine nergtique en
Algrie, notamment dans le domaine de la distribution de llectricit et du gaz pour les
professionnels et les particuliers.
Appel interagir avec ses clients sur diffrentes phases de la distribution (demande
de branchement, facturation, rsiliation,etc.), le groupe sest dot, dans un souci de suivi de
la clientle et de gestion de la distribution, dun Systme de Gestion de la Clientle S.G.C. constitu de 35 applications, dveloppes en interne et exploit par plus de 2900
utilisateurs. Ce systme est dploy dans chacune des 58 directions de distributions D.D.
exploitant une base de donne dcentralise au niveau de chaque D.D. .
Dans un pareil contexte, la plus simple des oprations danalyse devient une tche
ardue. En effet, les socits de distributions SD se trouvent dans lincapacit de faire des
analyses fiables, efficaces et des moments opportuns sans engager des moyens considrables
sur des priodes plus ou moins longues. Ainsi, les principales difficults rencontres peuvent
tre rsumes en :
Voir annexe A
10
2. Objectifs du projet
Afin de palier aux problmes prcdemment cits, le groupe a initi, travers sa filiale
Elit, le prsent projet.
Ce projet a pour but dintroduire, en premier lieu, une informatique dcisionnelle au
sein du groupe, tout en confrant aux dcideurs un support fiable pour une meilleure prise de
dcision. Ainsi, les principaux objectifs assigns au projet sont :
Offrir aux dcideurs et aux analystes la possibilit de faire des analyses appropries.
11
Conception E.T.L
Afin de prsenter notre travail, le prsent mmoire est organis en trois parties et se
prsente comme suit :
Aprs une introduction gnrale dans laquelle nous prsentons le contexte gnral du
projet, ainsi que la problmatique et les objectifs viss. La premire partie prsente les aspects
thoriques du domaine des systmes dinformation daide la dcision, en voquant leurs
dfinitions et les concepts de bases relatifs aux entrepts de donnes et la modlisation
dimensionnelle.
12
13
Partie I :
Synthse
bibliographique
Un entrept de donnes ne s'achte pas, il se construit.
Bill Inmon
14
I.
Introduction
Toutes les entreprises du monde disposent dune masse de donnes plus ou moins
considrable. Ces informations proviennent soit de sources internes (gnres par leurs
systmes oprationnels au fil des activits journalires), ou bien de sources externes (web,
partenaire, .. etc.).
Cette surabondance de donnes, et limpossibilit des systmes oprationnels de les
exploiter des fins danalyse conduit, invitablement, lentreprise se tourner vers une
nouvelle informatique dite dcisionnelle qui met laccent sur la comprhension de
lenvironnement de lentreprise et lexploitation de ces donnes bon escient.
En effet, les dcideurs de lentreprise ont besoin davoir une meilleure vision de leur
environnement et de son volution, ainsi, que des informations auxquelles ils peuvent se fier.
Cela ne peut se faire quen mettant en place des indicateurs business clairs et pertinents
permettant la sauvegarde, lutilisation de la mmoire de lentreprise et offrant ses dcideurs
la possibilit de se reporter ces indicateurs pour une bonne prise de dcision.
Le Data Warehouse , Entrept de donnes en franais, constitue, dans ces
conditions, une structure informatique et une fondation des plus incontournables pour la mise
en place dapplications dcisionnelles.
Le concept de Data Warehouse, tel que connu aujourdhui, est apparu pour la premire
fois en 1980 ; lide consistait alors raliser une base de donnes destine exclusivement au
processus dcisionnel. Les nouveaux besoins de lentreprise, les quantits importantes de
donnes produites par les systmes oprationnels et lapparition des technologies aptes sa
mise en uvre ont contribu lapparition du concept Data Warehouse comme support
aux systmes dcisionnels.
Les origines des SID remontent au dbut de linformatique et des systmes dinformation
qui ont, tous deux, connu une grande et complexe volution lie notamment la technologie.
Cette volution se poursuit ce jour2.
Parmi les diffrentes dfinitions du dcisionnel business intelligence B.I. qui ont t
donnes on trouve :
"Le Dcisionnel est le processus visant transformer les donnes en informations et,
par l'intermdiaire d'interrogations successives, transformer ces informations en
connaissances." [Dresner, 2001].
Figure I.2 :
17
Diffrence
Systmes transactionnels
SID
Orient applications
Situation instantane
Situation historique
agrges
cohrentes
redondantes
Un rfrentiel unique
Lusage
dcision
Pour les oprationnels
Usage matris
Usage alatoire
Tableau I.1 : Tableau comparatif entre les systmes transactionnels et les systmes
dcisionnels.
Ces diffrences font ressortir la ncessit de mettre en place un systme rpondant aux
besoins dcisionnels. Ce systme nest rien dautre que le Data Warehouse .
18
II.
Le Data Warehouse
II.1
Bill Inmon dfinit le Data Warehouse, dans son livre considr comme tant la rfrence
dans le domaine Building the Data Warehouse [Inmon, 2002] comme suit:
Le Data Warehouse est une collection de donnes orientes sujet, intgres, non
volatiles et volutives dans le temps, organises pour le support dun processus daide
la dcision.
Les paragraphes suivants illustrent les caractristiques cites dans la dfinition dInmon.
Orient sujet : le Data Warehouse est organis autour des sujets majeurs de lentreprise,
contrairement lapproche transactionnelle utilise dans les systmes oprationnels, qui sont
conus autour dapplications et de fonctions telles que : cartes bancaires, solvabilit client,
les Data Warehouse sont organiss autour de sujets majeurs de lentreprise tels que : clientle,
ventes, produits. Cette organisation affecte forcment la conception et limplmentation des
donnes contenues dans le Data Warehouse. Le contenu en donnes et en relations entre elles
diffre aussi. Dans un systme oprationnel, les donnes sont essentiellement destines
satisfaire un processus fonctionnel et obit des rgles de gestion, alors que celles dun Data
Warehouse sont destines un processus analytique.
Intgre : le Data Warehouse va intgrer des donnes en provenance de diffrentes sources.
Cela ncessite la gestion de toute incohrence.
Evolutives dans le temps : Dans un systme dcisionnel il est important de conserver les
diffrentes valeurs dune donne, cela permet les comparaisons et le suivi de lvolution des
valeurs dans le temps, alors que dans un systme oprationnel la valeur dune donne est
simplement mise jour. Dans un Data Warehouse chaque valeur est associe un moment
Every key structure in the data warehouse contains - implicitly or explicitly -an element of
time [Inmon, 2000].
Non volatiles : cest ce qui est, en quelque sorte la consquence de lhistorisation dcrite
prcdemment. Une donne dans un environnement oprationnel peut tre mise jour ou
supprime, de telles oprations nexistent pas dans un environnement Data Warehouse.
Organises pour le support dun processus daide la dcision : Les donnes du Data
Warehouse sont organises de manire permettre lexcution des processus daide la
dcision (Reporting, Data Mining).
19
II.2
Entrept de
donnes
Infocentre
bases de
donnes
oprationnelles
1970
Figure I.3 :
1980
1990
20
II.3
Le Data Warehouse a une structure bien dfinie, selon diffrents niveaux dagrgation
et de dtail des donnes. Cette structure est dfinie par Inmon [Inmon, 2000] comme suit :
M
E
T
A
D
O
N
N
E
S
Donnes agrges
Donnes dtailles
Donnes dtailles : ce sont les donnes qui refltent les vnements les plus rcents,
frquemment consultes, gnralement volumineuses car elles sont dun niveau dtaill.
Donnes dtailles archives : anciennes donnes rarement sollicites, gnralement
stockes dans un disque de stockage de masse, peu coteux, un mme niveau de dtail que
les donnes dtailles.
Donnes agrges : donnes agrges partir des donnes dtailles.
Donnes fortement agrges : donnes agrges partir des donnes dtailles, un niveau
dagrgation plus lev que les donnes agrges.
21
Meta donnes : ce sont les informations relatives la structure des donnes, les mthodes
dagrgation et le lien entre les donnes oprationnelles et celles du Data Warehouse. Les
mtadonnes doivent renseigner sur :
Le modle de donnes,
La structure des donnes telle quelle est vue par les dveloppeurs,
La structure des donnes telle quelle est vue par les utilisateurs,
II.4
Figure I.5 :
les Data Mart dans un entrept de donnes selon larchitecture Entreprise Data
Warehouse (E.D.W) [Inmon, 2002].
23
Figure I.6 :
les Data Mart dans un entrept de donnes selon larchitecture bus de donnes
[Kimball, 2002].
Zone doutils daccs : cest lensemble des moyens fournis aux utilisateurs du Data
Warehouse pour exploiter la zone de prsentation des donnes en vue de la prise de dcision.
Ces outils varient des simples requtes ad hoc aux outils permettant lapplication de forage de
donnes plus complexes.. Environ 80 90% des utilisateurs sont desservis par des applications
danalyses prfabriques, consistaant essentiellement en des requtes prtablies.
s.
II.5
Aprs avoir expos et dfini chacun des lments constituant lenvironnement dun Data
Warehouse, il serait intressant de connaitre le positionnement de ces lments dans une
architecture globale dun Data Warehouse :
http://www.formations-sas.fr/data-warehouse
25
III.
III.1
Les Data Warehouse sont destins la mise en place de systmes dcisionnels. Ces
systmes, devant rpondre des objectifs diffrents des systmes transactionnels, ont fait
ressortir trs vite la ncessit de recourir un modle de donnes simplifi et aisment
comprhensible. La modlisation dimensionnelle permet cela. Elle consiste considrer un
sujet danalyse comme un cube plusieurs dimensions, offrant des vues en tranches ou des
analyses selon diffrents axes.
Figure I.8 :
26
Figure I.9 :
27
Tables de faits
Peu de colonnes beaucoup de lignes
Mesurable, gnralement numrique
Plusieurs cls trangres
Prend de nombreuses valeurs
Participe des calculs
Valeurs de mesure
Assure les relations entre les
dimensions
Tableau I.2 :
III.2
Tables de dimensions
Peu de lignes beaucoup de colonnes
Descriptives gnralement textuelles
Une cl primaire
Plus ou moins constantes
Participe des contraintes
Descriptive
Assure linterface homme / entrept
de donnes
28
III.3
Le concept OLAP
III.3.1 Gnralits
Le terme OLAP (On-Line Analytical Processing) dsigne une classe de technologies
conue pour laccs aux donnes et pour une analyse instantane de ces dernires, dans le but
de rpondre aux besoins de Reporting et danalyse.
R. Kimball dfinit le concept OLAP comme Activit globale de requtage et de
prsentation de donnes textuelles et numriques contenues dans lentrept de donnes; Style
dinterrogation spcifiquement dimensionnel [Kimball, 2005].
Cest en continuant sur sa lance, qui lui a permis de dfinir le model OLTP pour les
bases de donnes relationnelles, que le concept OLAP fut introduit et dfini6 en 1993 par E.F
Codd, le pre des bases de donnes relationnelles, dans un document technique portant le titre
de Providing OLAP (On-Line Analytical Processing) to User-Analysts : An IT Man-date
[Codd, 1993].
III.3.2 Architectures des serveurs OLAP
Le noyau dun systme OLAP est son serveur. Ces serveurs sont classs selon la politique
rgissant larchitecture du serveur. Ainsi, ces architectures peuvent tre distingues comme
suit:
III.3.2.1
Cette dfinition passe par lintroduction de 12 rgles. Six autres rgles furent par la suite, en 1995, ajoutes
aux 12 prcdentes et le terme rgles remplac par dispositif features par le mme auteur savoir
Codd (Voir annexe B).
29
Data Warehouse
Donnes
Moteur MOLAP
Traitements
Stockage des
donnes dtailles (et
agrges)
Aide la dcision
Prsentation
Rapports
Multi-Dimensionnel
III.3.2.2
Data Warehouse
Donnes
Stockage des
donnes dtailles (et
agrges) et
des mta-donnes
Figure I.11 :
Moteur ROLAP
Traitements
Gnration de plans
d'excution SQL
afin d'obtenir des
fonctionnalits OLAP.
Aide la dcision
Prsentation
Rapports
Multi-Dimensionnel
III.4
31
Figure I.12
I
:
Exemple de Slicing.
Le Dicing, quant lui, peut tre vu comme tant une extraction dun sous cube.
Figure I.13
I
:
Exemple de Dicing.
32
Ces oprations ne sont pas aussi faciles implmenter car bases sur la notion dune
bonne hirarchisation des attributs dune dimension et la diffrenciation entre tous les niveaux
de hirarchie disponibles dans les diffrentes dimensions.
Figure I.14 :
Figure I.15 :
33
IV.
IV.1
Les deux approches les plus connues dans la conception des Data Warehouse sont :
Aucune des deux approches cites nest ni parfaite, ni applicable tous les cas. Toutes
deux doivent tre tudies pour choisir celle qui sadapte le mieux notre cas.
Quelque soit lapproche adopte pour la conception dun Data Warehouse, la
dfinition de celui-l reste la mme. En tant un support daide la dcision, le Data
Warehouse se base sur une architecture dimensionnelle.
IV.1.1 Approche Besoins danalyse
Le contenu du Data Warehouse sera dtermin selon les besoins de lutilisateur final.
Cette approche est aussi appele approche descendante (Top-Down Approach) et est
illustre par R. Kimball grce son cycle de vie dimensionnel comme suit :
Avantages
Inconvnients
Aucun risque de concevoir une solution Pas de prise en compte de lvolution des
obsolte avant dtre oprationnelle
besoins de lutilisateur. Ncessite une
modification de la structure du Data
Warehouse en cas de nouveau besoin
Ngligence du systme oprationnel
Difficult de dterminer les besoins des
utilisateurs
Tableau I.3 : Avantages et inconvnients de lapproche Besoins danalyse .
IV.1.2 Approche Source de donnes
Le contenu du Data Warehouse est dtermin selon les sources de donnes. Cette
approche est appele : Approche ascendante (Bottom-up Approach).
Inmon considre que lutilisateur ne peut jamais dterminer ses besoins ds le dpart,
Donnez moi ce que je vous demande, et je vous direz ce dont jai vraiment besoin 7, il
considre que les besoins sont en constante volution.
Avantages
Inconvnients
Meilleure prise en charge de lvolution des Risque de concevoir une solution obsolte
besoins
avant quelle soit oprationnelle
Evolution du schma des donnes source
Complexit de source de donnes
Tableau I.4 :
Figure I.18 :
Give me what
I tell you I want, then I can tell you what I really want.[Inmon, 2002]
36
Extraction des donnes primaires (issues par exemple des systmes de production),
Ces trois tapes dcrivent une mcanique cyclique qui a pour but de garantir
lalimentation du Data Warehouse en donnes homognes, propres et fiables.
IV.2.1 Les phases de lalimentation E.T.L.
Les phases du processus E.T.L. reprsentent la mcanique dalimentation du Data
Warehouse. Ainsi elles se droulent comme suit :
a) Lextraction des donnes
Lextraction est la premire tape du processus dapport de donnes lentrept de
donnes. Extraire, cela veut dire lire et interprter les donnes sources et les copier dans la
zone de prparation en vue de manipulations ultrieures. [Kimball, 2005].
Elle consiste en :
Cibler les donnes,
Appliquer les filtres ncessaires,
Dfinir la frquence de chargement,
Lors du chargement des donnes, il faut extraire les nouvelles donnes ainsi que les
changements intervenus sur ces donnes. Pour cela, il existe trois stratgies de capture de
changement :
Colonnes daudit : la colonne daudit, est une colonne qui enregistre la date
dinsertion ou du dernier changement dun enregistrement. Cette colonne est mise jour soit
par des triggers ou par les applications oprationnelles, do la ncessit de vrifier leur
fiabilit.
Capture des logs : certains outils ETL utilisent les fichiers logs des systmes sources
afin de dtecter les changements (gnralement logs du SGBD). En plus de labsence de cette
fonctionnalit sur certains outils ETL du march, leffacement des fichiers logs engendre la
perte de toute information relative aux transactions.
37
Cette opration se solde par la production dinformations dignes dintrt pour lentreprise
et de et sont donc prtes tre entreposes.
c) Le chargement des donnes
Cest la dernire phase de lalimentation dun entrept de donnes, le chargement est une
tape indispensable. Elle reste toute fois trs dlicate et exige une certaine connaissance des
structures du systme de gestion de la base de donnes (tables et index) afin doptimiser au
mieux le processus.
IV.2.2 Politiques de lalimentation
Le processus de lalimentation peut se faire de diffrentes manires. Le choix de la
politique de chargement dpend des sources : disponibilit et accessibilit. Ces politiques
sont8 :
http://grim.developpez.com/articles/concepts/etl/
38
tre correctif
Processus
ETL
tre sr
tre transparent
tre rapide
Figure I.19 :
IV.3
Cest la dernire tape dun projet Data Warehouse, soit son exploitation. Lexploitation
du Data Warehouse se fait par le biais dun ensemble doutils analytiques dvelopps autour
du Data Warehouse. Donc cette tape ncessite lachvement du dveloppement, ou de la
mise en place, de ces outils qui peuvent accomplir les fonctions suivantes:
a. Requtage ad-hoc :
Le requtage ad-hoc reste trs frquent dans ce type de projet. En effet, les utilisateurs
de lentrept de donnes, et spcialement les analystes, seront amens interagir avec le DW
via des requtes ad-hoc dans le but de faire les analyses requises par leurs mtiers et,
dlaborer aussi, des rapports et des tableaux de bords spcifiques.
Laccs ce genre de service peut se faire via diffrentes mthodes et outils.
Cependant, les spcialistes en la matire prconisent de laisser la possibilit lutilisateur de
choisir les outils qui lui paraissent les plus adquats.
b. Reporting :
Destin essentiellement la production de rapports et de tableaux de bord, il est la
prsentation priodique de rapports sur les activits et rsultats d'une organisation, d'une
unit de travail ou du responsable d'une fonction, destine en informer ceux chargs de les
superviser en interne ou en externe, ou tout simplement concerns par ces activits ou
rsultants 9.
Ces outils de Reporting ne sont pas, proprement parler, des instruments d'aide la
dcision, mais, lorsquils sont utiliss de manire approprie, ils peuvent fournir une prcieuse
vue densemble.
Les rapports sont alors cres par le biais doutils de Reporting qui permettent de leur
donner un format prdtermin. Les requtes sont constitues lors de llaboration des
rapports qui seront ensuite diffuss priodiquement en automatique ou ponctuellement la
demande.
http://fr.wikipedia.org/wiki/Reporting
40
41
IV.4
Maintenance et expansion
La mise en service du Data Warehouse ne signifie pas la fin du projet, car un projet
Data Warehouse ncessite un suivi constant compte tenu des besoins doptimisation de
performance et ou dexpansion. Il est donc ncessaire dinvestir dans les domaines suivants
[Kimball, 2002] :
Support : assurer un support aux utilisateurs pour leur faire apprcier lutilisation de
lentrept de donnes. En outre, la relation directe avec les utilisateurs permet de dtecter les
correctifs ncessaires apporter.
Formation : il est indispensable doffrir un programme de formation permanant aux
utilisateurs de lentrept de donnes.
Support technique : un entrept de donnes est considr comme un environnement
de production. Naturellement le support technique doit surveiller avec la plus grande vigilance
les performances et les tendances en ce qui concerne la charge du systme.
Management de lvolution : il faut toujours sassurer que limplmentation rpond
aux besoins de lentreprise. Les revues systmatiques certain point de contrle sont un outil
cl pour dtecter et dfinir les possibilits damlioration. En plus du suivi et de la
maintenance du Data Warehouse, des demandes dexpansion sont envisageables pour de
nouveaux besoins, de nouvelles donnes ou pour des amliorations.
Ces travaux dexpansion sont prvoir de faon faciliter lvolution du schma du
Data Warehouse.
42
V.
Conclusion
Le concept Data Warehouse est apparu comme une rponse des besoins
grandissants dans le domaine dcisionnel. Son adaptabilit et sa capacit de fournir les
donnes ncessaires une bonne analyse, ont fait de lui un atout majeur et incontournable
pour toute entreprise soucieuse du suivi de ces performances.
Afin de mettre en place ce genre de systme, il est ncessaire de choisir et dadopter
une dmarche prcise qui doit tenir compte des ralits de lentreprise et des contraintes du
projet. La modlisation de lentrept se fait dans tous les cas grce la modlisation
dimensionnelle. Lalimentation en donnes constitue ltape laquelle il faut accorder le plus
dattention et de temps. En effet, elle est le garant de contenance de lentrept en donnes
fiables et correctes. Une fois lalimentation termine, lexploitation des donnes peut alors se
faire par diffrentes mthodes. Lutilisation doutil OLAP reste, cependant, laspect le plus
intressant dans cette exploitation permettant la navigation dans les donnes de lentrept la
demande.
Au cours de la seconde partie de cette tude, nous allons essayer dutiliser les
concepts prsents dans la synthse bibliographique, et cela afin de mettre en uvre notre
systme.
43
Partie II :
44
Chapitre I :
Prsentation
daccueil.
de
lorganisme
45
I.
Prsentation de SONELGAZ
I.1 Historique
SONELGAZ est loprateur historique dans le domaine de la fourniture des nergies
lectrique et gazire en Algrie. Ses missions principales sont la production, le transport et la
distribution de llectricit ainsi que le transport et la distribution du gaz par canalisations.
Son nouveau statut lui confre la possibilit dintervenir dans dautres segments dactivits
prsentant un intrt pour lentreprise et notamment dans le domaine de la commercialisation
de llectricit et du gaz ltranger. Durant son existence le groupe a connu des volutions
majeures qui peuvent tre rsumes comme suit :
1947, Cration dEGA : Cest le dcret du 5 juin 1947 qui a cre lEtablissement Public
National Electricit et Gaz dAlgrie (EGA par abrviation). Par dcret du 16 aot 1947,
seize socits qui se partageaient les concessions lectriques ont t transfres EGA. Ces
socits dtenaient alors 90% des proprits industrielles lectriques et gazires du pays.
1962, Le dfi de la relve : Cette anne reprsente la prise en main de lAlgrie indpendante
de la SONELGAZ alors Electricit et Gaz dAlgrie et cela en faisant face au dpart
massif de cadres et techniciens franais.
Priode allant de 1962 1969 : Cette priode a t caractrise par la baisse de la
consommation (une baisse de prs de 33% en deux ans) d au dpart massive des trangers
qui reprsentaient plus de 87% de la clientle. Par ailleurs, les tches les plus urgentes ont t
de reprendre le fichier des abonns, reconstituer les plans des ouvrages et des rseaux,
procder au recrutement et la formation dans tous les domaines et de ramener le niveau de
consommation de lnergie celui de 1961.
1969, cration de SONELGAZ: Cest lordonnance n 69-59 du 28 juillet 1969) portant
dissolution de lEGA et cration de la nouvelle Socit Nationale de lElectricit et du GAZ SONELGAZ-. Ce texte sinscrit dans le cadre des mesures de nationalisation des secteurs cls
de lconomie nationale. Lordonnance prcite a attribu lentreprise le monopole de la
production, du transport, de la distribution, de limportation et de lexportation de llectricit
et du gaz manufactur (art. 4 et 7). Lensemble des biens de lex-EGA lui a t lgu.
1977, le plan national dlectrification : Ds le milieu des annes 70, lAlgrie sest
engage dans un ambitieux plan national dlectrification qui avait objectif lamlioration des
conditions de vie des populations des campagnes tout en assurant un dveloppement
harmonieux de lespace rural.
1983, naissance des entreprises travaux : six entreprises autonomes voient le jour :
KAHRIF pour llectrification; KAHRAKIB - Infrastructures et installations lectriques;
KANAGAZ - Ralisation des rseaux gaz; INERGA - Gnie civil; ETTERKIB Montage
industriel et lentreprise AMC - Fabrication des compteurs et appareils de mesure et de
contrle.
46
Organisation du groupe
47
Socits en Participation : SONELGAZ sest investie dans des domaines cls haute
valeur technologique tels que les tlcommunications ou la maintenance de turbines gaz.
Lorganigramme suivant donne une vision claire et prcise de la structure de
lentreprise et de son administration :
48
I.1.2
Le groupe en chiffres
Le tableau suivant donne les chiffres relatifs lactivit du groupe pour lanne 2008:
Critres
Chiffres
Investissements groupe
Electricit
Ventes
Gaz
Electricit
Nombre de clients
Gaz
Production SPE
Production
dlectricit groupe
Production IPP
Personnel en activit Permanents
du groupe
Temporaires
Tableau II.1 :
La figure suivante illustre lvolution du chiffre daffaire du groupe depuis lanne 2001 :
Figure II.2 : Evolution du chiffre daffaire du groupe rapport dactivit de lanne 2008 .
49
La rpartition du chiffre daffaire du groupe pour lanne 2008 est de la manire suivante :
Figure II.3 : Rpartition du chiffre daffaire publie dans le rapport dactivit de lanne
2008.
50
Lexploitation
exploitation et la maintenance du rseau de distribution
distribution de llectricit et du gaz.
Lee dveloppement des rseaux lectricit et gaz permettant le raccordement
raccordement des
nouveaux clients.
La commercialisation
tion de llectricit et du gaz.
Le tableau suivant donne une vue densemble des chiffres daffaires des socits de
distribution :
SDO
SDC
SDA
SDE
Cration
Jan. 2006
Jan. 2006
Jan. 2006
Jan. 2006
26.366,14
16.242
17.713
39,752
ELEC
1.668.668
1.290.058
810.636
2.069.266
GAZ
549.904
389.410
383.583
893.750
4406
3211
2412
4887
Nombre de clients
Nombre demploys
Tableau II.2 :
I.2.1
Chaque socit de distribution compte cinq directions centrales, situes au niveau de son
sige, et gre un certain nombre de Directions de distribution . Chacune de ces Directions
de Distributions gre des Services Commerciaux . Lorganigramme suivant illustre :
La clientle de la distribution
b. En gaz :
52
Clients non mnages : il sagit des clients non domestiques (Activits commerciales).
Jusqu la fin des annes 80, linformatique tait essentiellement prsente au niveau
central sur gros systmes. Cette priode a vu le dveloppement de systmes de gestion
de lentreprise et lacquisition de modles scientifiques de calcul pour la planification
des rseaux Electricit et Gaz (CARAT et APHYRE).
La rorganisation de SONELGAZ en 1991 et lavnement des mini et microordinateurs ont prcipit la dcentralisation de linformatique.
Prsentation de ELIT
53
Figure II.6 :
54
Figure II.7 :
55
II.
Conclusion
Avec ses dcennies dactivit dans le domaine de lnergie et une rputation qui
dpasse les frontires du pays, le groupe SONELGAZ reprsente un acteur majeur et
incontournable de lconomie nationale. Cette brve prsentation nous a permis de connatre
un peu plus le groupe SONELGAZ, notamment dans sa nouvelle configuration de holding
industriel.
Par ailleurs, cette prsentation nous a fait comprendre la structuration et lorganisation
du mtier de la distribution, qui est le premier vis par ce projet, et de nous pencher sur
linformatique du groupe dsormais gre, au niveau national, par la filiale ELIT .
Dans le chapitre suivant, une tude dtaille de lexistant dcisionnel du groupe, dans
sa fonction de distribution, sera prsente.
56
57
I.
Introduction
II.
II.1
Niveau Groupe
A ce niveau de hirarchie, les utilisateurs ont besoin de chiffres qui concernent lensemble
du groupe, dans sa fonction de distribution. Ces rapports sont essentiellement livrs par la
filiale ELIT . Les donnes tant consolides partir des bases de production des DD
des quatre filiales de distribution. Cela suppose donc, la participation de diffrents acteurs
disperss sur lensemble du territoire national ainsi que sur lensemble des filiales
distributions.
Dans le meilleur des cas, le rapport demand concerne des donnes dj consolides et
prtes lutilisation. Llaboration du rapport se fait donc sans grandes difficults. Sinon, le
procd dextraction et de consolidation est relanc. Le diagramme suivant donne une vision
claire de la manire dont sont consolides les donnes et les rapports labors en partant de la
demande dun tat donn jusqu' sa production :
58
Figure II.8 : Diagramme dactivit modlisant ldition de rapport pour le niveau groupe.
partir de ce diagramme on peut dores et dj avoir une ide sur le nombre
dintervenants dans cette procdure qui reste une tche trs fastidieuse, surtout dans sa partie
consolidation des donnes. Cette procdure se droule comme suit:
Phase 1 : les utilisateurs de niveau groupe, principalement des analystes et des
dcideurs de la DGDS et de la maison mre, formulent leurs requtes qui sont transmises au
dpartement Systmes dinformation de la distribution (SID) de la filiale ELIT .
Phase 2 : le dpartement SID, en recevant une demande de la part des utilisateurs de
niveau groupe, lance la procdure de consolidation des donnes partir des diffrentes DD du
groupe. Cette procdure doit faire lobjet dune validation de la part du directeur tudes et
dveloppement. La demande est ensuite transmise au chef de CTI de chaque DD.
Phase 3 : Les chefs de CTI, en recevant la demande dextraction, programment une
tranche horaire et prparent les scripts dextraction. Ltape dextraction aboutit la
transmission de fichier texte vers le dpartement SID.
59
Remarque : les fichiers, tant dune taille assez volumineuse, peuvent atteindre une
centaine de mgas voire plus. Ces dits fichiers subissent parfois des altrations durant le
transfert ou deviennent carrment inutilisables. Dans ce cas les D.D. concernes sont
recontactes pour une nouvelle extraction ou un nouvel envoi selon la nature du problme. Il
arrive parfois, suite des problmes rseaux, de recourir au transfert des donnes sur
support physique transportable (CD, cl USB).
Phase 4 : Une fois les donnes reues en totalit, la consolidation se fait au niveau du
dpartement SID manuellement. Cette consolidation permet dlaborer les rapports
voulus.
Phase 5 : Le rapport est valid par le chef de dpartement est et envoy aux
utilisateurs finaux.
Remarque : la procdure se rpte gnralement quatre fois par an, la consolidation
des chiffres se faisant chaque trimestre. Mais cela nempche pas le lancement de cette
procdure en cas de ncessit.
Sauf en cas de problmes, toute change dinformation demandes et fichiers joints
se fait par le biais de la messagerie interne du groupe.
II.2
10
II.3
11
Ce module a t dvelopp pour fournir un certain nombre de rapports statistiques au niveau DD. Il interagit
directement avec la base de donnes en production et pnalise souvent le systme transactionnel.
61
III.
Conclusion
Cette tude nous permet davoir une vision gnrale des procdures dlaboration de
rapports et de consolidation des donnes. Elle constitue aussi le point de dpart pour dfinir le
primtre du projet en gnral et de ltude des besoins en particulier. Elle fait ressortir les
insuffisances du systme actuel en soulignant les points faibles ou les goulots dtranglements
de ce dernier.
Le chapitre suivant consacr ltude des besoins, aidera dtecter ceux des
utilisateurs de manire pouvoir y rpondre.
62
63
I.
Introduction
Tout Data Warehouse doit tre en mesure de rpondre aux attentes des utilisateurs.
Cela ne peut, videmment, se fairee sans une tude approfondie de leurs besoins.
Ainsi, il existe deux dmarches qui ont t dcrites lors de notre synthse
bibliographique, et qui sont: l'approche Buttom Up et l'approche Top Down .
L'application exclusive dee l'une
l
de ces deux approches ne produit nullement des
rsultats satisfaisants. La dmarche gnralement adopte est une dmarche mixte, qui allie
entre les deux prcdentes dans un souci de prise en considration des besoins des dcideurs
sans perdre de vue toute possibilit
possibilit et opportunit offerte par les donnes sources
sources. Cette
approche permet donc de recueillir, corriger et de modrer les attentes des utilisateurs ds le
dpart, tout en dtectant d'ventuels besoins non exprims.
Durant ltude des besoins on ne peut se limiter
limiter aux interviews avec les utilisateurs
utilisateurs,
nanmoins, il faudrait absolument prendre en compte lavis des Administrateurs des bases de
donnes des systmes sources Les DBA sont les principaux experts sur les applications
existantes susceptibles d'alimenter
d'aliment
l'entrept de donnes. Leurs interviews servent
confronter aux ralits certains des thmes qui surgissent lors des rencontres avec les
utilisateurs finaux. [Kimball, 96]
Figure II.9 : La place de ltape dtude des besoins dans un projet Data Warehouse.
64
tude prliminaire des systmes sources et interviews sommaires avec les DBA,
a. tude prliminaire des systmes sources et interviews sommaires avec les DBA
Cette tude reprsente une tape de comprhension des systmes oprationnels et de leur
environnement. Elle a pour mrite de consolider les connaissances acquises durant ltude de
lexistant, ainsi que le jargon et le fonctionnement de lentreprise. En outre, cette tape permet
de dtecter, de manire succincte, les postes susceptibles dinteragir avec le Data Warehouse.
Elle est de ce fait indispensable pour un bon recensement des besoins.
Outre les DBA, qui sont pour la plupart des chefs de CTI, les gestionnaires qui se trouvent
au sein de lElit, et dont la fonction principale est de dfinir les rgles de gestion des
applications et de sassurer du respect des procdures propres la distribution, ont t une
source dinformation assez bnfique, eu gard leur connaissance des applications du SGC
et de leur matrise du mtier du groupe.
b. Dtection des postes susceptibles d'tre porteurs d'informations utiles
Vu le grand nombre demploys activant au sein du groupe SONELGAZ, notamment
dans la fonction de distribution, ainsi que la dispersion gographique des filiales, il nous a t,
bien sr, impossible de voir et dinterviewer toute cette population. Ainsi, notre tude sest
axe sur les utilisateurs SDA, SDC.
Cette tape nous a permis, donc, didentifier, en premier lieu, les services qui peuvent
tre porteurs dinformations tangibles et qui reprsentent la population potentiellement
utilisatrice du projet. Ces dits services sont classs selon leur appartenance aux diffrentes
structures, indiqu dans le tableau suivant:
65
Structure
Intitul du poste
Direction de distribution
Commercial
Administrateur
P.D.G de la SD
D.C.M
P.D.G
DGDS
Socit de distribution
Groupe
DAP
DAR
ED
Total
Tableau II.3 :
248
Tableau prsentant la population interviewer.
La phase de planification
66
La phase de prparation
Une fois la planification de lentretien termine, sa prparation doit se faire de telle sorte
ce quil se droule dans les meilleures conditions possibles.
La prparation se rsume essentiellement en lidentification des questions poser, des
points soulever et des thmes viter afin de ne pas trop sparpiller.
Les questions poser sont classes en deux catgories, selon le poste de la personne
interviewe. Ainsi certaines questions sont destines aux dcideurs alors que dautres sont
destines aux analystes.
3
Dernire phase de ltape, la conduite des interviews reprsente la ralisation sur le terrain
des phases prcdentes. Le but escompt tant damener les interviews, au travers de leurs
rponse nos questions, de prsenter leur travail et la manire dont ils procdent pour le faire.
Lidentification des besoins se fera alors en dtectant les mtriques quils utilisent et les
informations sur lesquelles ils sappuient pour la prise de dcision.
d. Autres moyens utiliss pour la dtection des besoins
Bien que les entretiens reprsentent une source importante dinformations et aident
grandement lidentification des besoins des utilisateurs, leur utilisation exclusive nest pas
conseille dans la construction dun entrept de donnes. Cela tient principalement au fait que
les utilisateurs ne peuvent, mme avec la meilleure volont du monde, exprimer tous leurs
besoins.
De ce fait, il est fait appel ltude des rapports dj demands et des donnes
disponibles a mme de fournir des informations exploitables.
Ltude des rapports offre un certain apport notre dmarche dtudes des besoins, dans la
mesure o les utilisateurs peuvent ne pas mentionner des besoins qui leur paraissent vidents
ou qui ne leur viennent pas lesprit durant nos interviews, ces derniers peuvent tre, en effet,
influencs par nos questions.
Ltude des donnes, quant elle, sert dtecter des besoins non dclars et qui
peuvent se faire sentir ultrieurement, le but de cette dmarche tant de construire un entrept
de donnes capable de rpondre ces ventuels nouveaux besoins.
67
Volet Dtect
Suivi des
ventes
Suivi des
abonns
Suivi des
affaires
Suivi des
recouvrements
Tableau II.4 :
68
I.2
Bien que notre tude des besoins ait donn lieu aux rsultats escompts, savoir leur
identification et leur prise en charge, il nempche que le travail ne sest pas effectu sans
obstacles, dont les plus importants sont :
Difficult de planifier les entretiens cause de :
- La charge de travail qui nous incombe,
-
dhbergent des
69
II.
Conclusion
Ltude des besoins est une tape plus que ncessaire dans un projet Data Warehouse.
Cest, en effet, partir de cette tude que se dcidera la manire de construction de lentrept
de donnes et de son architecture.
Cette tude des besoins sest droule sur vingt trois entretiens et a concern quinze
personnes occupant diffrents postes des niveaux hirarchiques diffrents. Lensemble des
entretiens a dur plus de 33 heures et nous ont permis tout dabord dappliquer les mthodes
danalyse et de collecte dinformation. Il nous a permis de connatre davantage de dtails sur
les rouages de lentreprise et didentifier les besoins analytiques de lentreprise.
Les besoins tant recenss, la construction du Data Warehouse peut alors commencer.
Cette construction fera lobjet du chapitre suivant.
70
Chapitre IV :
Conception de la solution
71
72
I.
Introduction
Une fois les besoins des utilisateurs connus, nous pouvons commencer concevoir les
volets de notre Data Warehouse. Pour cela, nous avons eu recours la modlisation
dimensionnelle qui est souvent associe aux entrepts de donnes compte tenu de ses
avantages.
Cependant, avant de se lancer dans la modlisation, il est intressant de classer les
sujets recenss selon lintrt quils reprsentent pour lentreprise et less facilits de
ralisation. Ce classement nous aidera choisir lactivit modliser en premier lieu de
manire garantir des rsultats satisfaisants
satisfaisant pour lentreprise.
II.
Choix de lactivit modliser : ce choix se fait aprs classement des activits dans
une matrice dite danalyse
analyse des priorits [Kimball, 2004]. Cette matrice permet de
connatre quelle activit choisir en premier. Le classement des sujets recenss, qui
sest fait en collaboration avec les dcideurs et les techniciens de lentreprise, est
illustr dans la figure suivante :
Dfinir
finir les mesurables du fait,
II.1
Volet Vente
SONELGAZ, par le biais de ses quatre filiales, propose la vente dnergie, (lectricit ou
gaz), livr par canalisation jusquau lieu de consommation, dans le cadre dun contrat de
fourniture.
La vente dnergie, lectrique ou gazire, demeure comme lactivit principale des filiales
de distribution du groupe SONELGAZ, ralisant la plus grande partie du chiffre daffaire du
groupe. Les chiffres lis aux ventes se prsentent comme des indicateurs dune grande
signification par rapport la performance du groupe. Ainsi la disponibilit de ces
informations savre indispensable pour les dcideurs de lentreprise.
b) Grain de lactivit
Le choix du grain le plus fin donne un maximum de flexibilit. Dans le cas des ventes
le grain le plus fin, ou le niveau de dtail le plus bas, correspond une opration de
facturation12, do une ligne de table de fait correspondant :
Suivi de la quantit et du montant de la vente dune nergie par tarif un client
activant dans un certain domaine une date donne.
12
Ce nest quaprs facturation que la quantit et le montant consomm sont arrts, do la vente.
74
c) Les dimensions
sions participantes du modle
Les dimensions ont pour objectif de dcrire le fait, donc on essaye de recenser
recens toutes les
informations
formations qui dcrivent une vente et qui peuvent intresser les dcideurs.
1. Dimension Temps
La dimension temps est la seule dimension qui figure systmatiquement dans tout
entrept de donnes, car en pratique tout entrept de donnes est une srie temporelle. Le
temps est le plus souvent la premire dimension dans le classement sous jacent de la base de
donnes [Kimball, 2001].
La dimension temps se prsente comme
com suit :
Figure II.11
11 : La Dimension Temps de lactivit Vente .
Le niveau de dtail le plus bas de cette dimension est la journe. En effet, les utilisateurs
ont fait ressortir le besoin de suivre les chiffres au jour le jour et den
d
garder lhistorique de
ces derniers.
Dans cette dimension, il est utilis une cl artificielle comme cl primaire.
primair Cette cl
artificielle sert faciliter la manipulation de la dimension. Le tableau suivant donne plus de
dtails sur cette dimension :
75
Dsignation
Code_temps
Dtails
Cl artificielle de la dimension temps.
Date
Jour
Jour_semaine
Mois
Nom du mois.
Mois_annee
Annee_mois
Semaine_dans_annee
Annee
Anne de la date.
Trimestre
Trimestre de la date.
Trimestre_annee
Saison
Evnement
Tableau II.5 :
76
2. Dimension client
Le client simpose comme un lment important dans lanalyse,
lanalyse et intresse les
analystes et les dcideurs de lentreprise. Outre ce quil reprsente dans une opration de
vente, lanalyse
analyse du comportement du client peut aider lentreprise mieux le satisfaire.
Figure II.12
12 :
La Dimension
imension Client de lactivit Vente .
La dimension client dcrit un client, lacheteur. Un client est rfrenci par son lieu de
consommation, c'est--dire
dire quatre clients qui ont habit le mme lieu, sont considrs comme
un seul client. Pour permettre la traabilit et le suivi dun client on a introduit une cl
artificielle. Celle-ci aide pallier linsuffisance de la codification en vigueur, notamment
pour une finalit dcisionnelle
le.. Les caractristiques qui dcrivent un client sont:
77
Dsignation
Code_client
Dtails
Cl artificielle
Reference
Numero_client
Nom_client
Le nom du client.
Adresse_client
Adresse du client.
Code_postal
Commune
Agence
Direction_regionale
Wilaya
Filiale
Secteur_activite
Debit_gaz
Debit_electricite
Type
Groupe
Tournee
Tableau II.6 :
13
3. Dimension facture
Une facture est un document relatif au fait de vente. Cette dernire contient un certain
nombre dinformations intressantes pour une analyse. Elle dcrit les diffrentes
caractristiques dune facture, et qui caractrisent aussi une vente.
Figure II.13 :
79
Dsignation
Numero_facture
Dtails
Cl artificielle
Numero_facture_SGC
Date_facture
Date de la facturation.
Cycle
Type
Type_releve
Montant_HT
Montant_TTC
Taxe_habitation
Taxe habitation.
Montant_timbre
Montant du timbre.
Montant_TVA
Montant TVA.
Droit_fixes
Soutient_etat
Tableau II.7 :
80
81
Dsignation
Code_zone
Dtails
Cl artificielle.
Code_commune
Code de la commune.
Nom_commune
Nom de la commune.
Code_agence
Nom_agence
Nom de lagence.
Adresse_agence
Adresse de lagence.
Tel_agence
Tlphone de lagence.
Code_dd
Nom_dd
Adresse_dd
Tel_dd
Code_wilaya
Code de la wilaya.
Nom_wilaya
Nom de la wilaya.
Code_filiale
Adresse_filiale
Tel_filiale
Tableau II.8 :
82
5. Dimension activit
Cette dimension dcrit les diffrents secteurs dactivitss conomiques. Celle-ci est
charge partir dun tableau transmit par le ministre des finances, et trs importante, ds lors
que beaucoup danalyses observes
observe pendant ltude des besoins, se base sur cette dimension.
Dsignation
Code_activit
Dtails
Le code de lactivit.
Libell_activit
Libell de lactivit.
Tableau II.9 :
6. Dimension tarif
Figure II.16
16 : La Dimension Tarif de lactivit Vente .
Souvent, des analyses sont faite
faites par rapport aux tarifs affects au client. Cette
tarification est affecte de manire tudie selon le type du client. En plus du code_tarif ,
cette dimension contient :
Dsignation
Code_tarif
Dtails
Le code tarif qui est appliqu actuellement.
Abreviation_tarif
Description_tarif
Tableau II.10
10 : Tableau descriptif de la dimension Tarif .
83
7. Dimension nergie
Figure II.17
17 : La Dimension nergie de lactivit Vente .
Les filiales de distribution de SONELGAZ livrent plusieurs types dnergie qui
diffrent par un certain nombre de caractristiques.
caractristiques Avoir
voir une segmentation par rapport une
caractristique ou une autre est trs intressant lors dune analyse. Une
ne nergie est dcrite
par les caractristiques suivantes :
Dsignation
Code_energie
Dtails
Code nergie dbit/type
Type_energie
Type de lnergie
Debit
Dbit
Unite_mesure
Tableau II.11
11 : Tableau descriptif de la dimension Energie.
8. Dimension dgnre
dgnr Puissance maximale
Les cls trangres de la table de fait rfrencent les dimensions qui reprsentent le
contexte du fait. Cependant il existe des cls ne rfrenant aucune dimension, ces dernires
sont dites dimensions dgnres.
La dimension puissance maximale
max
est
st dans ce cas un exemple de ce type de
dimension. En effet, celle-ci ne contient aucune description textuelle et elle ne peut tre
assimile aucune autre dimension. Elle est identifie par sa valeur dans la table
ta
des faits et
fournie grce ce dernier la possibilit danalyser les ventes
ventes selon la puissance maximale
demande par le client.
84
d) Les mesurables
Les mesurables qui correspondent lactivit des ventes et qui permettent de mesurer les
performances de cette activit, sont la quantit vendue et le montant de la vente en hors
taxe et les primes fixes .
85
86
f) Les agrgats
Les tables dagrgats amliorent les performances du Data Warehouse, en rduisant le
nombre de lignes que le SGBD manipule afin de rpondre une requte. Cela se fait grce
lagrgation des donnes contenues dans les tables de faits dtailles et qui sont stockes dans
de nouvelles tables de faits.
La construction des agrgats se base sur le modle en toile dtaille, et elle
peut ncessiter:
On peut aussi :
Pour cette phase, on sinspire de la dmarche dcrite par C. Adamson dans son livre
Mastering the Data Warehouse Aggregates, Solution for Star Schema Performance . La
dmarche consiste :
1- Enumrer les agrgats potentiels partir dune toile dtaille : pour dtecter les
agrgats potentiels et choisir ceux implmenter dans le Data Warehouse. Il est
ncessaire de bien dcrire chaque agrgat.
2- Dtecter les agrgats utiles : choisir des agrgats utiles partir des agrgats
potentiels.
3- Construire le modle agrg : enfin on construit le modle agrg tout en prenant en
considration les dimensions drives commune entre les diffrents modles.
87
Dimension
Agrgats potentiels
Mois, trimestre, anne, saison
Type, dbit
Code activit
Tarif
Tourne, agence, commune, DR, wilaya, filiale
Date, cycle, type, relve
Numro, commune, agence, DR, wilaya, filiale, activit,
dbit gaz, dbit lectricit, type
Temps
Energie
Activit
Tarif
Zone
Facture
Client
Nombre
dagrgats
possibles
4
3
1
1
6
4
10
Agrgats utiles
Mois, trimestre, anne, saison
Type, dbit
Code activit
Tarif
Commune, agence, DR, wilaya, filiale
Cycle, type, relve
Ventes mensuelles par cycle par type de relve (agrgation de plus de trois
millions lignes).
II.2
Volet Recouvrement
Vente
Recouvrement
Dimensions
Client
Zone gographique
Temps
Facture
Activit
Nature
Tableau II.14 :
A cette tape il existe quatre dimensions communes. Ces dimensions tant trs
dtailles dans la premire toile, il ny a pas eu ncessit de recourir une mise en
conformit. Cette remarque reste valable pour lensemble du document, ainsi il ny a pas lieu
de dtailler les dimensions communes la prsentation de chaque toile.
89
1. Dimension nature
Dtails
Cl artificielle
Libelle
Operation
Tableau II.15
15 : Tableau descriptif de la dimension Nature .
d) Les mesurables
Le mesurable qui correspond lactivit recouvrement et qui permet de mesurer
les performances de cette activit, est le montant de lopration en toutes
tout taxes
comprises .
90
91
f) Les agrgats
1) Les agrgats potentiels
Dimension
Agrgats potentiels
Temps
Nature
Activit
Zone
Facture
Client
Tableau II.16 :
Nombre
dagrgats
possibles
4
2
1
6
4
10
Agrgats utiles
Mois, trimestre, anne, saison
Code activit
Commune, agence, DR, wilaya, filiale
Cycle, type, relve
Tableau II.17 :
92
II.3
Vente
Recouvrement
Dimension
Client
Zone gographique
Temps
Facture
Activit
Affaire
Type affaire
Phase
Tableau II.18 :
93
1. Dimension affaire
La dimension affaire estt une dimension indispensable pour faire une bonne analyse dans
cette toile. En effet, afin de bien suivre une affaire nous avons besoin du maximum
dinformation la concernant. Cette dimension dcrit donc une affaire qui est identifie par son
numro le numro de laffaire est unique au niveau national et qui est caractrise par son
degr durgence et son initiateur
itiateur.
Dsignation
Numero_affaire
Dtails
Un numro dordre donn par le systme et qui volue
chaque enregistrement.
Degre_urgence
Observation
Initier_par
94
Dtails
Code de laffaire tel quil est connu au sein du groupe.
Intitule_affaire
Code_categorie
Intitule_categorie
Code_ss_categorie
Intitule_ss_categorie
Duree_aproximative
95
3. Dimension phase
Chaque affaire transite, durant son cycle de vie, par un certain nombre de phases. Celles-ci
Ce
ont t normalises et codifiees de manire ce quelles puissent
ssent tre utilises conjointement
par toutes les affaires. La dimension phase reprend donc la codification utilise par le
SGC pour identifier ces phases. Lutilisation dune telle dimension facilite grandement la
comprhension du modle dimensionnel et confrera une certaine aisance dimplmentation
et de gestion de lalimentation de ltoile.
Dtails
Code des phases par lesquelles transitent
nt les affaires.
Intitule_phase
Description_phase
Tableau II.21
21 : Tableau descriptif de la dimension Phase.
d) Les faits mesurs
Cette toile na pas de mesurables a proprement parl. La table de faits
fait dans ce cas est
appele une Table de faits sans faits . Ce genre de table permet de renseigner sur le nombre
et lvolution des affaires dans le temps.
96
97
f) Les agrgats
1) Les agrgats potentiels
Dimension
Agrgats potentiels
Temps
Activit
Zone
Client
Type affaire
Tableau II.22 :
Nombre
dagrgats
possibles
4
1
6
10
2
Dimension
Temps
Activit
Zone
Type affaire
Agrgats utiles
Mois, trimestre, anne, saison
Code activit
Commune, agence, DR, wilaya, filiale
Code catgorie, code sous catgorie
Tableau II.23 :
98
II.4
Vente
Recouvrement
Suivi des
abonns
Dimension
Client
Zone
gographique
Temps
Activit
Type abonn
Suivi des
abonns
Tableau II.24 : Dtection des dimensions communes entre les volets Vente ,
Recouvrement , Suivi des affaires et Suivi des abonns .
99
Dtails
Cl artificielle du type abonn
Type_paiement
Type_ lieu
100
101
f) Les agrgats
1. Les agrgats potentiels
Dimension
Agrgats potentiels
Temps
Type abonn
Activit
Zone
Client
Tableau II.26 :
Nombre
dagrgats
possibles
4
2
1
6
10
Dimension
Temps
Activit
Zone
Type abonn
Agrgats utiles
Mois, trimestre, anne, saison
Code activit
Commune, agence, DR, wilaya, filiale
Lieu, paiement
Tableau II.27 : Tableau descriptif des agrgats utiles du modle suivi abonns .
On va arrter la liste des agrgats suivants :
102
III.
Conclusion
103
104
I.
Introduction
LETL, ou lalimentation du Data Warehouse, est une tape des plus importantes dans
un projet Data Warehouse, elle reprsente 80% de la charge de travail. Cette tape a pour
objectif dassurer lacheminement des donnes des systmes sources jusqu lentrept de
donnes, en passant par les diffrentes phases de nettoyage et de transformations ncessaires.
La conception du processus dalimentation ncessite les tapes suivantes :
Etude et planification,
Choix de larchitecture,
II.
Etude et planification :
Cette phase reprsente une phase prliminaire lensemble du processus. Elle consiste
en :
II.1
105
Dresser un tableau14 qui tabli le lien entre donnes sources et donne cibles avec
les transformations ncessaires,
Cette tape sachve par llaboration dune carte logique entre donnes sources et
donnes cibles15.
Il est important de valider les sources de donnes (donc le tableau cit
prcdemment), afin de vrifier leurs intgrits et leurs fiabilits.
Ltoile qui engendrera les chargements les plus importants, en termes de volume,
nest autre que ltoile des ventes. En effet, le systme de facturation, tablit annuellement
plus de six millions de factures, ce qui reprsente plus de dix millions de lignes de faits
ventes . Ce processus sexcute de faon journalire (soixante-dix mille lieux de
consommation par jour). Aussi, le module de gestion des affaires (Systme source) prsente
une forte volatilit de ses donnes. Cette volatilit est due au fait que le passage, dune affaire
donne, dune phase une autre, ne laisse aucune trace sur la base de donnes oprationnelle.
14
15
De ce fait, lidal est de procder des chargements journaliers, pendant les heures de
non activit des systmes sources, c'est--dire, durant la priode qui stend entre dix-huit
heures et huit heures du matin.
Pourquoi pas des chargements hebdomadaires
Mme si pendant les week-ends le nombre dheures de non activit des systmes est
plus important, la quantit de donnes charger sera, elle, plus consquente, et affectera les
performances du processus de chargement. Par ailleurs, la volatilit de certaines donnes
nous contraint appliquer une telle politique de chargement
III.
Limpossibilit daccs distant aux systmes source : lentreprise nautorise pas des
accs distants aux systmes sources. Laccs se fera par le biais dune base de
donnes intermdiaire. Cette restriction est due la structure organisationnelle de
lentreprise16.
Les problmes du rseau actuel17 : le rseau actuel subi des perturbations au niveau
de quelques directions de distribution. Ces dernires ne sont pas encore quipes de
connexion ADSL18.
Le nombre important des sources de donnes et la quantit des donnes : Cette
politique (push-pull) permettra le lancement de chargements parallles.
Lexistence de serveurs au niveau sources : les cinquante-huit directions de
distribution disposent de matriel informatique important, permettant de lancer des
processus de prparation de donnes au niveau des DD .
Maintenance facile: mme si les sites sont parpills, la tche dune ventuelle
maintenance sera facilite par le biais des quipes informatiques en place.
16
Le dcoupage juridique de lentreprise ne permet pas aux filiales de partager des informations dune faon
directe.
17
Voire annexe F.
18
Plus de quarante D.D sont quipes de connexion ADSL.
107
Dans la zone de prparation Staging area les donnes sont extraites partir des
sources de donnes, transformes et prpares pour le chargement final. Au niveau du
serveur ELIT il est procd laffectation de cls artificielles et quelques
transformations ncessaires avant le chargement final dans la zone dentreposage. Aprs
chaque chargement, une mise jour des Meta Data doit tre faite.
108
IV.
Processus de chargement
109
Deux types de tables dans lentrept de donnes faits, dimensions doivent tre
distingus. Chaque type de table diffre dans les dinformations quil contient, et do donc
ladoption de deux processus de chargement.
La stratgie dextraction adopte consiste comparer des chargements successifs afin de
dtecter les changements. Cette stratgie, tant la plus fiable, est incontournable pour la
capture des changements pour des raisons de non fiabilit des champs date, gnralement non
renseigns. Cette dtection se fait au niveau de la zone de prparation amliorant
sensiblement les performances.
IV.1
110
111
IV.2
Lextraction des faits se fait avec les cls naturelles utilises dans les systmes sources.
Ltape qui prcde le chargement de la table des faits consiste remplacer les cls naturelles
par les cls artificielles. La substitution peut se faire directement par le biais des tables de
dimension, ce qui est correct mais trs lent. Pour cela on utilise des tables de rfrencement.
Le processus de chargement des tables des faits doit garantir lintgrit rfrentielle vis-vis des tables de dimensions.
Le diagramme dactivit suivant illustre le processus de chargement adopt pour une table
de faits :
112
113
IV.3
114
V.
Conclusion
Utiliser des sources, autres que les sources oprationnelles pour donner une valeur
ajoute aux informations,
Offrir une performance optimale grce aux chargements parallles et sparation des
donnes selon lopration de chargement (mise jour ou nouvelle insertion),
Mettre en uvre des solutions secours pour faire face aux problmes rseau,
Mise jour des Meta data, pour la maintenance et lassurance de la qualit de donnes,
115
116
I.
Introduction
Afin de faciliter lanalyse et la navigation dans les donnes, il est important que les
cubes dimensionnels soient bien conues et dfinis de manire claire pour une utilisation
intuitive.
La conception des cubes dimensionnels passe par la dfinition des mesurables, des
dimensions et des hirarchies prsentes au sein des dimensions, ainsi que les diffrents
niveaux de dtails de chaque hirarchie. Le but de la mise en place de ces cubes est doffrir
une reprsentation abstraite d'informations multidimensionnelles des fins danalyse.
Le choix des cubes construire, des mesurables quils contiendront, des dimensions
participantes dans chacun dentre eux et des hirarchies qui constituera chaque dimension
dpend essentiellement des besoins recenss et de lutilisation finale.
II.
La dfinition des diffrentes hirarchies prsente dans une dimension est une tape
cruciale et indispensable pour la conception des cubes. En effet, cest grce ces hirarchies
que lutilisateur pourra naviguer et explorer bon escient les informations offertes par un
cube donn.
Cette tape se droule en deux phases:
Colonne
Niveaux
Hirarchies
dim_activite
code_activite
libele_activite
Niveau_1 : N1
Hierarchy_1 :
N1 ALL
dim_affaire
numero_affaire
observation
degre_urgence
initier_par
commune
wilaya
Niveau_1 : N1
Hierarchy_1 :
N1 ALL
117
dim_client
dim_facture
dim_energie
dim_nature
dim_phase
dim_tarif
code_client
reference_lc
type
Niveau_1 : N1
Hierarchy_1 :
N1 N2 N3 ALL
numero_client
Niveau_2 : N2
Hirarchy_2 :
N1 N3 ALL
Groupe
Niveau_3 : N3
numero_facture
numero_facture_s
gc
date_facture
taux_tva
soutient_etat
conso_moy_enrgi
e_jour
reference_lc
Niveau_1 : N1
type_facture
Niveau_2 : N2
type_releve
Niveau_3 : N3
type_cycle
Niveau_4 : N4
code_energie
type_energie
unite_mesure
Niveau_1 : N1
Hierarchy_1 :
N2 N1 ALL
Debit
Niveau_2: N2
Hierarchy_2 :
N2 N1
code_nature
lib_nature
Niveau_1 : N1
operation
Niveau_2 : N2
code_phase
intitule_phase
desc_phase
durree_estimee_p
hase
Niveau_1 : N1
code_tarif
description_tarif
abreviation_tarif
Niveau_1 : N1
Energie
Niveau_2 : N2
N1
Hierarchy_1 :
N2 N3 N4
ALL
N1
Hierarchy_2 :
N2 N4 N3
ALL
Hierarchy_1 :
N2 N1 ALL
Hierarchy_1 :
N1 ALL
Hierarchy_1 :
N1 N2 ALL
118
dim_temps
dim_type_abonn
e
dim_type_affair
e
code_temps
date
jour_du_mois
jours
evenement
Niveau_1 : N1
semaine_dans_ann
ee
Niveau_2 : N2
mois_annee
annee_mois
mois
Niveau_3 : N3
annee_trimestre
trimestre
Niveau_4 : N4
Saison
Niveau_5 : N5
Annee
Niveau_6 : N6
code_type_abonne
e
Niveau_1 : N1
type_client_domic
iliation
Niveau_2 : N2
type_client_paiem
ent
Niveau_3 : N3
code_affaire
intitule_affaire
energie_affaire
durree_approxima
tive
Niveau_1 : N1
code_ss_categorie
intitule_ss_categor
ie
Niveau_2 : N2
code_categorie
intitule_categorie
Niveau_3 : N3
N1
Hierarchy_1 :
N2 N3 N4
N5 N6 ALL
N1
Hierarchy_1 :
N2 N3 All
N1
Hierarchy_2 :
N3 N2 All
N1
Hierarchy_1 :
N2 N3 All
119
code_zone
code_commune
commune
Niveau_1 : N1
code_agence
agence
Niveau_2 : N2
code_dr
dr
Niveau_3 : N3
dim_zone
code_wilaya
wilaya
Niveau_4 : N4
code_filiale
filiale
adresse_filiale
tel_filiale
Niveau_5 : N5
N1
Hierarchy_1 :
N2 N3 N4
N5 ALL
Tableau II.28 : Tableau donnant les niveaux et les hirarchies de chaque dimension.
120
III.
Dans ce qui suit nous allons dresser la liste des cubes mettre en place. Pour chaque
cube on donnera les dimensions participantes ainsi que les mesurables prsents dans ces
cubes. Il est signaler aussi que la dimension dim_nature napparaitra nul part dans la
description des cubes. En effet, cette dimension a t remplace par lutilisation de
mesurables dans les cubes concerns. Le tableau suivant donne le dtail de la conception de
ces cubes :
Nom du cube
Les mesurables
Les dimensions
Dim_client
Dim_facture
Suivi de lapport
abonn
1. Chiffre daffaires
2. Nombre de factures
1. Chiffre daffaires
2. Consommation
3. Nombre de consommations
nulles
1. Nombre de raccordements
Dim_energie
Les Hirarchies
de la dimension
Hierarchy_1
Hierarchy_1
Hierarchy_2
Hierarchy_1
Hierarchy_2
Dim_zone
Hierarchy_1
Dim_temps
Hierarchy_1
Dim_tarif
Hierarchy_1
Dim_client
Hierarchy_1
Dim_facture
Hierarchy_1
Dim_energie
Hierarchy_2
Dim_zone
Hierarchy_1
Dim_temps
Hierarchy_1
Dim_tarif
Hierarchy_1
Dim_type_abonn
Hierarchy_1
Hierarchy_2
Dim_zone
Hierarchy_1
Dim_client
Hierarchy_1
Dim_temps
Hierarchy_1
121
Suivi des
rsiliations
Suivi des
recouvrements
Dim_type_abonn
Hierarchy_1
Hierarchy_2
Dim_zone
Hierarchy_1
Dim_client
Hierarchy_1
Dim_temps
Hierarchy_1
Dim_type_abonn
Hierarchy_1
Hierarchy_2
Dim_zone
Hierarchy_1
Dim_client
Hierarchy_1
Dim_temps
Hierarchy_1
Dim_client
Hierarchy_1
Dim_energie
Hierarchy_1
Dim_zone
Hierarchy_1
Dim_temps
Hierarchy_1
dim_type_affaire
Hierarchy_1
dim_phase
Hierarchy_1
dim_affaire
Hierarchy_1
Dim_temps
Hierarchy_1
Dim_client
Hierarchy_1
Dim_facture
Hierarchy_1
Hierarchy_2
Dim_zone
Hierarchy_1
1. Nombre de rsiliations
1. Nombre daffaires
2. Dure
1.
2.
3.
4.
5.
Montant crances
Montant avoir.
Montant factures fraches.
Montant factures impayes.
Montant prcontentieux.
122
IV.
Dim_enrgie
code_energie
type_energie
unite_mesure
debit
<N1>
code_zone
code_commune
commune
code_agence
agence
code_dd
dd
code_wilaya
wilaya
code_filiale
filiale
<N1>
<N2>
<N3>
<N4>
Dim_client
<N5>
code_client
reference_lc
type
numero_client
<N1>
<N2>
Cube_suivi_vente - Dim_client
Cube_suivi_vente - Dim_enrgie
Cube_suivi_vente
chiffre_affaire
nombre_facture
Fait_vente
Cube_suivi_vente - Dim_tarif
Cube_suivi_vente - Dim_facture
Cube_suivi_vente - Dim_temps
Dim_facture
numero_facture
numero_facture_sgc
date_facture
soutient_etat
conso_moy_enrgie_jour
type_facture
type_releve
type_cycle
Hierarchie_1
Hierarchie_2
<N1>
Dim_tarif
Dim_temps
<N2>
<N3>
<N4>
<Default> <h1>
<h2>
code_temps
date
jour_du_mois
jours
evenement
semaine_dans_annee
mois_annee
mois
annee_trimestre
trimestre
saison
annee
<N1>
code_tarif
description_tarif
abreviation_tarif
energie
<N1>
<N2>
123
Dim_zone
code_zone
code_commune
commune
code_agence
agence
code_dd
dd
code_wilaya
wilaya
code_filiale
filiale
<N2>
<N3>
<N4>
<N5>
Dim_client
code_client
reference_lc
type
numero_client
Dim_enrgie
code_energie
type_energie
unite_mesure
debit
<N1>
<N1>
<N1>
<N2>
Cube_suivi_vente_conso - Dim_client
Cube_suivi_vente_conso - Dim_enrgie
Cube_suivi_vente_conso
chiffre_affaire
nombre_facture
nombre_conso_nul
Fait_vente
Cube_suivi_vente_conso - Dim_tarif
Cube_suivi_vente_conso - Dim_facture
Cube_suivi_vente_conso - Dim_temps
Dim_tarif
Dim_facture
numero_facture
numero_facture_sgc
date_facture
soutient_etat
conso_moy_enrgie_jour
type_facture
type_releve
type_cycle
Hierarchie_1
Hierarchie_2
code_tarif
description_tarif
abreviation_tarif
energie
<N1>
Dim_temps
<N2>
<N3>
<N4>
<Default> <h1>
<h2>
code_temps
date
jour_du_mois
jours
evenement
semaine_dans_annee
mois_annee
mois
annee_trimestre
trimestre
saison
annee
<N1>
<N1>
<N2>
<N2>
<N3>
<N4>
<N5>
<N6>
124
Dim_temps
Dim_zone
code_zone
code_commune
commune
code_agence
agence
code_dd
dd
code_wilaya
wilaya
code_filiale
filiale
<N1>
<N2>
Cube_suivi_des_abonnes - Dim_zone
Cube_suivi_des_abonnes - Dim_temps
<N3>
<N4>
<N5>
code_temps
date
jour_du_mois
jours
evenement
semaine_dans_annee
mois_annee
mois
annee_trimestre
trimestre
saison
annee
<N1>
<N2>
<N3>
<N4>
<N5>
<N6>
Dim_client
Dim_type_abonne
code_type_abonnee
<N1>
type_client_domiciliation <N2>
type_client_paiement
<N3>
Hierarchie_1
Cube_suivi_des_abonnes - Dim_client
Cube_suivi_des_abonnes - Dim_type_abonne
code_client
reference_lc
type
numero_client
<N1>
<N2>
<Default> <h>
Dim_temps
Dim_zone
code_zone
code_commune
commune
code_agence
agence
code_dd
dd
code_wilaya
wilaya
code_filiale
filiale
<N1>
<N2>
Cube_suivi_recouvrement - Dim_zone
Cube_suivi_recouvrement - Dim_temps
<N3>
<N4>
<N5>
code_temps
date
jour_du_mois
jours
evenement
semaine_dans_annee
mois_annee
mois
annee_trimestre
trimestre
saison
annee
<N1>
<N2>
<N3>
<N4>
<N5>
<N6>
Dim_facture
numero_facture
numero_facture_sgc
date_facture
soutient_etat
conso_moy_enrgie_jour
type_facture
type_releve
type_cycle
Hierarchie_1
Hierarchie_2
<N1>
Dim_client
<N2>
<N3>
<N4>
Cube_suivi_recouvrement - Dim_facture
code_client
<N1>
reference_lc
type
<N2>
Cube_suivi_recouvrement - Dim_client numero_client
Hierarchie_1 <Default> <h>
<Default> <h1>
<h2>
Dim_zone
code_zone
code_commune
commune
code_agence
agence
code_dd
dd
code_wilaya
wilaya
code_filiale
filiale
Dim_type_affaire
code_affaire
intitule_affaire
durree_approximative
code_ss_categorie
intitule_ss_categorie
code_categorie
intitule_categorie
<N1>
<N1>
<N2>
<N3>
<N4>
<N5>
<N2>
<N3>
Dim_temps
code_temps
date
jour_du_mois
jours
evenement
semaine_dans_annee
mois_annee
mois
annee_trimestre
trimestre
saison
annee
<N1>
<N2>
<N3>
<N4>
<N5>
<N6>
Cube_suivi_affaire - Dim_type_affaire
Cube_suivi_affaire - Dim_temps
Dim_client
Cube_suivi_affaire
nombre_affaire
durre_moyen
Fait_suivi_affaire
code_client
Cube_suivi_affaire - Dim_client
reference_lc
type
numero_client
<N1>
<N2>
Cube_suivi_affaire - Dim_energie
Cube_suivi_affaire - Dim_affaire
Cube_suivi_affaire - Dim_phase
Dim_phase
Dim_affaire
numero_affaire
degre_urgence
initier_par
observation
<N1>
Dim_energie
code_energie
type_energie
unite_mesure
debit
<N1>
code_phase
<N1>
intitule_phase
durree_estimee_phase
desc_phase
Hierarchie_1 <Default> <h>
<N2>
126
V.
Conclusion
Les cubes dimensionnels est une tape trs importante dans tout projet Data Warehouse.
Cest grce cette dernire que lutilisateur pourra utiliser et exploiter au mieux les donnes
contenues dans lentrept de donnes de manire correcte et intuitive.
Dans ce chapitre nous avons essay donc de dfinir les cubes dimensionnels en
explicitant les dimensions participantes dans chacun dentre eux. Ensuite nous avons dfini,
pour chacune des dimensions, les diffrentes hirarchies prsentes ainsi que les niveaux qui
composent ces dernires.
127
Meta Data
128
I.
II.
Les mtas donnes ont un rle trs important dans le cycle de vie dun entrept de
donnes. En effet, elles donnent une description ainsi quun sens aux donnes contenues dans
lentrept, afin que lutilisateur comprenne et puisse utiliser au mieux ces donnes.
Cependant, leur rle peut dpasser le cadre de cette description en se prsentant comme un
moyen de supervision et de suivi de lvolution de lentrept. Le diagramme illustr sur la
figure II.37 montre la conception des mtas donnes.
Ce diagramme reprsente, de manire claire, la structure de lentrept de donnes,
renseignant de ce fait sur sa contenance en donnes. En plus de cela, il offre la possibilit de
superviser les chargements en donnant une vue gnrale sur lalimentation de lentrept de
donnes.
129
III.
III.1
La fonction premire des mtadonnes est doffrir un catalogue complet et dtaill sur
le contenu de lentrept. Ce catalogue est bien sr appel voluer. De ce fait lutilisateur
doit tre en mesure de consulter ce catalogue et dy proposer des mises jour, si cela est
ncessaire. Le diagramme des cas dutilisation suivant illustre ces diffrents volets :
III.2
131
IV.
Conclusion
La couche mta donnes est trs importante dans un projet Data Warehouse, dans la
mesure o elle en permet la maintenance de ce dernier, garantit son intgrit et facilite son
expansion.
Ainsi il est plus que ncessaire de concevoir les mtas donnes et de dvelopper une
couche applicative permettant de les maintenir. Dans ce chapitre nous avons essay de
concevoir un sous systme dadministration de lentrept de donnes qui rpond aux
exigences dun tel projet.
133
Partie III :
Ralisation et dploiement
134
I.
Introduction
II.
Implmentation
II.1
Cette partie dcrit les infrastructures dj en place. En effet, cette dernire est une
tape ne pas ngliger, car la diversit des sources et leurs plateformes techniques pourront
engendrer des problmes de compatibilit.
II.1.1 Matriel
Les systmes sources sont installs sur diffrentes plateformes :
Machine IBM,
Solaris Sparc,
135
Figure III.1
III : Architecture technique de la solution.
II.3
Zone de stockage
19
Voir annexe F.
136
II.4
Permet dajouter du code java afin dimplmenter notre solution telle quelle a t
conue.
II.5
Zone de restitution
Cette zone reprsente linterface entre lutilisateur et le Data Warehouse. Elle est
constitue dun ensemble doutils qui doivent permettre aux utilisateurs dexploiter le
systme mis en place dans les meilleures conditions possibles. . Ainsi plusieurs outils et
serveurs ont t mis en place:
Implmentation des tableaux de bord conus avec loutil Open Slazio pour une
reprsentation graphiques efficace et comprhensible.
Mme si ces outils se prsentent comme des solutions cl en main, ils ncessitent un
travail dintgration et de conception afin de donner une valeur ajoute aux tats
implments.
En plus de la mise en place de ces outils, il tait ncessaire de dvelopper certains
volets:
Navigation dans les Meta data : cela offrira un support aux utilisateurs finaux.
Ces deux modules ont t dvelopps en JavaServer Pages (JSP), qui est lextension
web du langage Java. Le dveloppement sest fait avec la version 6.5 de lIDE NetBeans. Le
choix de ce langage est en rapport avec les points suivants :
138
III.
Dploiement
III.1
139
III.2
140
IV.
Conclusion
La partie de restitution est la partie sur laquelle lutilisateur final aura interagir. Cette
dernire a t mise en place en intgrant des solutions Open Source , et en dveloppant
certains volets de manire assurer une bonne utilisation du systme.
Des programmes ont t dvelopps, au pralable, en JAVA, afin dassurer
lalimentation de la zone de stockage en donnes. Cette dernire a t implmente sous le
SGBD PostgreSQL, dans sa distribution PostgreSQLPLUS .
Le dploiement de la solution se fait suivant les diagrammes de dploiement illustrs
dans la figure III.2 et la figure III.3, et se divise en deux parties :
Le dploiement se fait pour le moment sur trois sites pilotes, et sera tendu
lensemble du territoire des que les rsultats des tests fonctionnels auront t approuvs.
141
142
144
Bibliographie
Ouvrages
[Bouquin, 2003] : Bouquin Henry ; Le contrle de gestion ; P.U.F ; 2003.
[Dresner, 2001] :
[Franco, 1997] :
[Goglin, 1998] :
[Inmon, 2002]:
[Kimball, 2004] :
[Kimball, 2002] :
[Kimball,1996] :
145
Articles et Thses
[Bouzghoub, 2008] :
[Chouder, 2007] :
[Chuck, 1998]
[Codd, 93] :
[Daan, 2007] :
Daan Van Beck, Norman Manley, The ETL product survey 2007, A
passionned International research paper, 2007.
[Favre, 2008] :
[Haciane, 2006] :
[Hugh, 2009] :
[Inmon, 2000]:
[Inmon, 1998]:
[Soler, 2001] :
projet/phasedefinition/gestion-de-projet/planification-suiviprojet/guide-planif-suivi-projet.pdf ;2001.
147