You are on page 1of 26

Centre de recherche sur les Risques et les Crises

The automatic identification system of maritime accident risk using rule-based reasoning
Bilal IDIRI, Aldo NAPOLI
Mines ParisTech Centre for Research on Risk and Crises

IEEE international conference on System Of Systems Engineering, SOSE2012

Plan
1 Introduction
1 2 3 4

Contexte Les systmes de surveillance maritime Problmatique Etat de lart

2 Proposition
1 2 3

Hypothses & objectifs de recherche Dmarche mthodologique Modlisation de notre approche

3 Application aux risques daccidents maritimes


1
2 3 4

Les bases de donnes


La dcouverte de connaissances Le Spatial OLAP Identification automatique des risques

4 Conclusion et perspectives

Introduction

Contexte
Limportance de lactivit maritime

90% des changes internationaux, 80% du transport dnergie, 50 millions de passagers en mditerranes chaque anne, 1.19 milliard de tpl pour 2009 avec une croissance de 6.7% par rapport 2008 (CNUCED, 2009). Existence despaces internationaux libres, Plusieurs tats ctiers avec leur propre rglementations, Multitudes dacteurs, Multiplicit des risques (lis la scurit et la sret ) on sintresse aux systmes de surveillance maritime

La mer : un environnement complexe


Plusieurs dispositifs de scurit & sret maritime


Organismes en charge de la scurit et de la sret, Rglementations (ENC, paquets lgislatifs Erika I, II, III, etc.) Systmes daide la navigation (NavTrack, Marine GIS, ex-Trem, etc.) Systmes de surveillance maritime (SpatioNav, SIVE, SYTAR, etc.)
4

Introduction > Proposition > Application > Conclusion

Les systmes de surveillance maritime


Dfinition : ils permettent la rcupration et la fusion des informations sur les navires (position, vitesse, etc.) des fins de suivi du trafic maritime sur un dispositif daffichage.
Infrastructure dacquisition de donnes

Dispositif daffichage

Oprateur de surveillance maritime

Source (DenisGouin, 2010)

Les risques maritimes sont toujours aussi important


Plusieurs milliers daccidents par an dans le monde, 54 700 tonnes dhydrocarbures et de substances dangereuses dverses accidentellement en 2009 contre 7500 tonnes en 2008 (Cedre, 2009) 445 actes de piraterie recenss (+8.5% en un an) et 1181 marins pris en otage en 2010 (BMI, 2010),
5

Introduction > Proposition > Application > Conclusion

Problmatique
Les systmes de surveillance maritime sont aujourdhui insuffisamment adapts pour lidentification des risques maritimes.

Pourquoi ?

Nombre important de pistes affiches (capteur AIS : 41 million de position/jour pour 62 milles navires selon la LIoyds), Multiplicit des risques et leur caractre imprvisible, vnements risques pars et parcellaires dans le temps et lespace,
Identification difficile

Introduction > Proposition > Application > Conclusion

Etat de lart (1)


Plusieurs travaux de recherche pour lamlioration de la surveillance maritime (SM) niveau infrastructures dacquisition de donnes et systmes de traitement de linformation.

Niveau systme de traitement dinformations

Amlioration SM

Analyse des risques

Identification automatique des risques

Probabilistes

Statistiques

Simulation numrique
(J. R. W. Merrick et al. 2000), (J. Merrick et al. 2002)

Clustering

Modlisation
(Darpa 2005) (Morel et al. 2008; 2009, 2010, 2011) (Roy 2008; Roy 2010) (Etienne et al. 2010) (Cledo 2010) (Nilsson et al. 2008) (Laere & Nilsson 2009) (Vandecasteele & Napoli, 2012) (IDIRI & Napoli, 2012a) (IDIRI & Napoli, 2012b)

Visualisation

(Amrozowicz 1996) (Maio et al. 1991), (Amrozowicz et al. 1997) (LeBlanc & Rucks (Kuroda et al. 1982) 1996) (Chaze et al., 2012)

(Torun & Dzgn 2006) (Marven et al. 2007)

(Willems et al. 2009; 2011) (Riveiro et al. 2008; Riveiro & Goran Falkman 2009; Riveiro & Gran Falkman 2011) (Gouin et al. 2011; Lavigne & Gouin 2011) (Vatin & Napoli, 2013) !

Introduction > Proposition > Application > Conclusion

Etat de lart (2)


Limites de ces recherches
Analyses des risques Probabilistes
(Amrozowicz 1996) (Amrozowicz et al. 1997) (Kuroda et al. 1982)

Amlioration SM

Identificatio n automatique des risques modlisation des connaissanc es

Statistiques

Simulation numrique

Clustering

Visualisation

Modlisation des connaissances maritimes bases souvent sur le brainstorming (Nilsson et al. 2008) (Roy 2008) et la modlisation mathmatique : Intressantes mais compliques et couteuses,
Rsultats dpendent de lexprience des experts, Connaissances connues auparavant par les experts.

Modlisation des connaissances par fouille de donnes automatique peu explore (Darpa 2005) : Facile et permet la dcouverte de nouvelles connaissances,
Evolutif.

Limite de la dfinition des risques maritimes base sur des comportements de navires (anormal, inhabituel, etc.) et sur des zonage. un comportement anormal ne correspond pas forcement un risque, un comportement normal peut correspondre ou induire un risque.

Introduction > Proposition > Application > Conclusion

Proposition

Hypothses & objectifs de recherche


Il y a un besoin de modlisation et didentification automatique des risques maritimes

Hypothses
Une exploitation de nouvelles donnes doit permettre une meilleure analyse des risques maritimes, Lemploi de nouvelles mthodes de traitement de linformation doit permettre une meilleure identification des risques.

Objectifs
Proposer une nouvelle approche de modlisation des risques maritimes base sur la fouille de donnes, Proposer une identification automatise des risques maritimes, Etendre la dfinition du risque maritime,

Introduction > Proposition > Application > Conclusion

10

Dmarche mthodologique (1)


Problmatique daide la dcision spatio-temporelle : Surveillance de navires voluant sur un espace ouvert, Dcision sur le caractre risqu ou non dun navire. Le data mining pour la modlisation des risques maritimes

Le Spatial data mining permet une exploration automatique des donnes la recherche de connaissances. Dfinition de J Han

Introduction > Proposition > Application > Conclusion

11

Dmarche mthodologique (2)


Le raisonnement automatique pour une identification automatique des risques
J. Roy (Roy 2010) a appliqu le raisonnement automatique pour identifier automatiquement des comportements anormaux de navires.

Le raisonnement automatique simule le raisonnement humaine sur une machine pour dduire de nouvelles connaissances partir des vnements en entre et des connaissances mmorises au pralable.

connaissances

RAPC
Connaissance Modularit Rsolution des problmes Raisonnement Acquisition Cas problme Adaptation de cas

RAPR
Gnration de cas rgle Application de rgles (rapide) dductif Difficile (comment faire pour rsoudre un problme)

Choix du raisonnement base de rgles :


Facile comprendre, Modularit sous forme de rgle, Raisonnement dductif
12

Non dductif Facile (pisode de rsolution dun problme)

Introduction > Proposition > Application > Conclusion

Dmarche mthodologique (3)


Extension de la dfinition des risques maritimes comme une combinaison de trois notions : situation risque ; comportement risque et zone risque.
Zone risque Comport ement risque
Zones haute densit de cas intressants (accident maritime, narcotrafic, etc.)

Comportement de navires dcrivant des situations risques (trajectoire aberrante, perte de vitesse, etc.)

Situation risque

Rencontre de facteurs propices un type de risque (mto, ocano, etc.)

La complmentarit entre ces trois notions permet de maximiser les chances


didentification des risques.

Introduction > Proposition > Application > Conclusion

13

Modlisation de notre approche (1)


Ecran de contrle du trafic maritime Donnes de capteurs Alimentation + donnes additionnelles Historiques des cinmatiques

Raisonnement
A3

A2 A1

Oprateurs/experts

2 Identification automatique des risques

Affichage dalertes

1 Modlisation des connaissances Donnes environnementale

Donnes denqutes accidents

Amlioration
14

Introduction > Proposition > Application > Conclusion

Systme actuel

Modlisation de notre approche (2)


Composante Modlisation des connaissances

1 Modlisation des connaissances

Data mining
Base de faits Gnration

Oprateurs/experts

Connaissances Dans

Base de connaissances

Interface daide la validation/dfi nition de connaissances

Introduction > Proposition > Application > Conclusion

15

Modlisation de notre approche (3)


Composante Identification automatique des risques

2 Identification automatique des risques

Connaissances

Base de connaissances

Moteur de rgles

1. Vrification

Rgles applicables

2. Rsolution de conflits

Rgles slectionnes

3. Excution

Faits

Base de faits

Introduction > Proposition > Application > Conclusion

16

Application aux risques daccidents maritimes

Les bases de donnes utilises


Donnes MAIB :
Historique des accidents/incidents 1991-2009, 14 900 cas, 16 230 navires.

Donnes MERRA :
Historique des vents et des courants marins 1991-2009, Tlchargement rgulier (1fois/jour) pour alimenter les faits.

Donnes AIS :
Historique des donnes depuis ~3 mois, Flux continue des dplacements de navires.

Introduction > Proposition > Application > Conclusion

18

Dcouvertes de connaissances (1)


Les problmes de fouille de donnes Rgles dassociations (Agrawal et al., 1993) : Problme non supervis de data mining qui permet, partir des occurrences dobjets apparaissant frquemment ensemble dans une base de donnes, dextraire des rgles de connaissance du type : si Antcdent alors Consquent . Clustering spatial (Zeitouni, 2006) : Problme non supervis permettant le regroupement automatique des enregistrements (objets) en groupes (clusters) selon une mesure de similarit ou de distance (propre au domaine). Clustering de trajectoires (Lee et al., 2007) : Clustering dont les objets sont des trajectoires et des sous-trajectoires.

Introduction > Proposition > Application > Conclusion

19

Dcouverte de connaissances (2)


Le data mining

Situation risque

Zone risque

Comportement risque

Data mining

Data mining spatial

Data mining spatiotemporel

Donnes de cas (accidents, narcotrafic, piraterie, etc.)

Donnes de dplacement de navires

Donnes environnementales (mto, ocano, )

Donnes spatiales statiques (historiques )

Donnes go-spatiales dynamiques (actualises..)


20

Introduction > Proposition > Application > Conclusion

Application de rgles dassociations


Situations risques (IDIRI & Aldo, 2012) BD accidents/incidents de navires britanniques
14 900 accidents 16 230 navires Annes 1991-2009

Algorithme Apriori
Package Rattle 2.6.4 de R

Rsultats
Rgle de prdiction : {Vessel_Category=Fishcatching/processing}{Incident_Type=Machinery Failure} supp=0.39 ;conf= 0.6 ;lift=1.23. Rgle de ciblage : {Vessel_Category=Fishcatching/processing}{Vessel_Type=Trawler} supp=0.14; conf=0.43 ; Lift=3. Rgle Banale : {Vessel_Category=Passenger}{Pollution_Caused=No} supp=0.15; conf=0.73; lift=1.2.

Introduction > Proposition > Application > Conclusion

21

Application du clustering
Les zones risques
mthodes par densit (DBSCAN, OPTICS, etc.) Identification automatique du nombre de clusters, Cluster avec des formes arbitraires.

Choix de lalgorithme OPTICS (Ankerst et al. 1999) BD accidents de navires britanniques Algorithme OPTICS

Framework Java ELKI 0.4.0

Introduction > Proposition > Application > Conclusion

22

Application du clustering de trajectoires


Les comportements risques

Dcouverte de trajectoires aberrantes (Outlier Trajectory) et plus particulirement les sous-trajectoires (Outling sub-trajectory) qui ne suivent pas la mme tendance que les autres sous-trajectoires

Source (J. Lee, 2008)

Algorithme TRAOD (TRAjectory Outlier Detection) (Lee et al. 2008)

en 2 phase : 1. Partitionnement : compression individuelle des trajectoires en sous-partition (t-partition), 2. Dtection : identifier les sous-trajectoires aberrantes en se basant sur la distance des trajectoires voisines.
Source (J. Lee, 2008)

Introduction > Proposition > Application > Conclusion

23

Identification automatique des risques


Exemple de rgle dassociation
Rule {Location = Coastal waters, Vessel_Category = Fishing/processing, Age_Slice_Of_Vessel = 11 to 18 years} {Incident_Type = Machinery Failure} support = 0.086 confidence = 0.725 lift = 1.47 If there is a fishing vessel, aged 11-18 years, sailing in coastal waters then there is a risk that it will break down.

Measures Interpretation

Ajouter la rgle sous Drools (Drools 5.4.0 Jboss Rules)


Add rules :
Rules Risk of mechanical failure when $s: ship (location= = Coastal waters, ship class ==fishing, age 11, age 18) then check_behaviour ($s.id_ship); end Rules Behaviour: drifting of course when $r: risk (Type==Mechanical failure) course (behaviour==Drifting) then channel[alerts].send(new Alert()); end

Add a fact:
Rule Add Ship Course When then insert (new Course ()); end

Introduction > Proposition > Application > Conclusion

24

Conclusion et perspectives
Bilan Nouvelle approche daide la modlisation des risques maritimes base sur la fouille de donnes, Extension de la dfinition du risque maritime pour maximiser lidentification des risques maritimes, Perspectives Implmenter, moyen terme, le clustering de trajectoires aberrantes et lappliquer aux donnes AIS, concevoir et raliser linterface daide la dfinition/validation des connaissances, tudier les bases de donnes mobiles actualises (mises jour frquentes),

Introduction > Proposition > Application > Conclusion

25

?
Centre de recherche sur les Risques et les Crises

Merci pour votre attention


Bilal IDIRI Doctorant en Informatique Tl. : +33 (0) 4 93 95 75 77 Fax. : +33 (0) 4 93 95 75 81 Ml : bilal.idiri@mines-paristech.fr Page (voir http://perso.crc.mines-paristech.fr/~idiri)

You might also like