Ebook194 pages6 hours

Fouille de Données Complexes

Name: Fouille de Données Complexes
ISBN: 9791096289486

By RNTI

Rating: 0 out of 5 stars

()

Read preview

About this ebook

Le présent numéro spécial de la revue RNTI est le prolongement des 11ème et 12\ème éditions de l'atelier fouille de données complexes, organisé par le groupe de travail EGC "Fouille de Données Complexes". Ces ateliers se sont tenus au cours des conférence EGC'2014 à Rennes et EGC'2015 au Luxembourg. Ce numéro contient 5 articles traitant de la complexité des données (flux, volume, images, textes) par la proposition d'approches novatrices de fouille de données pouvant être basées sur les ouvertures technologiques du Big Data ou sur la combinaison originale de modèles de représentation.

Skip carousel

Computers

LanguageFrançais

PublisherRNTI

Release dateJul 28, 2016

ISBN9791096289486

Related to Fouille de Données Complexes

Titles in the series (3)

Skip carousel

Avancées récentes dans le domaine des Architectures Logicielles: articles sélectionnés et étendus de CAL'2015 et MODA'2015
Ebook
Avancées récentes dans le domaine des Architectures Logicielles: articles sélectionnés et étendus de CAL'2015 et MODA'2015
byIsmaël Bouassida Rodriguez
Rating: 0 out of 5 stars
0 ratings
Fouille de Données Complexes
Ebook
Fouille de Données Complexes
byBoD - Books on Demand
Rating: 0 out of 5 stars
0 ratings
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
Ebook
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
byLydia Boudjeloud-Assala
Rating: 5 out of 5 stars
5/5

Related ebooks

Skip carousel

Le Dictionnaire du NEF
Ebook
Le Dictionnaire du NEF
byMarie Lebert
Rating: 1 out of 5 stars
1/5
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2018
Ebook
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2018
byBoD - Books on Demand
Rating: 0 out of 5 stars
0 ratings
Les GENRES DE DOCUMENTS DANS LES ORGANISATIONS: Analyse théorique et pratique
Ebook
Les GENRES DE DOCUMENTS DANS LES ORGANISATIONS: Analyse théorique et pratique
byLouise Gagnon-Arguin
Rating: 0 out of 5 stars
0 ratings
Typologie des dossiers des organisations: Analyse intégrée dans un contexte analogique et numérique
Ebook
Typologie des dossiers des organisations: Analyse intégrée dans un contexte analogique et numérique
byLouise Gagnon-Arguin
Rating: 0 out of 5 stars
0 ratings
Typologie des documents des organisations, 2e édition: De la création à la conservation
Ebook
Typologie des documents des organisations, 2e édition: De la création à la conservation
byLouise Gagnon-Arguin
Rating: 5 out of 5 stars
5/5
Manuel de droit européen de la protection des données à caractère personnel
Ebook
Manuel de droit européen de la protection des données à caractère personnel
byOlivia Tambou
Rating: 0 out of 5 stars
0 ratings
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
Ebook
Extraction et Gestion des Connaissances: Actes de la conférence EGC'2019
byLydia Boudjeloud-Assala
Rating: 5 out of 5 stars
5/5
Analyse et représentation documentaires: Introduction à l'indexation, à la classification et à la condensation des documents
Ebook
Analyse et représentation documentaires: Introduction à l'indexation, à la classification et à la condensation des documents
byMichèle Hudon
Rating: 3 out of 5 stars
3/5
Initiation à l'écosytème Hadoop
Ebook
Initiation à l'écosytème Hadoop
byJuvénal CHOKOGOUE
Rating: 5 out of 5 stars
5/5
Les APPROCHES QUALITATIVES EN GESTION
Ebook
Les APPROCHES QUALITATIVES EN GESTION
byPaul Prévost
Rating: 0 out of 5 stars
0 ratings
L' ESPRIT ENTREPRENEURIAL DES ARTISTES A L'ERE NUMERIQUE: Autoproduction et réseaux de collaboration dans les secteurs culturels au Québec
Ebook
L' ESPRIT ENTREPRENEURIAL DES ARTISTES A L'ERE NUMERIQUE: Autoproduction et réseaux de collaboration dans les secteurs culturels au Québec
byJoëlle Bissonnette
Rating: 0 out of 5 stars
0 ratings
Droit des objets connectés et télécoms
Ebook
Droit des objets connectés et télécoms
byAlain Bensoussan
Rating: 0 out of 5 stars
0 ratings
L'innovation collective: Quand créer avec devient essentiel
Ebook
L'innovation collective: Quand créer avec devient essentiel
byValérie Lehmann
Rating: 0 out of 5 stars
0 ratings
Pratique de l'analyse statistique des données
Ebook
Pratique de l'analyse statistique des données
byRichard Bertrand
Rating: 0 out of 5 stars
0 ratings
Systèmes Écologiques Fermés: Comment les ressources accessibles à la vie peuvent-elles être réutilisées ?
Ebook
Systèmes Écologiques Fermés: Comment les ressources accessibles à la vie peuvent-elles être réutilisées ?
byFouad Sabry
Rating: 0 out of 5 stars
0 ratings
Les racines communicationnelles du Web et des médias sociaux, 2e édition
Ebook
Les racines communicationnelles du Web et des médias sociaux, 2e édition
byFrancine Charest
Rating: 0 out of 5 stars
0 ratings
La fabrique de livres électroniques: Stratégies, idées et instructions opérationnelles pour créer des flux de revenus par la rédaction et la publication d'un livre électronique
Ebook
La fabrique de livres électroniques: Stratégies, idées et instructions opérationnelles pour créer des flux de revenus par la rédaction et la publication d'un livre électronique
byStefano Calicchio
Rating: 0 out of 5 stars
0 ratings
Gérer les rumeurs, ragots et autres bruits: Comment réagir face aux rumeurs
Ebook
Gérer les rumeurs, ragots et autres bruits: Comment réagir face aux rumeurs
byAurore Van de Winkel
Rating: 0 out of 5 stars
0 ratings
Scrivener 3.0 Introduction aux Tutoriels anglais
Ebook
Scrivener 3.0 Introduction aux Tutoriels anglais
byGaelle Kermen
Rating: 0 out of 5 stars
0 ratings
Le management municipal, Tome 2: Les défis de l'intégration locale
Ebook
Le management municipal, Tome 2: Les défis de l'intégration locale
byGérard Divay
Rating: 0 out of 5 stars
0 ratings
La communication de crise à l'ère des médias socionumériques
Ebook
La communication de crise à l'ère des médias socionumériques
byXavier Manga
Rating: 0 out of 5 stars
0 ratings
Introduction au project finance
Ebook
Introduction au project finance
byNimrod Roger Tafotie Youmsi
Rating: 0 out of 5 stars
0 ratings
Les Machines de l'esprit: Humain++, #1
Ebook
Les Machines de l'esprit: Humain++, #1
byDima Zales
Rating: 0 out of 5 stars
0 ratings
Contrats et marchés publics de défense
Ebook
Contrats et marchés publics de défense
byClaudine Chardigny
Rating: 5 out of 5 stars
5/5
Conception des systèmes - Pilotage, informations et risques: Méthode "Maze", une méthode pour sortir du labyrinthe de la complexité
Ebook
Conception des systèmes - Pilotage, informations et risques: Méthode "Maze", une méthode pour sortir du labyrinthe de la complexité
byGuy Trocellier
Rating: 0 out of 5 stars
0 ratings
Agile & Scrum
Ebook
Agile & Scrum
byAjit Singh
Rating: 0 out of 5 stars
0 ratings
La méthode Kanban: Optimiser le flux de travail pour une productivité maximale
Ebook
La méthode Kanban: Optimiser le flux de travail pour une productivité maximale
byPeter Lanore
Rating: 0 out of 5 stars
0 ratings
LES MACROS AVEC GOOGLE SHEETS: Programmer en Javascript
Ebook
LES MACROS AVEC GOOGLE SHEETS: Programmer en Javascript
byRémy Lentzner
Rating: 0 out of 5 stars
0 ratings
Les Héros de la stratégie: L'exécution détermine le succès ! 250 conseils pratiques
Ebook
Les Héros de la stratégie: L'exécution détermine le succès ! 250 conseils pratiques
byJeroen De Flander
Rating: 0 out of 5 stars
0 ratings
Kaizen ? Vous avez dit Kaizen ?
Ebook
Kaizen ? Vous avez dit Kaizen ?
byPierre Charraud
Rating: 0 out of 5 stars
0 ratings

Computers For You

Skip carousel

Revue des incompris revue d'histoire des oubliettes: Le Réveil de l'Horloge de Célestin Louis Maxime Dubuisson aliéniste et poète
Ebook
Revue des incompris revue d'histoire des oubliettes: Le Réveil de l'Horloge de Célestin Louis Maxime Dubuisson aliéniste et poète
byAgnès Bertomeu
Rating: 3 out of 5 stars
3/5
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux
Ebook
Le guide du hacker : le guide simplifié du débutant pour apprendre les bases du hacking avec Kali Linux
byKaj Berrah
Rating: 5 out of 5 stars
5/5
L'analyse fondamentale facile à apprendre: Le guide d'introduction aux techniques et stratégies d'analyse fondamentale pour anticiper les événements qui font bouger les marchés
Ebook
L'analyse fondamentale facile à apprendre: Le guide d'introduction aux techniques et stratégies d'analyse fondamentale pour anticiper les événements qui font bouger les marchés
byStefano Calicchio
Rating: 3 out of 5 stars
3/5
Dans l'esprit des grand investisseurs: Un voyage à la découverte de la psychologie utilisée par les plus grands investisseurs de tous les temps à travers des analyses opérationnell
Ebook
Dans l'esprit des grand investisseurs: Un voyage à la découverte de la psychologie utilisée par les plus grands investisseurs de tous les temps à travers des analyses opérationnell
byStefano Calicchio
Rating: 5 out of 5 stars
5/5
La psychologie du trading facile à apprendre: Comment appliquer les stratégies et les attitudes psychologiques des traders gagnants pour réussir dans le trading.
Ebook
La psychologie du trading facile à apprendre: Comment appliquer les stratégies et les attitudes psychologiques des traders gagnants pour réussir dans le trading.
byStefano Calicchio
Rating: 4 out of 5 stars
4/5
Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter
Ebook
Travailler dans le Big Data - les 6 métiers vers lesquels s'orienter
byJuvénal CHOKOGOUE
Rating: 5 out of 5 stars
5/5
Les Chandeliers Japonaises facile à apprendre: Le guide d'introduction aux voiles japonaises et les stratégies d'analyse technique les plus efficaces
Ebook
Les Chandeliers Japonaises facile à apprendre: Le guide d'introduction aux voiles japonaises et les stratégies d'analyse technique les plus efficaces
byStefano Calicchio
Rating: 4 out of 5 stars
4/5
Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent
Ebook
Le plan marketing en 4 étapes: Stratégies et étapes clés pour créer des plans de marketing qui fonctionnent
byStefano Calicchio
Rating: 0 out of 5 stars
0 ratings
Introduction au Darknet: Darknet 101
Ebook
Introduction au Darknet: Darknet 101
byMartin Hoffer
Rating: 4 out of 5 stars
4/5
Apprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation
Ebook
Apprendre Python rapidement: Le guide du débutant pour apprendre tout ce que vous devez savoir sur Python, même si vous êtes nouveau dans la programmation
byKevin Droz
Rating: 0 out of 5 stars
0 ratings
Le money management facile à apprendre: Comment tirer profit des techniques et stratégies de gestion de l'argent pour améliorer l'activité de trading en ligne
Ebook
Le money management facile à apprendre: Comment tirer profit des techniques et stratégies de gestion de l'argent pour améliorer l'activité de trading en ligne
byStefano Calicchio
Rating: 3 out of 5 stars
3/5
Forex Trading facile à apprendre: Le guide d'introduction au marché des changes et aux stratégies de négociation les plus efficaces dans l'industrie des devises.
Ebook
Forex Trading facile à apprendre: Le guide d'introduction au marché des changes et aux stratégies de négociation les plus efficaces dans l'industrie des devises.
byStefano Calicchio
Rating: 4 out of 5 stars
4/5
L'analyse technique facile à apprendre: Comment construire et interpréter des graphiques d'analyse technique pour améliorer votre activité de trading en ligne.
Ebook
L'analyse technique facile à apprendre: Comment construire et interpréter des graphiques d'analyse technique pour améliorer votre activité de trading en ligne.
byStefano Calicchio
Rating: 4 out of 5 stars
4/5
Stratégie d'Investissement en Crypto-monnaie: Comment Devenir Riche Avec les Crypto-monnaies
Ebook
Stratégie d'Investissement en Crypto-monnaie: Comment Devenir Riche Avec les Crypto-monnaies
bySato Akira
Rating: 4 out of 5 stars
4/5
Le marketing d'affiliation en 4 étapes: Comment gagner de l'argent avec des affiliés en créant des systèmes commerciaux qui fonctionnent
Ebook
Le marketing d'affiliation en 4 étapes: Comment gagner de l'argent avec des affiliés en créant des systèmes commerciaux qui fonctionnent
byStefano Calicchio
Rating: 0 out of 5 stars
0 ratings
Python Offensif : Le guide du débutant pour apprendre les bases du langage Python et créer des outils de hacking.
Ebook
Python Offensif : Le guide du débutant pour apprendre les bases du langage Python et créer des outils de hacking.
byKevin Droz
Rating: 0 out of 5 stars
0 ratings
SEO: Une approche simple: Comment comprendre les bases de l'optimisation pour les moteurs de recherche de manière simple et pratique à travers un parcours de découverte non spécialisé destiné à tous
Ebook
SEO: Une approche simple: Comment comprendre les bases de l'optimisation pour les moteurs de recherche de manière simple et pratique à travers un parcours de découverte non spécialisé destiné à tous
byStefano Calicchio
Rating: 0 out of 5 stars
0 ratings
Pensez et investissez comme Warren Buffett: Le manuel qui révèle l'état d'esprit et les stratégies de réflexion du plus grand investisseur de tous les temps
Ebook
Pensez et investissez comme Warren Buffett: Le manuel qui révèle l'état d'esprit et les stratégies de réflexion du plus grand investisseur de tous les temps
byStefano Calicchio
Rating: 4 out of 5 stars
4/5
Wireshark pour les débutants : Le guide ultime du débutant pour apprendre les bases de l’analyse réseau avec Wireshark.
Ebook
Wireshark pour les débutants : Le guide ultime du débutant pour apprendre les bases de l’analyse réseau avec Wireshark.
byKevin Droz
Rating: 0 out of 5 stars
0 ratings
La communication professionnelle facile à apprendre: Le guide pratique de la communication professionnelle et des meilleures stratégies de communication d'entreprise
Ebook
La communication professionnelle facile à apprendre: Le guide pratique de la communication professionnelle et des meilleures stratégies de communication d'entreprise
byStefano Calicchio
Rating: 5 out of 5 stars
5/5
Kali Linux pour débutant : Le guide ultime du débutant pour apprendre les bases de Kali Linux.
Ebook
Kali Linux pour débutant : Le guide ultime du débutant pour apprendre les bases de Kali Linux.
byKevin Droz
Rating: 5 out of 5 stars
5/5
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
Ebook
Les tableaux croisés dynamiques avec Excel: Pour aller plus loin dans votre utilisation d'Excel
byRémy Lentzner
Rating: 0 out of 5 stars
0 ratings
Réseau Anonyme Tor 101: Une Introduction à la Partie la Plus Privée de l'Internet
Ebook
Réseau Anonyme Tor 101: Une Introduction à la Partie la Plus Privée de l'Internet
bySteven Gates
Rating: 2 out of 5 stars
2/5
Le neuromarketing en 7 réponses
Ebook
Le neuromarketing en 7 réponses
byStefano Calicchio
Rating: 0 out of 5 stars
0 ratings
Maison Intelligente: Conception et réalisation d'une maison intelligente
Ebook
Maison Intelligente: Conception et réalisation d'une maison intelligente
byAlaa Gaied
Rating: 4 out of 5 stars
4/5
La psychologie du travail facile à apprendre: Le guide d'introduction à l'utilisation des connaissances psychologiques dans le domaine du travail et des organisations
Ebook
La psychologie du travail facile à apprendre: Le guide d'introduction à l'utilisation des connaissances psychologiques dans le domaine du travail et des organisations
byStefano Calicchio
Rating: 0 out of 5 stars
0 ratings
Hacking pour débutant Le guide ultime du débutant pour apprendre les bases du hacking avec Kali Linux et comment se protéger des hackers
Ebook
Hacking pour débutant Le guide ultime du débutant pour apprendre les bases du hacking avec Kali Linux et comment se protéger des hackers
byHacking House
Rating: 0 out of 5 stars
0 ratings
L'Apprentissage Automatique En Action: Guide Pour Le Profane, Guide D’apprentissage Progressif Pour Débutants (Apprentissage Automatique)
Ebook
L'Apprentissage Automatique En Action: Guide Pour Le Profane, Guide D’apprentissage Progressif Pour Débutants (Apprentissage Automatique)
byAlan T. Norman
Rating: 0 out of 5 stars
0 ratings
Programmer en Java
Ebook
Programmer en Java
byTroy Dimes
Rating: 5 out of 5 stars
5/5
Créer Son Propre Site Internet Et Son Blog Gratuitement
Ebook
Créer Son Propre Site Internet Et Son Blog Gratuitement
byJason Matthews
Rating: 5 out of 5 stars
5/5

Related podcast episodes

Skip carousel

C'est quoi le job d'un CEO ? avec Franck Denglos le PDG d'Adidas Italie - episode 158: Dans l'épisode d'aujourd'hui j'ai le plaisir de recevoir un invité très spécial, il s'agit de Franck Denglos, le PDG d'Adidas Italie. J'avoue que j'ai été un peu impressionnée quand j'ai vu son nom s'afficher sur mon LinkedIn, et puis fin...
Podcast episode
C'est quoi le job d'un CEO ? avec Franck Denglos le PDG d'Adidas Italie - episode 158: Dans l'épisode d'aujourd'hui j'ai le plaisir de recevoir un invité très spécial, il s'agit de Franck Denglos, le PDG d'Adidas Italie. J'avoue que j'ai été un peu impressionnée quand j'ai vu son nom s'afficher sur mon LinkedIn, et puis fin...
byLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 ratings
0% found this document useful
Organisation personnelle du Manager - Introduction 1: Si tu veux mettre en place un système d'organisation réaliste et adapté à ton management, je te propose une série de 9 mail que j'ai intitulée "Organisé pour le plaisir". C'est par ici pour la recevoir tout de suite : Cela fait...
Podcast episode
Organisation personnelle du Manager - Introduction 1: Si tu veux mettre en place un système d'organisation réaliste et adapté à ton management, je te propose une série de 9 mail que j'ai intitulée "Organisé pour le plaisir". C'est par ici pour la recevoir tout de suite : Cela fait...
byOutils du Manager
0 ratings
0% found this document useful
#1 L'Inbound marketing comme source de croissance - avec Juliette Hervé, Allbound marketing manager chez Spendesk: Tu sais comme c’est fatiguant de prospecter tous les jours et de se faire jeter, parfois sans ménagement ? Pendant longtemps, c’était la seule façon de faire pour trouver de nouveaux clients. Et puis, l’Inbound marketing est arrivé ! L’Inbound, comp...
Podcast episode
#1 L'Inbound marketing comme source de croissance - avec Juliette Hervé, Allbound marketing manager chez Spendesk: Tu sais comme c’est fatiguant de prospecter tous les jours et de se faire jeter, parfois sans ménagement ? Pendant longtemps, c’était la seule façon de faire pour trouver de nouveaux clients. Et puis, l’Inbound marketing est arrivé ! L’Inbound, comp...
byLe café du market' ☕ ton podcast marketing B2B
0 ratings
0% found this document useful
150. Les 7 tendances réseaux sociaux en 2022: Quelles sont les grandes tendances réseaux sociaux, marketing et communication pour cette année 2022 qui débute ? Quelles sont les nouveautés à ne pas ignorer, les bonnes pratiques à instaurer, les technologies à découvrir ? Dans cet épisode de podcast...
Podcast episode
150. Les 7 tendances réseaux sociaux en 2022: Quelles sont les grandes tendances réseaux sociaux, marketing et communication pour cette année 2022 qui débute ? Quelles sont les nouveautés à ne pas ignorer, les bonnes pratiques à instaurer, les technologies à découvrir ? Dans cet épisode de podcast...
byJ'peux Pas J'ai Business par TheBBoost
0 ratings
0% found this document useful
201. Comment utiliser le Design Thinking pour augmenter ses conversions ? Avec Marine Aubaret: "Il suffit de 5 utilisateurs pour régler 85% des problèmes". Marine Aubaret est spécialisée dans l’optimisation de la productivité. Dans cet épisode exclusif, elle nous livre les 5 étapes pour améliorer notre taux de conversion, en utilisant le pouvo...
Podcast episode
201. Comment utiliser le Design Thinking pour augmenter ses conversions ? Avec Marine Aubaret: "Il suffit de 5 utilisateurs pour régler 85% des problèmes". Marine Aubaret est spécialisée dans l’optimisation de la productivité. Dans cet épisode exclusif, elle nous livre les 5 étapes pour améliorer notre taux de conversion, en utilisant le pouvo...
byMarketing Square : Les secrets Growth Marketing ⚡️
0 ratings
0% found this document useful
471 - Comment un objectif peut-il nous rendre misérable ?
Podcast episode
471 - Comment un objectif peut-il nous rendre misérable ?
byOptimise ta vie (Le MorningNote Show)
0 ratings
0% found this document useful
Les pubs facebook qui marchent avec Danilo Duchesnes - Episode 138: Quand je pense publicité facebook, je pense immédiatement à l'ad manager. J'ai longtemps pensé que la réussite d'une pub résidait dans le paramétrage du facebook ads manager : quelle cible, à quel moment, sur quels formats, avec...
Podcast episode
Les pubs facebook qui marchent avec Danilo Duchesnes - Episode 138: Quand je pense publicité facebook, je pense immédiatement à l'ad manager. J'ai longtemps pensé que la réussite d'une pub résidait dans le paramétrage du facebook ads manager : quelle cible, à quel moment, sur quels formats, avec...
byLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 ratings
0% found this document useful
Comment développer ses soft skills ? avec Solenne Boquillon le Gouaziou - Episode 163: Curiosité, autonomie, capacité d'écoute, communication orale, respect, adaptabilité, confiance, sens des responsabilité, intégrité, ouverture à la nouveauté, etc. Les soft skills sont de plus en plus plébiscitées, parce que sans soft skills les hard skills ne va...
Podcast episode
Comment développer ses soft skills ? avec Solenne Boquillon le Gouaziou - Episode 163: Curiosité, autonomie, capacité d'écoute, communication orale, respect, adaptabilité, confiance, sens des responsabilité, intégrité, ouverture à la nouveauté, etc. Les soft skills sont de plus en plus plébiscitées, parce que sans soft skills les hard skills ne va...
byLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
100%
100% found this document useful
Blockchain et le Bitcoin : vous allez tout comprendre (#06): Qu'est-ce que la blockchain ? Comment ça marche ? Quels liens avec le Bitcoin ? Réponse d'un expert. Inventée en 2008 par le mystérieux Satochi Nakamoto (https://fr.wikipedia.org/wiki/Satoshi_Nakamoto), la blockchain (chaîne de blocs) est un procédé d'...
Podcast episode
Blockchain et le Bitcoin : vous allez tout comprendre (#06): Qu'est-ce que la blockchain ? Comment ça marche ? Quels liens avec le Bitcoin ? Réponse d'un expert. Inventée en 2008 par le mystérieux Satochi Nakamoto (https://fr.wikipedia.org/wiki/Satoshi_Nakamoto), la blockchain (chaîne de blocs) est un procédé d'...
byMonde Numérique (Actualité des Technologies)
0 ratings
0% found this document useful
Parler à son audience - Episode 160: Parler à son audience, parler à ses futurs clients c'est la première chose que doit faire toute personne qui veut travailler son marketing. Avant de faire quoi que ce soit, il faut commencer par discuter avec les personnes qui pourraient être ses fu...
Podcast episode
Parler à son audience - Episode 160: Parler à son audience, parler à ses futurs clients c'est la première chose que doit faire toute personne qui veut travailler son marketing. Avant de faire quoi que ce soit, il faut commencer par discuter avec les personnes qui pourraient être ses fu...
byLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 ratings
0% found this document useful
La conduite du changement (1/2): En tant que manager, vous serez souvent chargé de mener le changement dans l'entreprise. C'est d'ailleurs une de vos principales fonctions. En général, le changement est préparé dans les détails par votre direction ou vous même : on...
Podcast episode
La conduite du changement (1/2): En tant que manager, vous serez souvent chargé de mener le changement dans l'entreprise. C'est d'ailleurs une de vos principales fonctions. En général, le changement est préparé dans les détails par votre direction ou vous même : on...
byOutils du Manager
0 ratings
0% found this document useful
#97 - Devenir coach: Notes du podcast: http://sesentirbien.coach/podca…
Podcast episode
#97 - Devenir coach: Notes du podcast: http://sesentirbien.coach/podca…
bySe Sentir Bien
0 ratings
0% found this document useful
Marketing local, comment faire ? - Episode 161: Je vois beaucoup d'entrepreneurs venir vers moi pour me demander quelle stratégie digitale implémenter pour leur business, alors que pour moi ce n'est surtout pas par le digital qu'il devraient commencer mais par le bon vieux marketing local.&nb...
Podcast episode
Marketing local, comment faire ? - Episode 161: Je vois beaucoup d'entrepreneurs venir vers moi pour me demander quelle stratégie digitale implémenter pour leur business, alors que pour moi ce n'est surtout pas par le digital qu'il devraient commencer mais par le bon vieux marketing local.&nb...
byLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 ratings
0% found this document useful
064 – Adopter une approche sélective pour ses placements, avec Karl Toussaint du Wast
Podcast episode
064 – Adopter une approche sélective pour ses placements, avec Karl Toussaint du Wast
byLes Investisseurs 4.0
0 ratings
0% found this document useful
La Gestion de Projet - Partie 4: QUI fait QUOI pour QUAND ? Le "QUAND" en gestion de projet : - pourquoi est-on en retard ? - les tâches sans deadline ... - comment fixer les deadlines ? - la durée maximale d'une tâche - comment "débloquer" un projet ? - réduire...
Podcast episode
La Gestion de Projet - Partie 4: QUI fait QUOI pour QUAND ? Le "QUAND" en gestion de projet : - pourquoi est-on en retard ? - les tâches sans deadline ... - comment fixer les deadlines ? - la durée maximale d'une tâche - comment "débloquer" un projet ? - réduire...
byOutils du Manager
0 ratings
0% found this document useful
Les ateliers à la parentalité
Podcast episode
Les ateliers à la parentalité
byLa Matrescence
100%
100% found this document useful
Comment développer son leadership ? | #Leçon135
Podcast episode
Comment développer son leadership ? | #Leçon135
byLe Podcast de Pauline Laigneau
0 ratings
0% found this document useful
La rentrée du manager - Partie 5: Préparer les objectifs et le planing du dernier quadrimestre
Podcast episode
La rentrée du manager - Partie 5: Préparer les objectifs et le planing du dernier quadrimestre
byOutils du Manager
0 ratings
0% found this document useful
La rentrée du manager - Partie 4: La prise de note en 1 à 1
Podcast episode
La rentrée du manager - Partie 4: La prise de note en 1 à 1
byOutils du Manager
0 ratings
0% found this document useful
(? Replay) #048 - Investir en bourse efficacement, avec Nicolas Chéron
Podcast episode
(? Replay) #048 - Investir en bourse efficacement, avec Nicolas Chéron
byLes Investisseurs 4.0
0 ratings
0% found this document useful
#74 - Moussa Camara (Les Déterminés) : La détermination, la clé pour entreprendre: Pour ce 74ème épisode, je reçois Moussa Camara, le président et fondateur de l'association "Les Déterminés" qui aide à développer l'initiative et l'entrepreneuriat en banlieue et dans les milieux ruraux.
Podcast episode
#74 - Moussa Camara (Les Déterminés) : La détermination, la clé pour entreprendre: Pour ce 74ème épisode, je reçois Moussa Camara, le président et fondateur de l'association "Les Déterminés" qui aide à développer l'initiative et l'entrepreneuriat en banlieue et dans les milieux ruraux.
bySerial Entrepreneurs
0 ratings
0% found this document useful
Danser pour préserver sa mémoire ?: L’activité physique est un élément qui semble assez important pour la préservation des fonctions cognitives au cours du vieillissement. Mais passé un certain âge, trouver la motivation nécessaire à la pratique d’une activité physique n’est pas toujours évident. Des chercheuses et chercheurs essentiellement étatsuniens se sont demandé si le fait de pratiquer une activité physique sous une forme plus ou moins déguisée ne pourrait pas avoir des effets intéressants sur la préservation du fonctionnement du cerveau. Plutôt que de demander à des individus âgés de faire des exercices physiques sans attrait particulier, les scientifiques ont proposés à plus de 160 participants de 55 ans et plus un programme de danse latine sur 4 mois. Si les chercheurs sont partis sur l’idée de proposer un tel programme de danse latine, ce n’était pas réellement pour évaluer l’intérêt que peut avoir ce type de danse sur le maintien des fonctions cognitives, mais bien plus car
Podcast episode
Danser pour préserver sa mémoire ?: L’activité physique est un élément qui semble assez important pour la préservation des fonctions cognitives au cours du vieillissement. Mais passé un certain âge, trouver la motivation nécessaire à la pratique d’une activité physique n’est pas toujours évident. Des chercheuses et chercheurs essentiellement étatsuniens se sont demandé si le fait de pratiquer une activité physique sous une forme plus ou moins déguisée ne pourrait pas avoir des effets intéressants sur la préservation du fonctionnement du cerveau. Plutôt que de demander à des individus âgés de faire des exercices physiques sans attrait particulier, les scientifiques ont proposés à plus de 160 participants de 55 ans et plus un programme de danse latine sur 4 mois. Si les chercheurs sont partis sur l’idée de proposer un tel programme de danse latine, ce n’était pas réellement pour évaluer l’intérêt que peut avoir ce type de danse sur le maintien des fonctions cognitives, mais bien plus car
byChoses à Savoir CERVEAU
0 ratings
0% found this document useful
EP117 : 10 façons d'avoir un impact puissant sur son corps (fertilité, grossesse, postpartum) en lissant sa courbe de glucose - Jessie Inschauspé, biochimiste
Podcast episode
EP117 : 10 façons d'avoir un impact puissant sur son corps (fertilité, grossesse, postpartum) en lissant sa courbe de glucose - Jessie Inschauspé, biochimiste
byLa Matrescence
0 ratings
0% found this document useful
Gugomondo le dinosaure blasé
Podcast episode
Gugomondo le dinosaure blasé
byHistoires pour enfants de la famille M.
0 ratings
0% found this document useful
De Madoff au Loup de Wall de Street, profession escroc: Pour « La Story », le podcast d’actualité des « Echos », Pierrick Fay et Nessim Aït-Kacimi retracent les parcours de traders fous célèbres et autres escrocs de la finance.
Podcast episode
De Madoff au Loup de Wall de Street, profession escroc: Pour « La Story », le podcast d’actualité des « Echos », Pierrick Fay et Nessim Aït-Kacimi retracent les parcours de traders fous célèbres et autres escrocs de la finance.
byLa Story
0 ratings
0% found this document useful
329 - Double ta capacité en travaillant moins avec le Protocol Smart Process: C’est parti pour l’épisode 3 de la série Protocol Smart Process : une série sur la manière de faire travailler ton équipe différemment pour doubler ses capacités, sans investissement et sans travailler davantage. J’ai fait appel à Lorry....
Podcast episode
329 - Double ta capacité en travaillant moins avec le Protocol Smart Process: C’est parti pour l’épisode 3 de la série Protocol Smart Process : une série sur la manière de faire travailler ton équipe différemment pour doubler ses capacités, sans investissement et sans travailler davantage. J’ai fait appel à Lorry....
byOutils du Manager
0 ratings
0% found this document useful
Comment créer une publicité Facebook efficace – Episode 22: Joseph Donyo, consultant et formateur en spécialisé en publicité Facebook nous explique tout ce qu'il y a savoir pour créer une campagne Facebook efficace. L’article Comment créer une publicité Facebook efficace – Episode 22 (https://lepodcastdumarketi...
Podcast episode
Comment créer une publicité Facebook efficace – Episode 22: Joseph Donyo, consultant et formateur en spécialisé en publicité Facebook nous explique tout ce qu'il y a savoir pour créer une campagne Facebook efficace. L’article Comment créer une publicité Facebook efficace – Episode 22 (https://lepodcastdumarketi...
byLe Podcast du Marketing - stratégie digitale, persona, emailing, inbound marketing, webinaire, lead magnet, branding, landing page, copy
0 ratings
0% found this document useful
LCC 259 - Interview Software Heritage avec Roberto Di Cosmo et Charles Sabourdin: Charles Sabourdin et Audrey interviewent Roberto Di Cosmo sur le projet , dont l’objectif est la collecte et la préservation des logiciels en tant que patrimoine culturel. Enregistré le 22 Juin 2021 Téléchargement de l’épisode Interview Ta...
Podcast episode
LCC 259 - Interview Software Heritage avec Roberto Di Cosmo et Charles Sabourdin: Charles Sabourdin et Audrey interviewent Roberto Di Cosmo sur le projet , dont l’objectif est la collecte et la préservation des logiciels en tant que patrimoine culturel. Enregistré le 22 Juin 2021 Téléchargement de l’épisode Interview Ta...
byLes Cast Codeurs Podcast
0 ratings
0% found this document useful
#10 Nuit du code citoyen et la tech au service de l'intérêt général avec Yannick Morel: Dans cet épisode, on est à la Nuit du Code citoye…
Podcast episode
#10 Nuit du code citoyen et la tech au service de l'intérêt général avec Yannick Morel: Dans cet épisode, on est à la Nuit du Code citoye…
byTechologie
0 ratings
0% found this document useful
Séminaire - Matthew Rosseinsky : Digital Routes to Inorganic Materials – A New Pathway for Ion Transport in Solids
Podcast episode
Séminaire - Matthew Rosseinsky : Digital Routes to Inorganic Materials – A New Pathway for Ion Transport in Solids
byChimie du solide et énergie - Jean-Marie Tarascon
0 ratings
0% found this document useful

Skip carousel

Organisez Vos Projets Avec Monday.com
Micro Pratique
Article
Organisez Vos Projets Avec Monday.com
Apr 9, 2021
3 min read
Management : Les Méthodes Qui Marchent
L'Express
Article
Management : Les Méthodes Qui Marchent
Mar 23, 2023
2 min read
Logiciels Gratuits sans Modération
Micro Pratique
Article
Logiciels Gratuits sans Modération
Jan 18, 2022
3 min read
L’inventeur Oublié Du Web
Sept
Article
L’inventeur Oublié Du Web
Jul 1, 2019
65 min read
Huit Acteurs Majeurs De L’économie Lyonnaise
The Good Life
Article
Huit Acteurs Majeurs De L’économie Lyonnaise
Feb 11, 2021
Il serait injuste de prétendre que personne ne l’attendait à ce poste. Certes, à 46 ans, Grégory Doucet était un inconnu avant son élection du 28 juin 2020, mais cela faisait déjà plusieurs années qu’il se préparait à « déloger » Gérard Collomb d’une
12 min read
Comprendre Les De Recherche Moteurs
Micro Pratique
Article
Comprendre Les De Recherche Moteurs
Jan 17, 2021
6 min read
Avantages Et Inconvénients Du Modèle Saas
Micro Pratique
Article
Avantages Et Inconvénients Du Modèle Saas
Jan 18, 2022
La transition du local vers le cloud est un changement majeur dans nos habitudes. Et comme tout changement, il est parfois vécu comme une contrainte. La formule a pourtant de nombreux avantages. Le client bénéficie toujours des dernières versions du
1 min read
Game Over Pour Les Traders ?
Science & Vie
Article
Game Over Pour Les Traders ?
Dec 15, 2021
3 min read
« Le Profit N’est Plus Le Seul Indice Du Succès »
Le Journal du dimanche
Article
« Le Profit N’est Plus Le Seul Indice Du Succès »
Jan 19, 2020
6 min read
Et Si On Retrouvait (enfin) Des Nuits Sereines?
Nous Deux Magazine
Article
Et Si On Retrouvait (enfin) Des Nuits Sereines?
Oct 20, 2020
3 min read
Toyota ROI Du Monde
L'auto-Journal
Article
Toyota ROI Du Monde
Mar 10, 2022
5 min read
Google Chrome: Optimisez L’utilisation De La Mémoire Vive
Micro Pratique
Article
Google Chrome: Optimisez L’utilisation De La Mémoire Vive
Dec 11, 2020
3 min read
Créez Votre Site Internet Avec Webnode
Micro Pratique
Article
Créez Votre Site Internet Avec Webnode
Jan 18, 2022
4 min read
Ludovic Girodon : « Le Problème N° 1 Des Managers, C’est Le Temps »
L'Express
Article
Ludovic Girodon : « Le Problème N° 1 Des Managers, C’est Le Temps »
Feb 9, 2023
5 min read
Akio Naito, Made In Seiko
The Good Life
Article
Akio Naito, Made In Seiko
May 25, 2022
12 min read
Petit Guide Du Télétravail Épanoui
Nous Deux Magazine
Article
Petit Guide Du Télétravail Épanoui
Jan 5, 2021
4 min read
Créez Un Site Web Avec Google Sites
Micro Pratique
Article
Créez Un Site Web Avec Google Sites
Jun 10, 2021
Il existe de nombreux outils de création de sites web mais les outils les plus utilisés comme WordPress nécessite de bonnes connaissances techniques alors que d’autres sont payants. Google a mis en ligne une nouvelle version de son outil de création
7 min read
Créez Votre Site Web Perso (Partie 2)
Micro Pratique
Article
Créez Votre Site Web Perso (Partie 2)
Jun 10, 2020
6 min read
L’IA, L’autre Révolution Du Service Client
L'Express
Article
L’IA, L’autre Révolution Du Service Client
Mar 30, 2023
Intelligence artificielle, automatisation, la progression technologique en la matière a permis, ces dernières années, de rendre l’expérience client plus fluide et agréable, mais ce n’est que le début de la révolution. Dans la dernière étude de Zendes
2 min read
Accompagner La Démarche Qualité Au Pérou, Au Brésil Et Au Rwanda
Le français dans le monde
Article
Accompagner La Démarche Qualité Au Pérou, Au Brésil Et Au Rwanda
Mar 30, 2021
Financées et soutenues par l’Institut français de Paris, les interventions de France Éducation international s’organisent en plusieurs ateliers à distance de deux heures, auxquels participent les référents qualité des établissements du réseau. Orient
1 min read
Université Paris-Saclay, Le MIT À La Française
The Good Life
Article
Université Paris-Saclay, Le MIT À La Française
Apr 26, 2022
5 min read
« Métavers » : L’oeuvre De Dieu, La Part Du Diable
L'Express
Article
« Métavers » : L’oeuvre De Dieu, La Part Du Diable
Sep 1, 2021
5 min read
Gérez Vos Projets En Ligne Avec Bubble Plan
Micro Pratique
Article
Gérez Vos Projets En Ligne Avec Bubble Plan
Aug 12, 2022
4 min read
Pièces Et Billets, Des Espèces En Voie De Disparition ?
Science & Vie Junior
Article
Pièces Et Billets, Des Espèces En Voie De Disparition ?
Oct 14, 2020
4 min read
Tout Comprendre Sur La 5G
Nous Deux Magazine
Article
Tout Comprendre Sur La 5G
Jan 5, 2021
3 min read
Les Temps Modernes : Créer Un Compte
Le Journal du dimanche
Article
Les Temps Modernes : Créer Un Compte
Dec 5, 2021
UNE DES PARTICULARITÉS de l’informatique est de se servir des mots du langage de tous les jours pour désigner autre chose. Un glissement, parfois compréhensible, parfois très arbitraire, ajoute un sens nouveau à un mot ancien. C’est troublant et déso
2 min read
Un Bon Moyen De Booster L’innovation
L'Express
Article
Un Bon Moyen De Booster L’innovation
May 19, 2021
5 min read
Monnaie Numérique : La Nouvelle Donne
L'Express
Article
Monnaie Numérique : La Nouvelle Donne
Jan 5, 2022
Changchun Mu comptetil chaque jour le nombre de nouveaux utilisateurs ? Ce qui est sûr, c’est que ce haut dirigeant de la Banque centrale chinoise surveille comme le lait sur le feu la courbe d’adoption du yuan numérique. Testée depuis un peu plus d’
2 min read
Développement durable CLARINS, L’ENTREPRISE 100 % RSE
Paris Match
Article
Développement durable CLARINS, L’ENTREPRISE 100 % RSE
Oct 29, 2020
2 min read
Vers Un Numérique (un Peu Plus) Responsable
L'Express
Article
Vers Un Numérique (un Peu Plus) Responsable
May 19, 2021
«Nous, utilisateurs du numérique, grâce à nos usages, nous pouvons aussi être acteurs. Deuxième service le plus utilisé au monde sur Internet, le mail n’est pas l’usage le plus impactant, mais il est un vrai moyen de prise de conscience pour passer à
2 min read

Reviews for Fouille de Données Complexes

Rating: 0 out of 5 stars

0 ratings

0 ratings0 reviews

Book preview

Fouille de Données Complexes - RNTI

auteurs

Un système collectif d’utilisation d’un grand ensemble de classifieurs sur le Cloud pour la classification de Big Data

Rabah Mazouzi*, Cyril de Runz**, Herman Akdag*

*LIASD, Université Paris 8, 2 rue de la Liberté - 93526 Saint-Denis cedex

rabah@ai.univ-paris8.fr, akdag@ai.univ-paris8.fr

http://www.ai.univ-paris8.fr/

**CReSTIC, IUT de Reims, Chemin des Rouliers CS30012 51687 REIMS CEDEX 2

cyril.de-runz@univ-reims.fr

http://crestic.univ-reims.fr/

Résumé. Au vu de l’évolution des volumes de données (Big Data) et des problématiques associées (vélocité, variété et véracité), nous proposons dans cet article la conception d’un nouveau système collectif d’utilisation massive d’ensemble de classifieurs pour les Big Data sur le Cloud. Nous combinons les avantages de la labellisation par consensus entre plusieurs décisions de classifieurs distribués sur le Cloud avec l’utilisation du paradigme Map/Reduce pour l’apprentissage des modèles par chacun des classifieurs. Pour cela, nous considérons un réseau de classifieurs déployé sur le Cloud. Par l’intermédiaire des Mappers, nous répartissons les données d’apprentissage sur les différents nœuds (classifieurs) tandis que les Reducers lancent la phase d’apprentissage et retourne le modèle du classifieur ainsi qu’un indicateur de performance à optimiser. Ensuite, pour chaque donnée qui arrive, quel que soit le nœud du réseau sur lequel elle arrive, le nœud labellise la donnée et demande à ces voisins d’en faire tout autant. Ils forment ainsi un ensemble de classifieurs. Enfin, à l’aide d’un vote majoritaire pondéré, le nœud questionné renvoie la décision finale. Ainsi, plus le voisinage est étendu, plus la performance cherchée s’améliore. Cependant, il faut limiter cette extension car sinon nous n’obtenons plus des temps de traitements compatibles avec les Big Data.

1 Introduction

Généralement, les algorithmes de classification utilisent, pour la phase d’apprentissage, des ensembles de données limités en taille et en nature. La problématique de la classification prend une autre dimension avec des données très volumineuses (Big Data), notamment à cause du volume et de la variété des données, ainsi que de la vitesse de réponse du système. Pour pallier aux problèmes liés à la classification des Big Data, le partitionnement des données sur un nombre élevé de classifieurs de nature diverse, constitue, selon nous, une solution idéale.

De nos jours, de nombreuses ressources sont disponibles et mises à disposition dans l’objectif de mettre en place des solutions autrefois très coûteuses et peu accessibles. Ainsi, le développement du Cloud Computing a grandement facilité la construction de systèmes répartis, supportant des solutions distribuées et collaboratives. Ces systèmes ouvrent de nouvelles perspectives pour ce qui est de l’apprentissage automatique et notamment de la classification.

La classification distribuée, ou plus généralement la fouille de données distribuée ou DDM (Distributed Data Mining), ne se limite pas seulement aux faits de réaliser des gains en temps d’exécution, mais ouvre aussi des horizons en matière d’amélioration de la précision de calcul (défi de la véracité), de la scalabilité et de la capacité à traiter des données très volumineuses (Big Data).

De nombreuses recherches montrent que l’approche collective d’un système de classification améliore la qualité des résultats (Dietterich, 2000; Zouari, 2004). Cette approche trouve son implémentation idéale dans l’architecture totalement distribuée, sans entité centrale et sans hiérarchisation (à la manière des réseaux P2P ou un nœud joue à la fois le rôle du client et celui du serveur). Dans cet article, nous essayons de mettre en exergue certains bénéfices de l’utilisation d’une telle approche, notamment pour améliorer la classification de données en précision et en scalabilité.

Plusieurs approches basées Cloud Computing et/ou multi-agents ont récemment été utilisées dans divers domaines, où la mise en place d’une décision collective au sein du système conduit à l’amélioration de la pertinence des résultats globaux. On les trouve notamment dans le cas où le système est naturellement réparti, tel qu’en sécurité des réseaux, où des systèmes de détection d’intrusion distribués sont proposés (Zhou et al., 2010). C’est dans ce contexte que nous plaçons notre démarche.

Nous proposons d’utiliser la distribution des données et des traitements afin de réaliser un gain considérable en temps de calcul et de ressources utilisées. Nous souhaitons ainsi tendre vers le traitement de très grands volumes de données (Big Data). Pour ce faire, nous combinons l’utilisation du Cloud Computing et le paradigme Map/Reduce (Gillick et al., 2006), dont l’objectif est de montrer l’impact de l’utilisation des classifieurs massifs sur la qualité des résultats produits par un système Multi-Classifieurs. Map/Reduce est un patron de conception, ayant connu un grand succès, largement utilisé comme support de mise en œuvre pour la distribution de traitement et de données (Gillick et al., 2006).

L’objectif de cet article, qui est une extension de Mazouzi et al. (2014), est de proposer une spécification fonctionnelle et technique d’un système collectif de classification, qui prend en charge le Big Data et essaie d’en tirer profit afin d’améliorer la performance de la classification. Notre système utilise de manière massive différents classifieurs adaptés aux données à traiter, dans notre cadre des données multivariées et hétérogènes. Ainsi, nous prenons comme premier principe que la variété des Big Data est gérée par les méthodes de classifications exploitées dans notre système.

Nous partons de l’idée que dans le cas de l’apprentissage avec des données distribuées sur plusieurs classifieurs, le modèle sous-jacent de données est réparti sur l’ensemble de ces classifieurs, et de ce fait, le résultat obtenu par la combinaison des prédictions des différents classifieurs est meilleur que ceux de tous les classifieurs pris séparément. Ce travail porte sur la question de la véracité dans les traitements associés aux Big Data et sur la manière d’optimiser un indicateur de celle-ci.

Cependant, l’utilisation massive de classifieurs pose certaines questions : quelle méthode doit-on utiliser pour combiner les résultats ? Quelles techniques peut-on exploiter afin de pallier aux problèmes de temps et de ressource ? Et, surtout, quel est l’impact d’une telle approche sur la précision des résultats ? Dans le but de répondre à ces questions, nous proposons dans cet article une approche exploitant à la fois la dynamique Map/Reduce et le Cloud Computing dans le contexte des Big Data. Les problématiques de la vélocité et de la volumétrie sont traitées lors de la phase d’apprentissage par l’intermédiaire du support Map/Reduce et lors de la phase de décision par celui du Cloud. Nous mettrons en lumière l’intérêt de notre approche à l’aide d’une simulation sur un jeu de données de référence (KDD Cup 1999).

La suite de cet article est organisée comme suit. La section 2 présente des travaux connexes en classification distribuée, et collective de données massives. Ensuite, dans la section 3, nous décrivons notre système de classification distribuée et consensuelle. Puis, nous exposons, dans la section 4, une spécification technique possible de mise en œuvre de notre système et une implémentation de test. Enfin nous proposerons nos conclusions et perspectives.

2 Exemples de travaux connexes

2.1 Classification et Big Data

Pour classifier les Big Data, Suthaharan (2014) a eu recours aux outils mathématiques et statistiques pour effectuer une analyse préliminaire afin de déterminer les caractéristiques (volume, variété et vélocité) des données et les représenter dans un espace 3D défini sur la base de trois nouveaux paramètres : cardinalité, continuité et complexité. En se basant sur cette représentation, les auteurs ont utilisé des modèles d’apprentissage continu (Machine Lifelong Learning) pour s’adapter aux différentes caractéristiques de données en entrée du système. Cependant, leur méthode ne précise pas de topologie claire du réseau et ni ne démontre sa capacité à passer à l’échelle.

Dans une autre approche, Angiulli et Folino (2007) utilisent une version distribuée de l’algorithme du plus proche voisin (PFCNN) pour extraire des sous-ensembles condensés et représentatifs des Big Data pour construire des classifieurs performants, leur travail se focalise plus sur les gains en mémoire et en CPU, mais il ne traite que peu la précision. Or cette problématique est cruciale, car la qualité de l’analyse et de la prise de décision dépend grandement de la qualité de l’information exploitée. La précision est un indicateur important de cette qualité. Augmenter la précision permet d’avoir une information plus fiable et minimise le risque d’erreur. En cela, la précision est un indicateur de véracité dans les Big Data. C’est le principal objectif qui a guidé notre travail.

2.2 Classification distribuée

Nous présentons ici quelques travaux ayant traité le problème de l’apprentissage distribué, que ce soit pour la classification automatique, supervisée ou non supervisée, de données. On s’intéresse principalement à ceux qui visent à améliorer la précision de la classification globale obtenue à partir de multiples classifieurs locaux, entraînés individuellement.

Ping Luo et al. ont proposé, dans Luo et al. (2007), une approche collective pour la classification distribuée de données, dans un système P2P (paire à paire ou peer to peer). Selon leur approche, chaque paire construit ses propres classifieurs, en utilisant des données locales, et en exécutant l’algorithme d’apprentissage Pasting bites. Ensuite, tous les résultats sont combinés, en utilisant la technique du vote majoritaire. Il s’agit d’un protocole de vote distribué, basé sur l’échange de message entre les paires du réseau. Le modèle de distribution proposé dans ce travail, ne peut être envisagé dans le cas d’un réseau large échelle, étant donné que dans ce genre de réseau, le vote majoritaire de toutes les paires ne peut pas être envisagé.

Une version distribuée de l’algorithme de clustering k-moyennes, dans un environnement P2P a été proposé dans Datta et al. (2009). L’algorithme ne nécessite que l’échange d’information locale. Selon les auteurs, il s’agit du premier algorithme des K-moyennes qui pourrait être appliqué dans le cas d’un réseau large-échelle. Chaque nœud du réseau calcule les centroïdes des clusters, et les échange avec ses voisins. Chaque voisin recalcule ses centroïdes, en utilisant ses données locales, et les centroïdes obtenus de ses voisins. L’algorithme étant asynchrone et les nœuds ne communiquant qu’avec leurs voisins directs, la dynamique globale de décision qui permet l’émergence du clustering final est difficile à appréhender. D’ailleurs, les auteurs exploitent une horloge globale dans le cadre de leur expérimentation et considère le résultat majoritaire après un certain nombre de mises à jour du réseau.

En terme de distribution de données volumineuses d’apprentissage sur un réseau de nœuds, plusieurs approches ont été proposées dans la littérature (Moretti et al., 2008). On distingue quatre méthodes possibles de mise en œuvre de la distribution des données d’apprentissage, et ce en considérant l’emplacement de ces données sur les nœuds du système :

— La méthode Streaming : s’applique au cas de sources de données réparties, où la fonction de partitionnement relie simplement chaque source à un classifieur dans le système via un flux, telle qu’une connexion TCP.

— La méthode Pull : la fonction de partitionnement lit les données d’apprentissage à partir d’un nœud et écrit les partitions sur ce même nœud. Chacun des classifieurs des autres nœuds importe une partition.

— La méthode Push : la fonction de partitionnement lit les données d’un nœud et écrit les partitions directement sur les nœuds distants, où les classifieurs lisent leurs copies en local.

— La méthode Hybride : la fonction de partitionnement choisit un ensemble réduit de nœuds intermédiaires rapides, fiables, et d’une capacité suffisante pour écrire les données partitionnées. Lors de l’exécution, chaque nœud lit sa partition à partir de ces nœuds.

Mais dans le cadre du Big Data, une méthode est particulièrement exploitée du fait de sa forte scalabilité : l’approche Map/Reduce. Cette approche utilise une fonction de mapping qui répartit les données et une valeur sur les différents nœuds reducers. L’algorithme de mapping correspond à une

Enjoying the preview?

Page 1 of 1

Fouille de Données Complexes

About this ebook

Related to Fouille de Données Complexes

Titles in the series (3)

Related ebooks

Computers For You

Related podcast episodes

Related articles

Reviews for Fouille de Données Complexes

What did you think?

Book preview

Fouille de Données Complexes - RNTI

Un système collectif d’utilisation d’un grand ensemble de classifieurs sur le Cloud pour la classification de Big Data

1 Introduction

2 Exemples de travaux connexes

2.1 Classification et Big Data

2.2 Classification distribuée