You are on page 1of 3

Trac tlphonique mobile, leaders sociaux et communauts

Vincent Blondel Zbigniew Smoreda

Comment trouver les personnes capables dentraner dautres clients vers lusage dun nouveau service ? Comment extraire et exploiter linformation du graphe de communication ? Cet article montre les mthodes mises en uvre pour analyser les bases de donnes contenant la trace des communications mobiles de Mobistar. Lanalyse indique des pistes futures pour la valorisation des donnes comportementales chez Orange.
Comme on vient de le voir dans larticle prcdent, lide de marketing viral est apparue la n des annes 1940 dans les observations de Lazarsfeld et de Merton. Elle tait extrmement simple : lin uence de certaines personnes de lentourage immdiat du sujet peut tre bien plus importante pour ses prises de position ou ses dcisions dachat que limpact de campagnes politiques ou publicitaires coteuses. Le processus de di usion dune information ou dune innovation se droule souvent en deux temps et passe dabord par des leaders dopinion, avant de toucher les suiveurs. Le marketing viral est construit sur la base de ce constat et vise in uencer ces leaders. Comme ils sont peu nombreux, il revient a priori moins cher de les cibler que de sattaquer tous les clients potentiels. En plus, cela promet dtre plus e cace. Cest partir de ce raisonnement que nous avons construit notre travail en relation troite avec les services de marketing stratgique, a n didenti er des leaders sociaux dans les rseaux de communication mobile de clients de Mobistar en Belgique, sans disposer daucune enqute dopinion ou dusages leur propos1. La traduction oprationnelle de cette ide applique aux bases de comportement de clients du mobile exige toutefois une forte technicit. En e et, face des bases de communication de plusieurs millions de clients, rien nest simple, car chaque traitement demande llaboration dun algorithme adapt. Avant dentrer dans le vif du sujet, deux observations sont ncessaires. Dabord le leader en question nest pas ncessairement la tte dun large groupe. Il ne sagit donc pas de chercher des trend-setters qui, par leur position trs visible, amneraient massivement les autres vers un nouvel usage. Ensuite notre analyse porte sur la di usion dun seul service : le MMS. Il va de soi quun autre service pourrait avoir des leaders di rents. En e et, selon quil sagit du dernier terminal mobile ou dune recette de cuisine chinoise, on va

faire con ance des personnes di rentes. Ceci pos, en analysant le graphe de communications sur le mobile nous disposons dune bonne approximation de la circulation dinformations sur les services de tlcommunication entre les proches. Dans un premier temps, nous exposerons la phase de prparation des donnes, puis nous nous pencherons sur la dtection des leaders sociaux. En n nous prsenterons des extensions possibles de la problmatique de lin uence dans les rseaux de communications la dimension gographique.

Une prparation des donnes raisonnes


Les donnes brutes analyses, les CRA (CompteRendu dAppel) contiennent lensemble des changes tlphoniques observs sur une priode de six mois chez tous les clients belges de loprateur Mobistar. Durant cette priode, on observe les contacts entre les personnes qui entretiennent des relations sociales soutenues, mais aussi les appels ds au hasard, les faux numros, les appels ponctuels vers des correspondants phmres, etc. La recherche des positions din uence dans un rseau ne concerne que les relations relles pour lesquelles des changes dinformation et dopinion peuvent avoir lieu. Il est donc prudent dliminer le bruit des changes avec les numros sans lien personnel avec le client. A cette n, nous cartons immdiatement les relations pour lesquelles moins de trois contacts ont t observs durant les six mois. Ensuite, il faut prendre en compte le fait quune relation interpersonnelle est presque toujours rciproque. Cela veut dire que lon observe trs rarement des appels dans une seule direction : si je tappelle, tu mappeleras aussi. Bien sr, il existe des pratiques o un adolescent beepe ses parents pour tre appel en retour et conomiser ainsi son forfait, mais il est trs rare de ne pas voir une seule communication dans lautre sens, dautant plus si lon prend en compte galement les SMS. En n, la stabilit dans le temps de la relation tlphonique doit aussi tre prise en compte. En e et, des changes nourris mais trs ponctuels et concentrs sur quelque jours, sont souvent lis une relation de service ou un problme quon rgle avec des inconnus. La relation sociale que nous cherchons prendre en compte est dune autre nature, elle doit tre durable. Pour lensemble de ces raisons nous avons appliqu une

5
recherche & dveloppement

rgle qui ne garde pour les analyses nales que les liens visibles dans le tra c au moins durant 4 des 6 mois dobservation et bidirectionnels. Au terme de la prparation des donnes, nous passons de 606 millions dappels sur 6 mois un ensemble de 233 millions appels e ectus. Le graphe de communication comprend alors 3 millions de liens la fois raisonnablement frquents, bidirectionnels et stables sur une priode signi cative.

Une dtection des leaders sociaux qui repose sur une combinaison de critres
Notre ciblage des leaders dans le rseau de communications tlphoniques est ensuite bas sur leur position dans leur entourage immdiat. La d nition dun leader dans un rseau est en e et lie au domaine de lapplication. Pour que la di usion virale soit e ective, il faut davantage que de simples changes entre un innovateur et ses contacts. Comme, en rgle gnrale, on ne communique pas par tlphone avec des inconnus, notre groupe doit adopter le service pour le faire vivre. Du coup, une d nition simple qui consiste dire que le leader est llment central, le mieux connect chaque membre du rseau, ne nous semble pas su sante. On peut en e et tre au centre dun ux dchanges, mais si les personnes avec qui on communique ont peu de liens entre elles, lutilit dun service de communication risque de rester limite. Nous proposons en consquence de prendre en compte dans la d nition de la position centrale la densit des liens qui se tissent dans lentourage du client. Nous avons appel cette variable le degr social : elle fournit linformation sur le nombre des liens entre les correspondants de chaque client et se matrialise par le nombre de triangles dans lesquels est impliqu le client (cf. gure 1, gauche). A partir de cette d nition, les valeurs de degr social peuvent tre rapidement calcules pour tous les clients dans un graphe de communication. Nous identi ons comme leader social un client qui dans son voisinage immdiat, na personne avec un degr social plus lev que le sien (cf. gure 1, droite). Cela reprsente 65 000 individus sur 2,6 millions, soit moins de 3 % des clients analyss. Par la suite, di rents seuils de degr social minimal pour la d nition des leaders ont t tests. Ainsi, si nous rglons le seuil du degr social 3, on trouvera 22 000 leaders, avec un degr social minimal de 5, ils seront 8 000 et si lon monte un degr social minimal de 10, on ne trouvera que 2 000 leaders sociaux parmi tous les clients de Mobistar.

Figure 1. A gauche, un exemple de calcul du degr social du client rouge. Son degr (nombre de clients connects lui) est de 6 (A, B, C, D, E, F) et il y a 3 paires connectes A-B, C-D et D-E, donc son degr social slve 3. A droite, les valeurs de degr social dans un sous-graphe. Un leader social est un client dont le degr social est suprieur celui de ses voisins. Dans cet exemple il y a donc trois leaders sociaux, reprsents en rouge.

Un leader social est la fois central dans son rseau et entour de personnes interconnectes

Notre mthode de dtection de leaders sociaux ayant t utilise dans lanalyse de plusieurs campagnes marketing dOrange, nous invitons le lecteur se rapporter larticle de Quentin DHooghe et Alain Glickman dans ce numro. Dans notre exprimentation, nous nous sommes borns lentourage immdiat du client, en comptant les liens entre ses correspondants directs. A n de limiter la complexit du calcul, nous avons considr que cette mesure nous donnait une approximation su sante, la fois de la centralit de la position du leader dans son rseau et de la densit de liens au sein de son entourage. Des sophistications et complexi cations de cette d nition sont bien sr possibles, mais au prix dun allongement du temps de calcul. Le travail de Christophe Prieur et Alina Stoica prsent dans ce numro propose une possibilit parmi dautres de dveloppement de cette mthode, consistant chercher des signatures particulires dans le rseau de contacts. Cette approche peut en e et nous permettre de cibler di rents types de relations observes dans un graphe tlphonique.

Vers le gomarketing communautaire ?


Une des pistes que nous poursuivons actuellement pour pousser plus loin la r exion sur les modalits din uence dans les rseaux de communication est la prise en compte de la topographie du graphe. En e et, lintrieur dun pays, il existe de nombreux groupes de clients densment connects entre eux qui peuvent in uencer, voire transformer, le processus de di usion de linformation ou des services. Dans le cas belge, les communauts

usages+valeur 36

Novembre 2009

linguistiques sont un bon exemple. Le rsultat visualis la gure 2 montre une partition linguistique travers lintensit de contacts tlphoniques entre les Belges. Les attractions entre les abonns pousent troitement la carte linguistique de la Belgique : les Flamands au nord, les Wallons au sud ont une claire tendance de communiquer avec des personnes de leur rgion.

Figure 2. La force dattraction entre les abonns en Belgique : en bleu les abonns de la rgion amande, en rouge de la rgion wallonne et en vert de la rgion bruxelloise. La proximit des points visualise la force des liens tlphoniques.

A n dapprofondir cette analyse, nous avons appliqu aux donnes de communications tlphoniques un puissant algorithme de recherche des sous-ensembles dans les grands rseaux mis au point lUniversit catholique de Louvain2. Dans la gure 3 nous pouvons observer les interconnections communicationnelles entre les di rents communauts dcouvertes par cette procdure et colories ensuite en fonction de la langue parle par leurs membres. De fait, les oprateurs demandent aux abonns dans quelle langue ils veulent recevoir leur facture (en nerlandais, franais, allemand ou anglais). On distingue une partition majeure du pays travers deux composantes, mais galement un troisime groupe plus htrogne linguistiquement. Ce dernier groupe correspond des habitants de la rgion de Bruxelles, une enclave majoritairement francophone au milieu des terres amandes, o la population noue des liens plus mixtes. La position de la capitale sert de pont entre les deux communauts majoritaires du pays.

Figure 3. La reprsentation des communauts extraites du graphe de communication mobile en Belgique. Plus de deux millions de clients sont reprsents ; la taille de chaque cercle est proportionnelle la taille de la communaut correspondante. Chaque cercle est colori avec une couleur dun spectre stalant du rouge (pour le franais) au vert (pour le nerlandais). Le zoom sur la communaut centrale montre que celle-ci regroupe des sous-communauts dans lesquelles aucune langue nest vritablement dominante.

La probabilit dune relation tlphonique diminue rapidement avec la distance

Derrire la distinction dun ensemble national en plusieurs communauts, nous trouvons galement une division territoriale. En e et, on sait depuis longtemps que les relations sociales se dveloppent sur la base de contacts physiques et sont donc fortement enracines dans le territoire. Malgr lexplosion des tlcommunications, elles restent de fait trs locales. Nous avons pu montrer en utilisant les donnes de Mobistar enrichies par ladresse de la commune de domicile du client, que la probabilit dexistence dune relation tlphonique suivait la loi de gravitation universelle et tait inversement proportionnelle au carr de la distance qui spare les domiciles des clients3.

1- Nous nous bornerons ici une description la moins technique possible. Le lecteur intress par le dveloppement mathmatique de notre raisonnement est invit consulter larticle : Blondel, V.D. Guillaume, J.L. Hendrickx, J. M., Kerchove, C. de, Lambiotte, R. (2008) Local leaders in random networks. Physical Review E, vol. 77, 036114. 2- Blondel, V.D., Guillaume, J.L., Lambiotte, R,. Lefebvre, E. (2008) Fast unfolding of communities in large networks. Journal of Statistical Mechanics, P10008 3- Lambiotte, R., Blondel, V.D., de Kerchove, C., Huens, E., Prieur, C., Smoreda, Z., Van Dooren, P. (2008) Geographical dispersal of mobile communication networks, Physica A: Statistical Mechanics and its Applications, vol.387, 53175325.

Autrement dit, la gographie pse lourdement sur nos sociabilits. Il est en consquence primordial de prendre en compte cette dimension territoriale en mme temps que la gographie sociale des communauts dans lanalyse de processus de di usion et din uence. La di usion de linformation peut en e et se drouler di remment lintrieur de communauts distinctes et localises, ce qui du point de vue des campagnes marketing peut o rir la possibilit de coupler les techniques de marketing viral et de gomarketing. Nous poursuivons actuellement cette piste en analysant les donnes des communications golocalises au Portugal, a n dvaluer la pertinence de lutilisation conjointe de linformation sur la position dans la structure de rseau social et celle sur la position gographique dynamique des correspondants.

7
recherche & dveloppement

You might also like