You are on page 1of 11

Valrie Peugeot

Le web des donnes laisse-t-il une place au bien commun ?


Le web entre dans une troisime phase de son existence. N tout dabord comme un espace dexposition
dterritorialis, donnant voir des informations, le web est dans un second temps devenu un espace de coproduction, dans lequel tout un chacun est libre de sexprimer, de partager, de commenter, de crer, de penser voix haute. Aujourdhui le web se transforme en un gigantesque rservoir de donnes numriques. C'est sur le web que s'accumulent et se croisent les savoirs de lhumanit savoirs savants et savoirs profanes , mais aussi ses crations, ses imaginaires, ses dialogues, ses motions dessinant ainsi les nouveaux contours de cette socit de la connaissance , en mergence.
UN RUISSELLEMENT DE DONNEES AUX ORIGINES MULTIPLES

Associer web et donnes peut sembler rducteur : comme si tous ces contenus qui font aujourdhui la richesse du web pouvaient tre rduits des entits alignes, ranges, manipulables, des bases de donnes . Comme si nous avions oubli que le web est devenu un lieu dinteractions, de cration de lien social et dchanges. En ralit les deux approches ne sont pas antinomiques, bien au contraire. Parler de web des donnes, cest faire un double constat : dune part, celui de l'existence dune masse en croissance exponentielle dinformations disponibles sur la toile sous des formes multiples ( titre indicatif, on estime que pour grer ces informations, Google est pass de 40 000 serveurs en 2004 1 million en 2007, 2 millions en 2008 et on parle de 10 millions dans un immense nuage de serveurs en 2010 ; Facebook seul mobiliserait 30 000 serveurs en octobre 2009) ; et d'autre part, celui dune difficult corrle exploiter chercher, trouver, croiser ces donnes dans toute leur profondeur et leur richesse. Poser le web des donnes comme objet de rflexion, cest se donner les moyens, techniques et politiques, de continuer lamliorer, le faire gagner en crativit. Autant qu la massification, cette irruption des donnes sur le devant de la scne du web est lie un saut qualitatif : les sources de donnes qui viennent se jeter dans le web sont en train de se diversifier vitesse acclre. Donnes publiques, fournies par les gouvernements, les collectivits locales, etc. ; donnes scientifiques produites par les chercheurs ; donnes autoproduites par les usagers du web euxmmes ; donnes issues des activits du secteur priv ; mtadonnes attaches et qualifiant les documents numriques ; enfin demain donnes gnres par les machines et les objets du monde rel la diversit croise la profusion. Ces donnes numriques nous interpellent politiquement et conomiquement : qui peut les utiliser ? quelles conditions ? Pour quelles finalits ? Qui les contrle ? Comment assurer leur croisement et leur rutilisation, source dinnovation renouvele ?
HISTOIRE DE LINTERNET ET DU WEB : UNE COEXISTENCE CREATIVE ENTRE PROPRIETE PRIVEE ET BIEN COMMUN.

Derrire toutes ces interrogations, un fil rouge : celui de lquilibre entre conomie de bien commun et conomie marchande. Toute la brve et fulgurante histoire de linternet et du web sest construite sur cette coexistence quilibre entre les deux formes dorganisation conomique. Linternet, en tant quinfrastructure qui sous tend le web, tout autant qu'ensemble de protocoles d'interconnexion, est n de la recherche publique. Il en a gard un statut de bien commun grce au principe essentiel de la neutralit du net , principe qui garantit tous, producteurs, crateurs ou utilisateurs, petits ou gros, un

droit quivalent pour emprunter dans les mmes conditions ces autoroutes de linformation comme on les appelait autrefois. Les standards de linternet, notamment le protocole TCP/IP qui en constitue la pierre angulaire, sont galement le fruit partag du travail dune communaut, celle des ingnieurs runis au sein de lIETF1, communaut de bnvoles, dlgus par leurs entreprises ou leurs centres de recherche dans une dmarche transparente. Quant au web lui-mme, en tant que contenant, c'est--dire comme infrastructure applicative, avec toutes les technologies spcifiques qui lui sont associes, il est galement le rsultat dun travail coopratif labor au sein du collectif ouvert, qu'est le W3C2. Ce processus garantit linteroprabilit entre les documents et les changes d'informations. Par ce processus coopratif d'laboration des normes techniques privilgiant l'interoprabilit et l'ouverture, le web et linternet constituent une vritable mutation dans la construction d'un bien commun mondial, et ce faisant, dans la gouvernance politique internationale. Jusquici la construction de rgles supranationales et la mutualisation de ressources taient dabord lapanage des tats nations, par exemple linteroprabilit des tlcommunications, le statut de lAntarctique ou de celui de la haute mer. Dans le monde du numrique des communauts dintrt auto-constitues et autogres, jugeant le rythme des ngociations intertatiques trop lent au regard de celui de linnovation, ont coproduit de la rgulation et du bien commun. Voil pourquoi les deux piliers de lre informationnelle que sont l'IETF et le W3C ne sont pas aujourdhui dans le giron de lUIT (Union internationale des Tlcommunications, structure multilatrale dpendant des Nations Unies) ce dernier aurait d en constituer le berceau naturel, neut t son incapacit structurelle accompagner ces rvolutions. Sur la base des normes ouvertes du web ont ensuite pu fleurir aussi bien des technologies propritaires que des technologies libres, laissant chaque acteur le choix des outils et de leur statut. Bien qu'organis par des communauts autogres, l'internet est pour les acteurs du secteur l'quivalent d'un domaine public, ouvert aussi bien aux initiatives prives et aux rgles conomiques affrentes, qu' l'usage par toute la socit, souvent dans des buts publics (ducation, gouvernement, etc.) ou non lucratifs (contre-pouvoirs associatifs, ONG, expression directe des individus, etc.). L'exprimentation sur le web peut s'appuyer sur des applications propritaires (la base de donnes Access de Microsoft, le serveur IIS, le gestionnaire de contenu DocuShare de Xerox, ou K-Portal utilis dans de nombreuses universits en France, et bien videmment des outils de bureautique comme Microsoft Word ou DreamWeaver) ou sur les logiciels libres (MySQL pour la base de donnes, Apache, le serveur le plus utilis, les gestionnaires de contenus comme SPIP ou Drupal, ou la bureautique libre avec OpenOffice). Mais dans tous les cas, l'infrastructure gnrale reposera sur des normes publiques, non propritaires, exemptes de brevets et finalement sur des applications libres insouponnes par l'utilisateur (la gestion du cur de rseau par le DNS Bind par exemple).
CONTENUS EN LIGNE : LES CREATEURS SE SONT DONNES LES MOYENS DE CHOISIR

Si lon observe maintenant le web du point de vue de ses contenus, c'est--dire de la multitude de documents numriques qui en constitue la richesse, on retrouve la mme coexistence entre contenus privs, c'est--dire soumis aux diffrents droits de proprit intellectuelle et contenus de bien commun. Par dfaut les contenus (photos, films, musique, articles,) placs en ligne par leurs auteurs et/o leurs ayants droit sont protgs par le droit dauteur en Europe, le copyright aux tats-Unis. Mais rien ninterdit aujourdhui ces mmes auteurs de leur assigner un statut juridique qui en facilite la circulation et la rutilisation. Licence Art Libre3, contrats Creative Commons4, licence GFDL5, ces diffrents dispositifs

IETF : Internet Engineering Task Force organise le processus des dbats techniques de normalisation de l'internet et publie les documents correspondant ; http://ietf.org. Son fonctionnement communautaire est dcrit dans The Tao of IETF : A Novice's Guide to the Internet Engineering Task Force ; http://www.ietf.org/tao.html

W3C : World Wide Web Consortium organise le processus de normalisation des technologies du web et publie les recommandations ; http://w3c.org
3

http://artlibre.org/

juridiques apparus dans le courant des annes 2000 insufflent dans le web une dose de bien commun, sans pour autant chercher interdire ou bloquer les contenus privs. L encore, la crativit juridique nest pas ne dune ngociation intergouvernementale mais a t porte par des communauts de crateurs, soucieux de ne pas se laisser enfermer dans un appareil juridique qui n'est adapt ni la ralit des usages, ni leur dsir de voir leurs uvres circuler largement au travers des rseaux. Dans ce cas, lauto-saisine des communauts concernes sexplique par une divergence idologique de fond avec les instances intergouvernementales thoriquement en charge de faire voluer le droit de la proprit intellectuelle (Organisation Mondiale de la Proprit Intellectuelle (OMPI), Organisation Mondiale du Commerce (OMC) au travers des Accords sur les ADPIC). Ces dernires instances ont abandonn depuis longtemps l'objectif initial de coexistence entre bien commun et proprit prive, au profit dun renforcement rcurrent des droits privatifs6.
DONNEES BRUTES ET BIEN COMMUN : RIEN NEST JOUE

A ct de ces contenus relevant des diffrentes formes de droit dauteur, on voit se dvelopper vive allure des contenus qui ne sont pas des uvres originales, de la cration, et ds lors dpendent d'autres formes de protection juridique. Cest ce quon appelle les donnes brutes : statistiques dmographiques, contenus des annuaires, catalogues de magasins, horaires de transports, catalogues de bibliothques, rsultats dtudes pidmiologiques, informations sur le contenu et lorigine dun film ou dun morceau de musique, rsultats d'expriences scientifiques, etc. Toutes ces donnes sont en train de migrer vers le web, constituant de facto et sous nos yeux le web des donnes . En cherchant revisiter notre question de lquilibre entre bien commun et proprit prive, on constate que sous des abords clairs lexistence dun cadre juridique qui rgit les bases de donnes et leurs contenus7 , la question varie considrablement dune catgorie de donnes lautre.
LES DONNEES PUBLIQUES

Les choses semblent a priori simples lorsque lon se penche sur les donnes dorigine publique. Donnes dmographiques, flux migratoires, prlvements obligatoires, statistiques dactivit des juridictions, fonds cartographiques Ces donnes, recueillies dans le cadre de missions de service public, finances par largent public, semblent avoir une vocation naturelle tre publies, diffuses, reproduites, utilises, en un mot, tre libres. La ralit est un peu plus complexe. Sil existe de longue date des obligations de publications pour les administrations, celles-ci se limitaient jusqu peu une publication au Journal officiel ou dans le journal dune collectivit territoriale. Depuis quelques annes est apparu un mouvement de fond, aussi bien en Europe quaux tats-Unis, en faveur dune libration des donnes publiques8. Ce mouvement part de volonts manant des diffrents secteurs de la socit civile. En France, un collectif a

http://fr.creativecommons.org/ http://www.gnu.org/licenses/fdl-1.3.html

Voir dans ce livre les articles de Xuan LI Proprit intellectuelle, normalisation, biens communs et responsabilit des pouvoirs publics , et Gaelle Krikorian Accs la sant ou renforcement des droits de proprit intellectuelle : quelle hirarchie pour les normes internationales qui rgissent nos vies .

En France ; la Loi n 98-536 du 1 juillet 1998 port ant transposition dans le code de la proprit intellectuelle de la directive 96/9/CE du Parlement europen et du Conseil, du 11 mars 1996, concernant la protection juridique des bases de donnes. http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000573438
8

Les enjeux publics, conomiques et citoyens de l'ouverture des donnes : l'exprience britannique , Valrie Peugeot, In : Enjeux politiques du document numrique, Actes de la troisime confrence Document numrique et socit, Aix-en-Provence, 15-16 novembre 2010, sous la direction de velyne Broudoux et Ghislaine Chartron, Ed. ADBS, 2010, p. 277-298

t lanc pour la cration dun groupe de travail pour des donnes ouvertes et mises en commun en janvier 20089. Au Royaume-Uni, cest ds mars 2006 que deux journalistes du Guardian, sous le titre Rendez nous les joyaux de la couronne , appelaient une libration des donnes publiques10. Depuis diffrents collectifs se sont mis en place, dont Mash the state en Grande-Bretagne, qui invite plus particulirement les collectivits locales partager leurs donnes via de simples fils RSS11. Mais cest certainement le cri lanc au cours de la confrence TED de 2009 par Tim Berners-Lee, lun des pres fondateurs du web et dirigeant du W3C, qui a eu le plus de retentissement : Free raw data ! 12 Les gouvernements semblent commencer entendre le message. Aux tats-Unis Barak Obama a demand Vivek Kundra, Chief Information Officer, de prendre le chantier bras le corps. Ceci sest traduit par le lancement en juin 2009 du site data.gov qui rassemble pour lheure prs de 600 bases de donnes produites par les services fdraux aux tats-Unis. Au Royaume-Uni, Tim Berners-Lee sest vu confier en juin dernier une mission quivalente par le gouvernement britannique, dont on attend encore les fruits. Au Danemark, la plate-forme Digitaliser.dk pointe vers toutes les sources de donnes publiques ouvertes. En Finlande, un concours Apps for democracy Finland invite les dveloppeurs prsenter les mashups quils ralisent partir des API et des donnes ouvertes du gouvernement. Ils peuvent galement suggrer le nom d'autres bases de donnes qui mriteraient d'tre rendues accessibles. En France, cest lAgence pour le Patrimoine Immatriel de ltat (lAPIE) qui est cense mettre un place un portail attendu pour 2010, mais dont nul ne sait encore sil contiendra rellement des donnes ouvertes. Pour autant le chemin parcourir pour disposer de donnes publiques vritablement libres et ouvertes reste long : format de donnes htrognes et donc difficiles ou impossibles croiser, donnes incompltes, souvent non mises jour, sites bloqus Le mouvement vers l'ouverture des donnes publiques est certes engag, mais il souligne en creux les rticences de certaines entits publiques, qui ont du mal effectuer la mutation culturelle de la sortie du secret et qui certainement, craignent, en partageant ces informations, de perdre une partie de pouvoir ou de lgitimit.
DERRIERE LES DONNEES SCIENTIFIQUES, LE STATUT DE LA SCIENCE DANS LA SOCIETE

Une seconde grande source de donnes mrite notre attention : les rsultats des travaux des quipes de recherche. Sinscrivant dans un mouvement plus large en faveur de la science ouverte open access13, un grand nombre de chercheurs multiplient les initiatives pour que les rsultats de leurs travaux circulent : revues en libre accs modle conomique alternatif, archives ouvertes et donnes ouvertes constituent les trois piliers de ce mouvement. Au fur et mesure que la pression saccrot sur les organismes de recherche publique pour quils trouvent les moyens de leur autonomie financire, notamment par le biais de dpt de brevets, la rsistance sorganise chez les scientifiques qui considrent que le fruit de leurs travaux doit, par nature, appartenir au bien commun. Ct donnes, cest ds 1995 que le CGDI (Comit sur les Donnes gophysiques et environnementales du Conseil national de la Recherche aux tats-Unis) publie un document sminal intitul de lchange

Des biens publics vers les biens communs : cration dun groupe de travail pour des donnes ouvertes et mises en commun ; http://www.a-brest.net/article3782.html

Give us back our crown jewels , Charles Arthur and Michael Cross, The Guardian, Thursday 9 March 2006 ; http://www.guardian.co.uk/technology/2006/mar/09/education.epublic Mash The State : We are a grassroots campaign to encourage UK government and public sector organisations to make their data available to the general public. http://www.mashthestate.org.uk/
12 11

10

Librez nos donnes brutes , Tim Berners-Lee on the next Web, TED 2009, fvrier 2009. http://www.ted.com/index.php/talks/tim_berners_lee_on_the_next_web.html

13

Voir dans cet ouvrage Connaissance, rseaux et citoyennet : pourquoi le libre accs ? de Jean-Claude Gudon et De l'accs libre la science ouverte de Philippe Aigrain.

complet et ouvert des donnes scientifiques 14 qui constate que les programmes internationaux de recherche sur le changement global et la surveillance environnementale dpendent du principe dun change complet et ouvert des donnes (i.e. les donnes et les informations sont rendues disponibles sans restriction, sur une base non discriminatoire, pour un cot rduit celui des besoins de reproduction et de distribution) et appelle un accs libre des donnes atmosphriques, ocaniques, biosphriques. Depuis on ne compte plus les appels de ce type dans tous les secteurs scientifiques : chimie, recherche gospatiale, recherche sur le gnome Le statut des donnes d'expriences scientifiques a des consquences majeures sur la science ellemme, sur la capacit vrifier la crdibilit des conclusions, et participer la critique collective, tant entre scientifiques que par les populations. Un exemple rcent est offert par la polmique portant sur l'efficacit de l'antiviral Tamiflu mene par le prestigieux journal mdical BMJ (British Medical Journal) en dcembre 2009. Ce mdicament tait donn pour trs efficace, notamment contre les grippes aviaires et A, suite des publications mdicales datant de 2005. Or, des lments suspects provenant du Japon, o il est trs utilis, ont mis en doute ces publications. Un organisme de vrification interne au secteur mdical, le Cochrane Collaboration a ds lors tent d'obtenir du trust pharmaceutique Roche, qui commercialise le Tamiflu, les donnes brutes de ces expriences. Ce qui fut impossible, ou alors des conditions qui auraient interdit toute revue critique. Comment juger ds lors de la fiabilit des informations produites par les entreprises pharmaceutiques ? Ce qui a conduit l'ditrice du BMJ titrer son ditorial: We want raw data, now 15. Dans le mme ordre d'ide, les donnes fournies par Monsanto la Communaut europenne pour faire valider son mas transgnique MON863 ont t rendues publiques, suite plusieurs annes de bataille juridique menes par Greenpeace Allemagne. Ceci a permis au professeur Gilles-ric Sralini et son quipe du CRII-GEN de relever de nombreuses incohrences dans les traitements statistiques suffisamment pour remettre en cause la diffusion de cet OGM.16
DES DONNEES VOLONTAIREMENT AUTOPRODUITES ET PARTAGEES PAR LES UTILISATEURS

Tout comme les scientifiques, les utilisateurs du web sont de plus en plus en plus nombreux vouloir partager des donnes en tout genre, sans limite et sans restriction. Bref vouloir placer leurs donnes en bien commun. Car, en dehors de leurs capacits cratives, les usagers sont de plus en plus dots d'outils d'enregistrement, de golocalisation ou de capteurs, et nombreux sont ceux qui souhaitent partager leurs captures d'information sur des plates-formes collectives. Les raisons en sont aussi nombreuses que les systmes qui hbergent ces donnes. Geste de mmoire ou volont esthtique pour les utilisateurs qui confient les sons de leur quotidien Saveoursounds, plate-forme propose par la BBC ? Cris du vendeur de poissons qui traverse les rues de Luanda, sons dans le terminal de bus de La Paz, sirnes de police la nuit Los Angeles un paysage mondial de nos environnements sonores se tisse, au fil des contributions17. Envie de sortir de la solitude face la maladie, de contribuer des avances scientifiques pour les contributeurs

On the full and open exchange of scientific data, Committee on Geophysical and Environmental Data, National Research Council, Washington, D.C., 1995. http://www.nap.edu/readingroom/books/exch/exch.html
15

14

We want raw data, now, Fiona Godlee, BMJ, 10 Decembre 2009, doi:10.1136/bmj.b5405

MON 863 : un mas OGM autoris impropre la consommation - Mars 2007, communiqu du CRII-GEN ; http://www.criigen.org/index.php?option=com_content&task=view&id=122&Itemid=1 L'article de rfrence de ce travail scientifique : New Analysis of a Rat Feeding Study with a Genetically Modified Maize Reveals Signs of Hepatorenal Toxicity , Gilles-Eric Sralini, Dominique Cellier and Jol Spiroux de Vendomois, Archives of Environmental Contamination and Toxicology, Volume 52, Number 4 / mai 2007, DOI 10.1007/s00244-006-0149-5 ; http://www.springerlink.com/content/02648wu132m07804/
17

16

http://www.bbcworldservice.com/saveoursounds

de PatientsLikeMe18 qui confient en ligne des informations sur leur sant, leurs maladies, leurs volutions, leurs souffrances ? Volont de donner du sens sa passion ou de pallier aux insuffisances des savoirs savants pour les contributeurs de TelaBotanica19, vaste banque de donnes en botanique constitue par les 11 000 botanistes francophones inscrits au rseau ? Volont de donner voir linvisible et volont de rsistance politique pour les contributeurs de Disparitions.eu, qui racontent comment les sans-papiers sont enlevs leur vie, leur ville, leur cole ? Le tmoignage brut, est au point d'quilibre entre le partage de donnes et la construction d'informations. Ce sont videmment souvent des documents (textes, photographies,). Mais la manire dont ils sont inscrits directement par les usagers (UGC User Generated Content) modifie leur statut : notes ouvertes aux croisements (mashups) et l'analyse statistique (moteurs de recherche), ils deviennent des donnes pour la production de synthses ou de veille. Les informations temps rel distilles par Twitter sont un exemple frappant : les catastrophes sont souvent annonces par l'analyse de ce service avant mme que les secours ne soient oprationnels.
UNE OUVERTURE A GEOMETRIE VARIABLE

Pour ces trois premires catgories de donnes dorigine publique, scientifique ou volontairement partages par les utilisateurs , selon les sites dans lesquels ces donnes sont verses, leur degr douverture, et donc la qualit de bien commun, ne seront pas les mmes. Trois variables, technique, juridique et conomique, permettent den valuer la capacit construire du bien commun. Techniquement, il ne suffit pas de placer des donnes en ligne pour quelles soient rutilisables par des tiers. Encore faut-il quelles soient mises disposition dans des formats qui soient facilement rexploitables, si possible des formats non propritaires et qui surtout permettent de croiser diffrentes bases, donc des formats interoprables. Un site comme data.gov livre certes 600 bases de donnes, mais dans des formats htroclites et parfois propritaires. Techniquement toujours, les possibilits dusage ne sont pas les mmes selon que les contenus des bases de donnes sont mis disposition via une API (auquel cas les donnes restent stockes dans la base dorigine) ou en dumps20 ce qui permet de retravailler les donnes avec tous les outils disposition localement (logiciels de calcul, de statistique, de visualisation, etc.). Juridiquement, certaines plates-formes vont accueillir les donnes sans clarifier les droits qui leurs sont attachs. Ce qui peut induire une incomprhension par les dposants sur ce que cela implique en termes dusages par des tiers. Conscient de ce problme et lucide sur le fait que tous les scientifiques ne sont pas des juristes, le chapitre Science commons du mouvement Creative Commons a mis en place un protocole intitul Science Commons Database Protocol 21. Celui-ci, sorte de mcanisme de leve de droits, aide les scientifiques placer leurs donnes dans un rgime libre de droits en tous genres (brevet, droit dauteur, droit sui generis des bases de donnes en Europe), afin de faciliter la rutilisation et linteroprabilit des donnes scientifiques. Deux autres mcanismes, portes par deux groupes diffrents, permettent aux divers producteurs de donnes brutes de placer celles-ci dans le domaine public. LOpen Knowledge Foundation propose ainsi la PPdL (Public Domain Dedication and Licence) qui permet de placer des donnes dans le domaine public22

18

http://www.patientslikeme.com/ Tela Botanica : le rseau de la botanique francophone ; http://www.tela-botanica.org/

19

20

Possibilit de tlchargement de la base dans son intgralit, ou de fractions significatives suivant des requtes. Protocol for Implementing Open Access Data ; http://sciencecommons.org/projects/publishing/open-access-data-protocol/ http://www.opendatacommons.org/licenses/pddl/

21

22

et depuis juin 2009 une licence intitule ODbL (Open Database Licence)23, qui permet de placer des bases de donnes dans un rgime intermdiaire, savoir permettre leur partage, rutilisation, transformation par des tiers, sous trois conditions : mention de la paternit, partage lidentique cest--dire que toute nouvelle base de donnes construite en utilisant la premire doit tre place sous une licence ODbL et le maintien de louverture technique cest--dire le non usage de mesures techniques de protection de type DRM. De son ct, Creative Commons, ressentant le besoin de librer des donnes de tout droit a propos l'option CC024.
L'ENJEU DES LICENCES POUR PROTEGER LES BIENS COMMUNS

Cette clarification juridique devrait avoir entre autres mrites, de rendre irrversible le statut de bien commun indpendamment du devenir du consentement de ceux qui lont accord. Plusieurs communauts productrices de donnes libres ont dans le pass fait les frais de labsence de protection de ce type. L'aventure advenue la base de donnes CDDB (Compact Disc Data Base) en est une illustration trop parfaite. Cette base en ligne contient les informations utiles sur chaque titre des CD du commerce, les mtadonnes (auteur, compositeur, anne, genre). C'est son existence qui permet aux logiciels de lecture ou de numrisation de disque compact (de type iTunes, Winamps ou Xmms) daller immdiatement chercher les mtadonnes du disque qui est en train dtre cout ou rip et de les afficher ou les intgrer dans les enregistrements mp3. Cre en 1993 par Ti Kan, CDDB est passe en version en ligne en 1995. Ds sa cration, les utilisateurs ont pu contribuer nourrir cette base de donnes, dabord en envoyant des mails Ti Kan, puis en ligne en renseignant les morceaux des disques dont ils disposaient. Des milliers damateurs de musique ont ainsi pendant des annes contribu constituer ce formidable bien commun de la musique qutait CDDB, dont laccs tait totalement libre. Vendue en 1998 Escient, rebaptise Gracenote en 2000, son accs devient progressivement soumis des licences de plus en plus restrictives. En 2001, toutes les applications ne disposant pas dune licence pour accder la nouvelle version de CDDB taient bloques. Cen tait fini de ce bien commun de la musique, constitu collectivement par tous les usagers et finalement accapar par une unique entreprise. En 2008, Gracenote tait rachet par Sony, rejoignant le giron des majors. Heureusement, en raction ce dtournement de bien commun, des internautes ont collect au moment du changement le contenu de la version cooprative de CDDB (pr-commerciale) pour constituer Freedb, depuis associe tous les logiciels libres de musique. L'enjeu d'une licence garantissant le maintien du bien commun est apparu ainsi trs clairement. Freedb est sous licence GPL (General Public Licence). Un projet similaire, Musicbrainz25, cr au mme moment en rsistance la privatisation de CDDB, utilisant une formalisation base sur RDF, et qui est en passe de devenir une rfrence plus complte, un wikipdia de la musique enregistre a pour sa part choisi la licence Creative Commons by-nc-sa. Dans les deux cas, le choix d'un partage l'identique est apparu comme la meilleure faon de protger un travail coopratif, un bien commun. Du point de vue conomique, la question de la gratuit de la mise disposition des donnes est bien entendu un critre essentiel. Ainsi en Europe une directive de 2003, transpose en droit franais en 2005, impose dores et dj aux pouvoirs publics de mettre disposition leurs donnes, mais les autorise simultanment en monnayer lusage sous forme de redevance. Cest, entre autres, au nom de ces revenus rels ou supposs (le montant est aujourdhui inconnu ; lAgence du Patrimoine immatriel de ltat, lAPIE, annonce quelle publiera en 2009 une valuation des actifs immatriels li aux bases de donnes26) que les administrations publiques opposent une rsistance la libration des donnes publiques. Inversement, aucune valuation de la richesse conomique induite par le lancement de services et les

23

http://www.opendatacommons.org/licenses/odbl/summary/ http://creativecommons.org/publicdomain/zero/1.0/deed.fr http://musicbrainz.org/

24

25

26

https://www.apiefrance.com/sections/acces_thematique/comptabilisation-des-actifsimmateriels/recensement_du_patri/

usages sur bases de donnes publiques ouvertes na t mene27.


DONNEES PERSONNELLES : LE BIEN COMMUN NE PEUT SE CONSTRUIRE EN SACRIFIANT LA VIE PRIVEE

ct de ces donnes places volontairement en statut de bien commun, les utilisateurs de services web nourrissent au fil de leurs butinages et vagabondages en ligne de nombreuses bases de donnes, proprits des fournisseurs desdits services. Ds linscription, lutilisateur se met parler de lui-mme : nom, pseudo, ge, genre, adresse, religion, statut amoureux Et poursuit en donnant voir ses gots (les vidos quil ou elle a visionnes, les livres achets, les jeux en ligne jous, etc.), ses voyages (par exemple par lapplication MyTravel), ses relations interpersonnelles travers les rseaux sociaux, mais aussi son appartenance des groupes dintrt plus ou moins formels (par exemple, adhsion au groupe de Mdiapart sur Facebook) ou informels (groupe Facebook mais non maman il ny aura pas dalcool cette soire ). Toutes ces informations sont en principe des donnes dordre priv, protges par des directives europennes de 1995, 2002 et 200628. Mais cette protection semble se fragiliser chaque jour un peu plus : nos donnes, des plus anodines aux plus intimes se mettent circuler, passer dun service lautre, tre exploites par diffrents acteurs du web, sans que nous en soyons toujours conscients. Les raisons de cette rosion sont multiples, dont la justification et la lgitimit varient considrablement. La premire cause est chercher du ct du modle conomique du web. La trs large majorit des services accessibles sur le web nappellent pas de contribution montaire de la part des utilisateurs. Pour autant ils ne sont pas gratuits, puisque leur modle conomique repose sur la publicit et que le visiteur paye de son attention, de son acceptation subir de la publicit, le droit dutiliser le service. Alors que le secteur publicitaire est touch de plein fouet par la crise conomique, seul le segment de la publicit en ligne poursuit sa croissance. Condition de son succs : une publicit toujours plus pertinente, plus adapte, plus cible au regard de la personne qui y est confront. Derrire ce ciblage, une seule solution : rassembler le plus dinformations et donc de donnes sur chaque internaute. Do une industrie florissante du datamining, qui vient maintenant puiser des sources indites, comme les donnes de golocalisation rcupres sur nos tlphones mobiles, ou l'usage intensif des cookies intersites dposs par les sites de bannires publicitaires. La seconde raison cet effritement de la protection des donnes personnelles, certainement la plus difficile circonscrire, est lie la transformation indubitable de la relation de nos contemporains aux notions de sphre prive/sphre publique. Alors que Serge Tisseron parle dextime (vs. intime) on constate une volution naturelle des passants du web sexposer, parler deux-mmes, y compris dans ce quils ont de plus intime, en particulier chez les plus jeunes29. cette impudeur sajoute un sentiment

James Boyle, dans une colonne du Financial Times compare cette absence d'valuation une dcision portant sur les mdicaments qui se ferait sans donnes exprimentales. A natural experiment , James Boyle, Financial Times, 22 novembre 2004 ; http://www.ft.com/cms/s/2/4cd4941e-3cab-11d9-bb7b-00000e2511c8.html Il montre par ailleurs l'impact de la libration des donnes en comparant les industries lies la mto aux tats-Unis, o les donnes publiques sont gratuites, et en Europe. Public information wants to be free , James Boyle, Financial Times, 24 fvrier 2005 ; http://www.ft.com/cms/s/2/cd58c216-8663-11d9-8075-00000e2511c8.html Directive 95/46/CE du Parlement europen et du Conseil, du 24 octobre 1995, relative la protection des personnes physiques l'gard du traitement des donnes caractre personnel et la libre circulation de ces donnes ; Directive 2002/58/CE du Parlement europen et du Conseil, du 12 juillet 2002, concernant le traitement des donnes caractre personnel et la protection de la vie prive dans le secteur des communications lectroniques (directive vie prive et communications lectroniques ). Cette dernire a t modifie en 2006 par la directive 2006/24/CE.
29 28

27

Vie prive : le point de vue des petits cons , Jean-Marc Manach, Internet Actu, 4 janvier 2010 ; http://www.internetactu.net/2010/01/04/vie-privee-le-point-de-vue-des-petits-cons/

dinvulnrabilit. Lide d'un msusage de ces donnes, pour des finalits politiques, idologiques, liberticides semblent la plupart dentre nous une inquitude sans bien-fond, voire lgrement paranoaque, ou du moins qui ne concernerait que ceux qui ont quelque chose se reprocher 30, oubliant que les critres de ce qui peut tre reproch varient au gr des gouvernements, des poques, des lois Qui sait par exemple que le gouvernement Bush des tats-Unis dAmrique a demand et obtenu des oprateurs tlcoms les traces des communications tlphoniques (les call logs) de milliers de personnes, au nom de la guerre contre le terrorisme ? La troisime est lie au besoin de simplicit exprim par les utilisateurs eux-mmes. On constate depuis quelques annes un phnomne de fatigue des utilisateurs du web, prouvs par le besoin de remplir des formulaires longs et fastidieux, chaque fois quils veulent dcouvrir un nouveau service web, ou exasprs par limpossibilit demporter avec eux leurs donnes, leurs contenus, lorsquils veulent migrer dun service un autre. En raction cette fatigue, un mouvement a merg au sein de communauts geeks pour promouvoir la portabilit des donnes, c'est--dire la facult pour tout un chacun d'tre rellement matre de ses informations et de pouvoir les transporter et rutiliser ses donnes personnelles dun service web un autre, ou bien dans plusieurs applications. Pour faciliter la circulation et l'change aussi bien de donnes dauthentification (utilises pour se connecter au service) que de rseau social (le carnet dadresse des amis et les interactions entre eux) ou de contenus mis intentionnellement en ligne (photos, cadeaux, commentaires, articles, prsentations), il est ncessaire de disposer de formats ouverts et interoprables. Ces standards ouverts, l'image des microformats ou de RDFa, sont pousss soit par des organismes de normalisation tablis comme lIETF et le W3C, soit par des initiatives ascendantes portes par des communauts de dveloppeurs, comme dataportability.org ou le projet DiSO31. Face ces initiatives, les tnors de lindustrie du web ont eu une double raction : la plupart ont affich publiquement leur soutien ces initiatives, voire en sont devenus membres ; simultanment ils ont organis une contre-offensive travers des standards de fait, appuys sur une logique d'API utilisables par des tiers, mais assurant la conservation des donnes sur le site ayant le premier su capter l'usager. Le domaine qui illustre certainement le mieux cet affrontement entre deux philosophies du web est celui des donnes dauthentification. Une communaut auto-organise a dvelopp OpenID, standard dauthentification, qui permet de senregistrer une fois pour toute chez un tiers de confiance puis dutiliser cet identifiant chaque fois que lon se connecte sur un nouveau service web. Il sagit dun standard ouvert, qui ne dpend daucun acteur en particulier. Officiellement la plupart des grands acteurs soutiennent OpenId. Dans la pratique, il nest pratiquement pas utilis, car dans un mme temps Facebook a pouss son kit dauthentification Facebook Connect qui a ce jour semble devenir le standard de fait et est utilis par la plupart des grands mdias sociaux en ligne : pour vous y connecter, vous autorisez le site tiers aller chez Facebook prendre vos donnes didentit. Pas de mystre derrire ce choix des acteurs : il s'agit de capter une partie des 350 millions dutilisateurs de Facebook en leur simplifiant le passage dun service lautre. Mais en change, c'est Facebook qui continue centraliser les donnes personnelles et qui peut suivre les activits de ses membres mme sur les autres sites. Au final, le paradoxe rgne autour de la portabilit des donnes : ce mouvement, initi par des dveloppeurs cherchant rendre aux utilisateurs le contrle de leurs donnes, permet en ralit

Ce point de vue est d'ailleurs largement promotionn par les responsables des grands sites effectuant du traage des individus, l'image dric Schmidt de Google dclarant : If you have something that you don't want anyone to know, maybe you shouldn't be doing it in the first place. ; http://gawker.com/5419271/google-ceo-secrets-are-for-filthy-people ou encore Marc Zuckerberg, patron de Facebook rpondant une question sur la rcente ouverture au public des profils de Facebook : We view it as our role in the system to constantly be innovating and be updating what our system is to reflect what the current social norms are , sonnant ainsi la fin de l'ide de vie prive pour mieux justifier ses pratiques commerciales ; http://www.readwriteweb.com/archives/facebooks_zuckerberg_says_the_age_of_privacy_is_ov.ph p
31

30

http://diso-project.org/

quelques acteurs majeurs du web de consolider leur hgmonie et de devenir la porte dentre de tous les mdias sociaux. Et ce faisant, de rcolter encore et toujours plus dinformation sur les cyber-faits et gestes des internautes. Enfant grandit bien vite, le web garde dans ses gnes les inspirations libertariennes de bon nombre de ses pres fondateurs. ce titre, lide de librer les donnes semble pose comme un a priori positif, quil sagisse de donnes publiques qui semblent par nature avoir vocation rejoindre le domaine public ou de donnes prives dont les propritaires doivent pouvoir les faire circuler volont. Encore faut-il que cette libration de nos donnes ne soit pas prtexte une rosion de nos liberts individuelles ! Ces tensions entre constitution dun bien commun des donnes et liberts individuelles ne peut qualler en saccroissant quand on assiste lentre sur scne progressive dune cinquime catgorie de donnes : celles produites par les objets, par nos objets.
UNE CATEGORIE EMERGENTE ET MIXTE : LES DONNEES EMISES PAR LES OBJETS

Nos machines, nos objets, les plus usuels, les plus banals, se mettent progressivement sexprimer et converser entre eux via le web. Aujourdhui nos tlphones mobiles envoient toute application qui le demande (et que nous autorisons ), nos coordonnes de golocalisation. Ceci permet l'mergence de rseaux sociaux localiss, pour permettre nos amis de savoir que nous sommes dans le quartier ( l'exemple de Aka Aki32) ou de publier nos performances de coureur de fond pour comparer nos rsultats avec ceux des autres sportifs empruntant les mmes chemins (Nokia Sport Tracker33). Demain ce sont les objets de la maison qui deviendront bavards limage de Watson, cet appareil qui mesure la consommation dlectricit du foyer et partage les rsultats en ligne avec la communaut des personnes qui en sont quipes34. Ce seront aussi les objets de lespace urbain, comme des lampadaires quips de capteurs permettant de mesurer la pollution sonore ou de lair. Ou encore dans les campagnes avec ces instruments enterrs dans les sols, susceptibles den mesurer le taux dhydratation et de surveiller par exemple la progression dune scheresse en temps rel. Dj nos compteurs de gaz et dlectricit, nos voitures, nos biens de consommation sont quips pour devenir communicants. Il sagit pour lheure dune communication affecte, c'est--dire monodirectionnelle entre lmetteur et le rcepteur : le compteur informe notre fournisseur dnergie de notre consommation, notre voiture prvient notre assureur de notre accident, ltiquette RFID attache au manteau prvient lacheteur que le fournisseur a transfr la marchandise chez le transporteur etc. Mais rien ninterdit que demain ces informations, agrges, ne puissent tre partages en ligne. Les consommateurs ne voudront ils pas visualiser le trajet de leurs achats, depuis le producteur, lartisan, jusquau magasin, pour en vrifier lorigine ? Les citoyens dune ville nexigeront-ils pas laccs linformation sur la consommation nergtique des immeubles publics de leur commune comme le revendiquent dj les britanniques35 ? Les personnes la recherche dun logement ne voudront-elles pas disposer simplement via une interface web des donnes de pollution sonore et atmosphrique des quartiers o elles cherchent sinstaller ? etc. Quel sera le statut de ces donnes ? Qui donnera le droit de les rendre libres ? Avec quelle granularit dagrgation ? Ainsi est-ce EDF seul qui pourra dcider de cartographier les flux de consommation lectrique des populations franaises ? Avec quel degr de prcision : la ville dans son ensemble, le quartier ou la rue ; le village ou un primtre rural de plusieurs kilomtres carrs ? Pour quels usages : vigilance environnementale ou surveillance des consommations de ses voisins ? Tout ceci reste largement explorer, construire, penser, afin que ces ocans de donnes que vont progressivement dverser les

32

http://www.aka-aki.com/ http://sportstracker.nokia.com/nts/main/index.do http://www.diykyoto.com/uk

33

34

35

http://www.guardian.co.uk/environment/georgemonbiot/2009/sep/11/energy-efficiencypublic-buildings

machines ne constituent pas une faille de plus dans la protection des donnes personnelles, trouvent une relle utilit sociale et au final mritent lappellation de bien commun.
BIEN COMMUN ET LIBERTES PUBLIQUES

Dans cette tension entre bien commun et liberts publiques, le web rvle plus que jamais sa nature essentiellement politique. Pourtant certains sont tents de balayer cette dimension dun revers de main pour le rduire une infrastructure technico-conomique. Lorsque Mark Zuckerberg, le fondateur de Facebook, affirme que la norme sociale a volu avec le temps et quil est donc normal que la plupart des informations quaffichent les utilisateurs de son service soient publiques36, il semble considrer que la technique faonne de faon unilatrale et irrpressible les comportements sociaux. nous de dmontrer qu linverse, le corps social peut aussi semparer de la technique et la rguler pour laccorder un projet de socit dans lequel le souci du bien commun demeure le fil rouge.

36

http://www.ustream.tv/recorded/3848950, entretien vido ralis par Techcrunch ; http://www.cnetfrance.fr/news/facebook-fin-confidentialite-39712122.htm

You might also like