Professional Documents
Culture Documents
tre
mdiviste
Jean-Philippe
au
xxie
sicle
Genet
10
Jean-Philippe Genet
nous sommes, nous sommes aussi historiens, une catgorie qui n'est pas
moins floue {quid des archologues ? des historiens de l'art ?) et qui laisse
de ct d'autres mdivistes (les philosophes, les littraires ), et qu' ce
titre nous faisons partie de la vaste nbuleuse de ce que l'on appelle en
France (seulement en France?) les sciences de l'homme et de la socit
(distingues en anglais entre humanities et social sciences) . Mais laissons ces
dbats pour nous en tenir la sociologie acadmique et professionnelle :
aprs tout, nous devons rpondre une question qu'il ne nous incombait
pas de formuler.
Le xxie sicle est-il donc si porteur de nouveauts que l'on puisse
redouter qu'il bouleverse fondamentalement l'activit professionnelle, tant
scientifique que pdagogique, d'un mtier qui a volu par
sdimentations successives dans un cadre qui n'a jamais t fondamentalement remis
en cause jusqu' prsent et qui remonte au milieu du xixe sicle? Nous
en sommes en effet tous plus ou moins persuads, mais pour une raison
dont rien ne prouve en tout cas, avant examen que ce soit forcment
la bonne, savoir le dveloppement rapide de ce qu'il est convenu
d'appeler les nouvelles technologies , et plus particulirement l'informatique.
En effet, celle-ci nous introduit dans un systme technologique
(j'emprunte l'expression Alain Guerreau qui s'est, quant lui, dj charg
de dessiner ce que devrait tre l'histoire du Moyen ge au xxie sicle3)
que nous ne pouvons ignorer : non seulement ce systme exige - si nous
ne voulons en tre ni les esclaves ni les prisonniers, mais les utilisateurs
conscients - l'acquisition d'une expertise minimale, mais encore il gnre
des mutations profondes de l'ensemble du systme de communication de
notre socit, qui elles-mmes entranent des transformations
institutionnelles. Ces deux jeux de transformations, communicationnelles et
institutionnelles, provoquent leur tour un troisime ensemble de changements,
pistmologiques et scientifiques. Ces diffrents points ne pourront
videmment tre abords ici que de faon trs rapide, afin de lancer un dbat
plutt que pour prtendre en offrir une analyse acheve, et c'est l'apport
et aux consquences de l'utilisation de l'informatique, point de dpart et
manifestation la plus visible des transformations, que priorit - dans tous
les sens du terme sera donne.
mme les tudiants d'histoire s'interrogent, Paris, 2007 [en ligne] http://lamop.univ-parisl.fr/lamop/
LAMOP/JosephMorsel/index.htm.
3. Cf. supra, n. 2; l'expression est dans son cours de statistique : A. Guerreau, Statistiques pour
historiens, Paris, 2004, p. 8-9 (dition en ligne sur le site de l'cole des chartes).
11
4. Voir notamment R. Moreau, Ainsi naquit l'informatique. Les hommes, les matriels l'origine des
concepts de l'informatique d'aujourd'hui, Paris, 1981.
5. Classiquement, les histoires de l'informatique partent de l'immatriel d'une part (l'organon,
l'algorithme) et du matriel de l'autre, c'est--dire des premires ralisations de l'automatisme, partir
de trois pistes diffrentes, les machines calculer (Pascal), les automates analogiques (Vaucanson),
les commandes de mtiers tisser (Jacquart). Mais ce n'est qu' partir du moment o les deux voies
se rejoignent (avec Babbage) que l'on entre vritablement dans la prhistoire de l'informatique.
6. Sur les dbuts de l'utilisation de l'informatique par les historiens, voir les bilans de J.-Ph. Genet,
L'historien et l'ordinateur , Historiens et Gographes, Y7 (1978), p. 125-142, et Informatique ,
La nouvelle histoire, d. J. Le Goff, R. Chartier et J. Revel, Paris, 1978, p. 294-300.
12
Jean-Philippe Genet
13
14
Jean-Philippe Genet
15
nous aurions parl des traitements de texte, qui ont boulevers l'industrie
de l'imprimerie - y compris de l'dition scientifique - et notre rapport au
livre. Aujourd'hui, l'lment porteur de cette rvolution, qui dpasse celles
qu'avaient en leur temps accomplies le tlphone, la radio et la tlvision,
c'est videmment l'Internet. L aussi, on trouve, derrire une explosion
extrmement rapide, une histoire qui remonte assez loin, sans doute aux
travaux de Vanevar Bush, le conseiller scientifique de Franklin D.
Roosevelt pendant la Seconde Guerre mondiale - dcidment l'vnement qui a
prcipit toutes ces volutions - sur les mthodes optimales de recherche
de l'information. Mais le vritable dmarrage est li au lancement russi du
Spoutnik par les Russes, en 1957 : la recherche d'une riposte, les
Amricains ractivent et dynamisent plusieurs de leurs programmes
scientifiques, et notamment l'ARPA {Advanced Research Project Agency), hritire
de l'organisme cr par Bush, et son manation, l'IPTO {Information
Processing Techniques Office) ; il s'agit en fait d'une association entre l'arme et
plusieurs des meilleures universits amricaines. Trs vite, ils s'orientent
vers la mise au point d'un IMP {Interface Message Processor) qui repose sur
deux ides fondamentales : le concept de rseau, dvelopp par Paul Baran
la Rand Corporation, et le principe de la totale indpendance entre la
forme et le contenu de l'information qui permet de dcouper celle-ci en
paquets en fonction des capacits d'acheminement du rseau, sur lequel
la circulation se fait sans stockage en fonction des espaces libres et non de la
distance. Ainsi naissent tour tour l'ARPANET, en 1968, puis, en 1972,
le FTP {File Transfer Protocol) , toujours utilis, et enfin, dveloppe partir
des intuitions des Amricains Ted Nelson et Douglas Engelbart dans les
annes 1980, l'criture hypertexte, qui runit par des liens oprant partir
de boutons diffrentes parties d'un ou de plusieurs textes, sans qu'il soit
ncessaire de lire le texte squentiellement. De l sortent progressivement
l'Internet proprement dit, en 1980, et, en 1989, le web {World Wide Web),
tape dcisive, puisqu'il repose sur un nouveau mode d'criture
hypertexte (le html, hyper-ties mark-up language, invent par Tim Berners-Lee au
CERN de Genve, qui facilite la mise sur Internet des textes dans un
format adapt qui introduit des balises qui sont autant de liens vers d'autres
pages ou d'autres sites), le http-FTP, protocole de transfert de l'hypertexte,
et un systme d'adresses uniques, l'URL {Uniform Resource Locator). Mais
l'usage d'Internet n'explose rellement qu'avec l'apparition du navigateur
Netscape, en 1994, il n'y a mme pas quinze ans. L'apparition en 1996 des
moteurs de recherche (Yahoo, Google), les possibilits offertes par le
multimdia et la gnralisation de l'usage du courrier lectronique dmultiplient
les possibilits offertes par l'Internet. Nos tudiants - qui l'ont toujours
16
Jean-Philippe Genet
9. Il y a vingt ans, 600 000 postes de travail taient connects sur 80 000 sites, principalement aux
tats-Unis. En 2002, on ne comptait encore que 9 millions de sites; en 2007, plus de 1 10 millions
de connexions taient enregistres dans la seule Europe !
10. Tout n'tait pas encore aussi vident il y a trente ans, il sufft pour cela de relire les actes du
colloque fondateur qui s'est tenu Rome en 1975 : Informatique et histoire mdivale, d. L. Fossier,
A. Vauchez et C. Violante, Rome, 1977.
11. Voir, par exemple, Medio Evo in rete tra ricerca e didattica, d. R. Greci, Bologne, 2002;
R. Minuti, Internet et le mtier d'historien, Paris, 2002; Ph. Rygiel et S. Noiret, Les historiens,
leurs revues et Internet, Paris, 2005.
17
12. Le site de Mnestrel (http://www.menestrel.fr) est anim principalement par Christine Ducourtieux. Un programme financ par l'ANR ATHIS (ATeliers HIStoire et informatique) a entrepris de
faire le point sur les derniers progrs survenus dans le domaine des applications de l'informatique
l'histoire : J.-Ph. Genet, La premire anne des ateliers ATHIS , Mlanges de l'cole franaise
de Rome, Moyen ge, 119 (2007), p. 253-272. partir des sites du LAMOP et de Mnestrel (sur
la page d'accueil, Collections puis Histoire et informatique ), on peut accder certains des
travaux prsents aux ateliers ATHIS (ATHIS I V).
13. Cf. http://www.ceec.uni-koeln.de.
18
Jean-Philippe Genet
le folio, ce qui n'est en fait pas beaucoup plus cher qu'une photocopie. Des
entreprises quivalentes existent ailleurs, notamment en Suisse (les
manuscrits de Saint-Gall ont t saisis sur le modle allemand), en Italie14 et en
France, o les bibliothques publiques et les Archives dpartementales15
dveloppent des projets identiques. Il est essentiel que l'image ait une
prcision suffisante, donc un nombre adquat de dpi {dot per inch) ou de ppp
(point par pouce), ce qui a des rpercussions directes sur la place occupe
par les images en mmoire et sur le cot. Reste, bien sr, le problme de la
gratuit ou non de l'accs aux informations. Certes, l'archive universelle16
n'est pas pour demain, mais les progrs sont rapides.
Le deuxime niveau est celui de la cration de la mtasource, c'est-dire de l'organisation et de la structuration des donnes en vue du
traitement informatique. Cela peut nous loigner radicalement de la source,
comme dans le cas d'une base de donnes non srielles, ou au contraire
nous laisser trs proche si le texte en est partiellement ou compltement
conserv, mais enrichi d'informations qui vont en permettre
l'exploitation. Tout dpend aussi de l'importance du degr de codage. Ce domaine
tait jusque-l celui des SGBD (systmes de gestions des bases de donnes)
dont les plus utiliss sont PARADOX, DBase, FoxBase, Access ou encore
ORACLE. Les ncessits d'adaptation des donnes fournies par les sources
aux contraintes de format qui sont celles des SGBD imposent un travail
extrmement fructueux sur le plan intellectuel de dfinition des variables.
Aujourd'hui, le dveloppement rcent du XML {Extensible Markup
Language) apporte de nouvelles solutions. Driv du HTML, le XML est lui
aussi un prolongement rcent du SGML {Standard General Markup
Language), le langage mis au point pour l'dition numrique des textes, afin
de l'adapter aux possibilits nouvelles du web. Le XML mlange du texte
proprement dit et ce que l'on appelle des lments , qui permettent de
structurer le texte mais peuvent aussi tre reprs et utiliss un peu comme
le sont les variables d'une base de donnes. Il y a aujourd'hui de trs
nombreux dveloppements de bases de donnes textuelles utilisant ces outils, et
le XML est, vrai dire, plus souvent employ comme mode d'dition que
comme systme d'accs aux donnes, mais il convient de signaler et de
mettre l'honneur les applications qui joignent dition et analyse de donnes,
14. Cf. Genet, La premire anne... , loc. cit. n. 12, p. 261-262, pour les archives de Florence.
15. Ibid., p. 261, pour l'exemple des Archives dpartementales de la Mayenne prsent par Jol
Surcouf.
16. Voir cependant les rserves exprimes par Marc Smith l'atelier ATHIS I (cf. supra, n. 12),
L'aube des archives globales .
19
comme le travail ralis par Marjorie Burghart et Nicole Briou sur les
sermons de Jacques de Voragine17. L'originalit de l'approche a consist ici
utiliser la structure mme du sermon pour mettre la disposition du
lecteur des outils d'interrogation extrmement sophistiqus et d'une grande
efficacit. La mme approche a t applique aux comptes des chtellenies
savoyardes tudies sous la direction de Christian Guiller.
La troisime tape est le traitement. Une base de donnes, textuelles
{corpus) ou non, sera utilise des fins diverses, notamment
documentaires. Mais elle peut aussi tre structure de sorte que le recours des
mthodes d'analyse linguistique ou statistique jusque-l hors de la porte
des historiens soit envisageable. Il en va de mme lorsque l'on traite des
donnes go-rfrences, en utilisant des SIG (systmes d'information
gographique), qui ouvrent la voie toutes les formes d'analyse spatiale. Bien
sr, il ne faut pas minimiser l'importance et l'intrt des recherches de type
documentaire, mais ce qui constitue l'innovation la plus frappante est ici
l'introduction de la mesure, y compris (et surtout) dans le cas de donnes
qualitatives, grce aux mthodes modernes d'analyse des donnes, dont la
liste ne cesse de s'allonger, de l'analyse factorielle des correspondances aux
analyses de rgression logistique18. Deux points doivent toutefois tre
souligns : d'une part, le recours ces mthodes impose sinon une vritable
formation - ce qui reste l'idal -, du moins un investissement en temps
non ngligeable de la part de l'utilisateur. D'autre part, ces mthodes sont
partages par de multiples disciplines : quand il fait une analyse
factorielle sur une base de donnes prosopographiques ou une analyse lexicale,
l'historien mdiviste se retrouve sur le mme terrain que le politologue, le
sociologue ou le linguiste, dans un cadre de facto pluridisciplinaire. C'est
une situation qui cre des exigences nouvelles, car, partir du moment o
il possde les mmes outils que ses collgues des autres disciplines,
l'historien doit tenter de les utiliser avec la mme comptence : il y a l une forte
incitation la dissolution, dans un espace scientifique largi des sciences
sociales et humaines, des barrires nes de spcialisations parfois abusives.
Enfin, l'dition. L'dition en ligne est d'abord un formidable outil
de libert, puisqu'elle permet, sans cot matriel prohibitif- parfois mme
sans cot du tout -, de mettre en ligne des ouvrages auxquels des lecteurs
potentiels auront directement accs. Ainsi c'est le premier exemple que
20
Jean-Philippe Genet
21
22
Jean-Philippe Genet
disquettes, et les ordinateurs dvorent livres, films, photos, etc. Mais plus
que de l'volution du prix intrinsque des machines, les augmentations
de cots dpendent de deux paramtres : la multiplication des machines
et les besoins croissants en personnel. Si l'on en est aujourd'hui installer
des postes de lecture dans les bibliothques, on en sera bientt en doter
les salles de cours et de sminaire, voire les amphithtres. Et pour tre
utiliss au mieux de leurs possibilits, ces matriels, les branchements, la
stabilit et la mise jour des logiciels, la scurit des serveurs et des rseaux
surtout requirent un personnel qualifi et comptent, et qui ne soit donc
pas trop mal pay, sans mme parler des besoins de la recherche invoqus
prcdemment propos de l'histoire mdivale.
Quant aux logiciels et au software, il est difficile - plus encore que
pour les machines et le hardware d'avoir une visibilit claire sur
l'volution de leurs cots. Un dynamique mouvement coopratif s'est dvelopp
depuis quelques annes et a d'ores et dj donn des rsultats
incontestables. Qu'ils tournent sous Linux ou sous Windows, les logiciels libres en
open source se multiplient : aujourd'hui, quelques-uns des logiciels les plus
indispensables la recherche historique, R pour les statistiques, MySQL
et PHP5 pour les bases de donnes, sont des logiciels libres. Mais il n'est
pas sr que ce mouvement puisse battre en brche une industrie puissante.
Certes, Microsoft a perdu de sa superbe : il a du mal grer la transition
de Windows XP Windows Vista, et la vulnrabilit de ces systmes
d'exploitation aux virus a permis des perces spectaculaires dans son empire
(Mozilla Firefox aux dpens d'Explorer). Surtout, le front du
dveloppement s'est dplac vers un autre domaine, celui de la matrise des donnes,
o Google occupe une position dominante. Certes, l'accs ces donnes
reste pour le moment gratuit, Google se rmunrant sur la publicit ou des
services de type industriel. Bien que leur bilan en matire d'accs gratuit
des citoyens aux collections publiques ne soit pas toujours impeccable, les
bibliothques et les archives publiques ont vivement ragi, mais en ordre
dispers et non sans lenteur : certaines se sont allies Google, d'autres ont
mont leurs propres sites de numrisation, et les politiques publiques de
numrisation n'ont trouv que rcemment un nouveau souffle, notamment
en France avec le lancement de Gallica223 et, en Europe, celui d'Europeana
(prvu en novembre 2008). Les rythmes de numrisation sont
impressionnants : chaque mois 30000 livres pour Gallica2, et jusqu' 100000 pour
Stanford. Le Xanadu rv par Ted Nelson, qui avait fait douter de sa
23
raison, n'est peut-tre plus si loin. Mais, mme si l'accs aux ouvrages hors
droits reste libre, comme sur Google et sur Gallica2, la consultation des
autres ouvrages sera ncessairement payante. Surtout, le problme du cot
de la documentation scientifique est pos : il atteint des sommets dans
certaines disciplines comme la mdecine et la pharmacie, o il est
indispensable d'accder rapidement l'information la plus rcente, mais, bien que
moindre, il peut s'avrer tout aussi prohibitif dans le domaine des sciences
humaines, o les dotations des centres de recherche et des bibliothques
sont plus modestes. Il faut certes saluer quelques initiatives, comme celle
des Monumenta Germaniae Historica, ou une entreprise cooprative de
partage du savoir comme Wikipdia, mais l'galit d'accs la
documentation numrise est loin d'tre garantie.
Une chose est donc certaine, l'informatisation massive induit des
cots levs : derrire l'galit et la libert des changes, on dcouvre la
concurrence. On peut contester cette vision : les cots sont relativement
faibles en termes de strict calcul conomique, dans la mesure o ils
augmentent fortement le rendement du travail ou du moins d'un certain type
de travail. Ainsi, l'exigence de la remise aux diteurs de manuscrits prts
tirer transfre la prparation typographique des manuscrits aux auteurs,
ce qui supprime une partie des emplois de l'imprimerie ; et ils permettent
ventuellement des conomies (non-achat d'imprims). Mais pour ceux
qui les supportent, qu'il s'agisse de cots directs (achats de matriels ou
de logiciels) ou indirects (personnel, rseaux), ils sont incompressibles s'il
s'agit de rester dans la course : l'lvation des cots est d'autant plus forte
que l'on veut disposer des matriels les plus sophistiqus et des
informations les plus pousses, et elle vient videmment renforcer les positions des
institutions les mieux armes, qui sont les seules disposer des moyens
leur permettant de rpondre cette pression. Autrement dit, les
technologies nouvelles enfantent une situation de comptition concurrentielle.
N'oublions pas que l'Internet (l'informatique ne se rduit pas
l'Internet, mais il fournit pour l'heure l'exemple paradigmatique), cration de
l'arme et des grandes universits amricaines, est n dans un contexte
socio-conomique bien particulier, celui du capitalisme libral : mme s'il
a t dtourn par un mouvement coopratif qui l'a orient ds ses dbuts
vers une relle libert de la communication entre individus, l'Internet est
plus libral que libertaire . Son fonctionnement est celui d'un
march sur lequel des oprateurs concurrents se livrent une comptition o
les plus inventifs et les plus efficaces - c'est la vision rose - l'emportent en
se constituant des empires plus ou moins virtuels axs sur la matrise bien
relle de l'information et des mthodes de traitement. Qui veut oprer sur
24
Jean-Philippe Genet
25
26
Jean-Philippe Genet
27
28
Jean-Philippe Genet
29
30
Jean-Philippe Genet
24. Je pense ici l'adaptation des travaux du laboratoire de lexicologie de Saint-Cloud par Pierre
Muller, Michle Sarrasin et Philippe Dautrey, qui a abouti l'excellent logiciel Pistes et aux
publications de la srie Logitexte du CNDP et de l'INRP : voir en particulier P. Muller et Ph. Dautrey,
Analyses des dclarations des droits de l'Homme, Paris, 1989.
25. C'est l'objet d'ATHIS VI.
31
32
Jean-Philippe Genet
26. Cf. Morsel, L'histoire (du Moyen Age). .., op. cit. n. 2 : c'est la question liminaire que pose
l'auteur.
27. Il est significatif que deux des programmes historiques pilots par la Fondation europenne de
la science portent prcisment sur ces priodes charnires : La gense de l'Etat moderne (sept volumes
collectifs publis en franais aux PUF et en anglais Oxford University Press, plus trois colloques
publis) et Transformation of the Roman World (18 volumes prvus dont 13 publis par Brill Leyde
entre 1997 et 2004).
28. Cf. supra, n. 1.
29. P. Veyne, Quand notre monde est devenu chrtien, Paris, 2007.
33