Les Grands Débats :
Plaidoyer pour une encyclopédie d'un monde nouveau

Publié par Hamelin de Guettelet le mercredi 26 décembre 2012

Il est des personnes qui apprennent de l'expérience et d'autres qui ressassent toujours les mêmes idées. Déjà Pierre Assouline avait fait de Wikipédia sa bête noire (cf. mon message du 11 juillet 2008) et voilà qu'il y a un peu plus d'un mois, le mercredi 14 novembre 2012, sur le site Les Grands Débats, il relance toujours la même polémique « Wikipédia est-elle encore crédible ? » Il ouvre le débat par une interrogation « Wikipédia est-elle fiable ? » dans lequel on retrouve pêle-mêle toujours les mêmes critiques, pour terminer son intervention par une nouvelle réflexion interrogative : « La question de sa fiabilité serait-elle consubstantielle à la nature même de l’encyclopédie interactive ? » Ce débat a suscité trois interventions :
  • Jean-Louis de Montesquiou (Auteur) répond « La question est pertinente mais un peu tardive », pour lui « Wikipédia a largement passé l’âge des remises en cause. [Elle] semble même en voie de réaliser le fantasme de José Luis Borges : une bibliothèque universelle, presque coextensive à notre univers, apte à recueillir tout notre savoir passé et à venir. ». Pour connaître la fiabilité de Wikipédia, de Montesquiou donne une méthode pratique assez simple « lorsque nous consultons un article, il suffit juste de savoir quel stade du processus de raffinement il a atteint, en allant consulter l’historique des corrections. » ;
  • Jacques Richard (Auteur et contributeur à Wikipédia) « La fiabilité de Wikipédia : théorie et pratique » apporte une réponse brutale à Assouline « Wikipédia, considérée d’un point de vue général, n’est pas fiable : en effet, la présence dans Wikipédia d’une information ne garantit ni son exactitude, ni son inexactitude. » oscillant entre optimisme et pessimisme « Il me semble aussi que Wikipédia s’est améliorée depuis 2007 et je ne vois pas de raisons que cela ne continue pas [...] je ne constate pas tant une tendance aux interventions négatives sur les pages correctes, que la stagnation de beaucoup de pages dans un certain état de médiocrité. » ;
  • Roger Chartier (Historien) « Et pourtant » si « Wikipedia démontre et illustre les promesses d’une textualité numérique soustraite aux contraintes de l’imprimé : l’information peut y être actualisée en temps réel, l’accès en est gratuit, la construction en est collective, sans revendication de propriété intellectuelle [...] l’essentiel réside dans une des faiblesses intrinsèques de la textualité numérique qui présente sous des formes identiques et sur la surface illuminée d’une même machine des informations qui semblent, du coup, lestées du même poids de savoir. »
The Sum of Human Knowledge © - Encyclopaedia Britannica
Moi, je ne sais si Wikipédia est crédible et encore moins si elle est fiable, la seule chose que je sais, c’est que Wikipédia est utile. Utile chaque mois à ces vingt millions de lecteurs uniques, et, parmi ces utilisateurs, il y en a encore trop qui l’utilise hypocritement tout en la critiquant publiquement. En lisant ces diverses contributions, j'ai eu envie, non pas d'apporter une réponse sur cette crédibilité ou cette fiabilité - qui d'ailleurs connait l'ensemble de son contenu pour répondre à cela ? - mais plutôt de réfléchir et d'élargir ma réflexion aux critiques abordés dans les quatre contributions du Grand Débat, réflexion que j'articulerais autour de quatre sujets :
- Wikipédia est-elle une encyclopédie de la connaissance ?

- La non-fiabilité de Wikipédia serait-elle consubstantielle à sa liberté d'écriture ?

- le manque de spécialistes condamne-t-il Wikipédia à la médiocrité ?

- Wikipédia, hiérarchise-t-elle au travers de l'organisation de son corpus d'articles ?

J'avais fait une demande de contribution au Grand Débats qui est malheureusement restée sans réponse. J'ai donc laissé un commentaire à la suite de la contribution d'Assouline synthétisant au maximum mes réflexions et je donne ici in extenso ma contribution.

Wikipédia est-elle une encyclopédie ?

D'abord il faut faire l'effort de comprendre a minima la philosophie de ce projet d'encyclopédie :
  • En premier, c'est un projet, car à la différence d'une encyclopédie papier qui, pour être imprimée, doit être un objet fini, même si l'édition de ses volumes s'échelonne dans le temps, Wikipédia, elle n'est pas fini, Wikipédia n'a pas de limite, tant de contenu que dans le temps, sa meilleure définition est bien un work in progress, un projet en cours de réalisation. C'est la notion la plus importante que chacun devrait garder à l'esprit chaque fois que Google lui retourne un article de Wikipédia à la suite d'une requête, comme le note de Montesquiou, il faut avoir conscience du stade du processus de raffinement atteint par l'article ; rien n'est jamais totalement figé, rien n'est jamais totalement écrit comme sur une page imprimée.
  • En second, c'est une encyclopédie, un site à visée encyclopédique, pour être plus précis, car s'il y a de célèbres exemples d'encyclopédies, il n'y a pas de modèle canonique. L'Encyclopédie des Lumières de Diderot et D’Alembert n'est pas la Britannica ou l'Universalis de la société de consommation, la Wikipédia d'aujourd'hui, n'est pas la Wikipédia de demain, elle est aujourd'hui la rançon du Web 2.0, elle sera demain, elle ou une autre encyclopédie, à l'image du web sémantique (remarquer déjà les efforts de recherche de Google avec « Knowledge Graph »). Une encyclopédie est l'une des meilleures photographies de la société de son temps.
Je ne reviendrai pas ici sur l'étude de la revue Nature, je n'ai pas l'optimiste de de Montesquiou, j'ai déjà dit que cette étude, même si elle était flatteuse pour Wikipédia, n'était pas représentative ni de l'encyclopédie Britannica ni de la Wikipédia anglophone ; l'étude n'était représentative que pour les articles sélectionnés et comparés. La généralisation à l'ensemble de la Britannica et à l'ensemble de la Wikipédia anglophone, a fortiori à l'ensemble des 285 versions linguistiques de Wikipédia serait abusive.

Wikipédia, ce projet d'encyclopédie numérique en ligne, répond à quelques principes de base simples, pour ne pas dire simplistes, ses principes fondateurs et ce qui en découle :
  • principe de pertinence encyclopédique ;
  • principe de neutralité ;
  • interdiction du « travail inédit » ;
  • citation des sources ;
  • respect du droit d'auteur ;
  • contenu librement réutilisable ;
  • travail collaboratif ;
  • recherche de consensus ;
  • respect des contributeurs.
Il faut ici rappeler un trait d'histoire ; avant Wikipédia était Nupédia. Nupédia était l'antithèse de Wikipédia, une collection fermée d'articles encyclopédiques rédigés par des universitaires sous contrôle rédactionnel. Nupédia est morte de ses contraintes, Wikipédia vit de sa liberté et c'est cette liberté qui fait peur aux contempteurs de l'encyclopédie, cette liberté d'écriture.

Existe-t-il une véritable liberté d'écriture ?

Cette liberté est réelle mais comme toutes les libertés, elle a ses limites. Elle s’arrête aux frontières du but à atteindre, la construction de ce projet d'encyclopédie. Ce que Wikipédia n'est pas est aussi, sinon plus, important que ce Wikipédia doit être.

Il serait par trop banal de préciser que tout édifice humain est imparfait par nature mais il serait tout autant injuste de décider de l'inutilité de Wikipédia à la pétition de principe de son peu de fiabilité au prétexte que « n'importe qui peut écrire n'importe quoi dans Wikipédia ». Il faut bien finir par tordre le cou à cette vieille antienne d'Assouline, ses lacunes ne sont pas consubstantielles à sa liberté d'écriture. Peut-on écrire n'importe quoi ? Oui, mais généralement pour peu de temps (Pierre Assouline n'est pas resté très longtemps champion de France de jeu de paume ; les rares exceptions n'étant là que pour confirmer la règle). Pour se mettre, autant que faire se peut, à l'abri du vandalisme, cachés derrière un anonymat pratique, comme tous ces contributeurs qui veulent tester les capacités de correction de Wikipédia en y introduisant des fausses informations,  mais aussi de toutes les erreurs possiblement détectables, l'encyclopédie dispose de cinq niveaux de contrôle :
  • des robots logiciels qui lisent et relisent inlassablement toutes les RC - recent change (changements récents) - à la recherche de modifications anormales qu'ils revertent - retour à la version précédente - instantanément ; le plus connu et efficace de ces robots est Salebot ;
  • des humains, contributeurs volontaires, appelés patrouilleurs, essayent, avec l'aide d'un logiciel LiveRC, de débusquer les vandalismes - modifications malveillantes - qu'un robot ne peut pas comprendre ;
  • les contributeurs confirmés qui peuvent entériner ou invalider toutes les modifications, spécialement signalées, de toutes les IPs - contributeurs non enregistrés et catalogués sous leur adresse Internet - et de tous les nouveaux contributeurs pas ou peu expérimentés ;
  • chacun des milliers de contributeurs de Wikipédia vérifie sa propre liste de suivi, qui lui indique toutes les modifications survenues depuis sa dernière vérification, sur tous les articles de sa compétence, permettant ainsi de débusquer les plus subtils vandalismes ;
  • enfin des filtres logiciels, spécialement écrits pour débusquer les vandalismes redondants, répétitifs, caractéristiques de quelques vandales qui cherchent la confrontation systématique mais qui laissent chaque fois une signature facilement reconnaissable.
Il serait possible de compter au niveau des contrôles le processus de labellisation qui soumet des articles choisis par leurs rédacteurs pour être lus, relus, discutés, critiqués, amendés, complétés etc. par d'autres contributeurs et cela pendant plusieurs semaines pour arriver à obtenir les labels BA - bon article - ou AdQ - article de qualité - aujourd'hui 1733 BA et 1137 AdQ. Ce n'est pas le poids apparent, comme le regrette Chartier qui pose problème, mais le fait qu'un même projet d'encyclopédie regroupe, comme le note de Montesquiou, différents niveaux de raffinement, aux AdQ se mêlent de simple ébauches, mais Richard oublie de préciser que des bandeaux en tête ou en pied d'article ou encore des évaluations en page de discussion essayent de sérier le bon grain de l'ivraie.

En fait seul l'importance de la masse des modifications - entre 25 000 et 30 000 modification par jour (20 par minute, 1 toutes les 3 secondes) comprenant plus de 700 créations d'articles par jour (1 toutes les 2 minutes) dont environ la moitié est supprimée - sur les 1 325 000 articles, ces chiffres sont suffisants pour expliquer par eux-mêmes qu'il y a des petits poissons qui réussissent à passer entre les mailles du filet. Spécialiste ou pas, aucun correcteur même professionnel n'est infaillible.

Qui en fin de compte rédige le contenu ?

Je voudrais détailler ici rapidement une expérience fondatrice réalisée par l’eugéniste Francis Galton qui, en 1907, voulait démontrer la supériorité du spécialiste sur le jugement populaire. Pour cela il étudie les jeux des foires aux bestiaux ; les parieurs achètent 6 pences une carte sur laquelle ils indiquent le poids estimé de la carcasse d'un bœuf sur pied, les gagnants se partageant les mises. En étudiant un pari sur un marché près de Plymouth, son diagnostique est pris en défaut, le jugement populaire est plus sachant que celui des spécialistes, les 787 parieurs ensemble avaient pratiquement trouvé le poids de la carcasse de 1197 livres (la moyenne est précise à 1 livre près, la médiane à 2 livres près) mais aucun individuellement n'avait le poids juste (revue Nature du 7 mars 1907, p. 450-451). L'ensemble des parieurs avait-il plus de connaissance que les parieurs individuellement ? Galtron avait oublié de préciser que parmi les parieurs il y avait aussi des éleveurs spécialistes. Cela ressemble beaucoup à la communauté des contributeurs à Wikipédia dans laquelle des spécialistes, qui acceptent de jouer le jeu de la connaissance, se confondent avec des amateurs plus ou moins compétents.

Le fonctionnement des groupes humains ont toujours intéressé les chercheurs et l’éthologie des sociétés animales organisées a ouvert la porte à plusieurs théories des comportements humains. C'est la théorie intéressante de « l'intelligence collective » de Pierre Lévy (L'intelligence collective. Pour une anthropologie du cyberespace, La Découverte, 1994) ou celle de « la sagesse des foules » de James Surowiecki (The Wisdom of Crowds, Anchor Books, 2004) qui peuvent expliquer comment Wikipédia fonctionne ; les compétences de chaque contributeurs, même si elles sont individuellement limitées, trouvent dans la synergie, la stigmergie de Pierre-Paul Grassé (Termitologia, Masson, 1982-1986), des facultés d'apprentissage et de création supérieures ; la valeur des connaissances de la somme des individus est supérieur à la somme des connaissances des valeurs des individus.

Les articles de Wikipédia, non signés par les auteurs, peut être non spécialistes mais aussi spécialistes, sont le fruit de cette stigmergie. En fin de compte, s'il n'est plus possible de savoir qui a écrit quoi, sans faire une étude détaillée de l'historique des contributions, cela n'a que peu d'importance puisque chaque contributeur s'est transcendé dans sa collaboration avec les autres. L'auteur virtuel de l'article est plus compétent que chacun de ses composants, contributeurs individuels.

Un article de Wikipédia n'est effectivement pas signé par un grand nom de la spécialité et encore moins par un prix Nobel comme s’enorgueillissent les encyclopédies traditionnelles. Les articles de Wikipédia sont signés par tous les spécialistes du domaine qui ont écrit sur le sujet. Un des avantages indiscutables de Wikipédia, c'est le pied de page des articles, y figurent normalement toute la bibliographie des spécialistes du sujet, puisque c'est leurs écrits que les contributeurs au projet d'encyclopédie ont synthétisé dans l'article, respectant ainsi la neutralité, tous les points de vues y sont représentés et non le seul point de vue de l'auteur aussi prestigieux soit-il. Faut-il rappeler ici l'opposition de Jean-Jacques Rousseau et de Nicolas-Antoine Boulanger qui a donné lieu aux deux articles Économie (Tome V) et Œconomie (Tome XI) de l'Encyclopédie ?

Il est facile de concevoir que les détenteurs traditionnels du savoir ont quelques difficultés à se sentir ainsi dépossédés de leur statut social de « sachant ». Comment accepter ce projet d'encyclopédie, cette « Terre-mère », qui enfante dans le plus grand désordre un savoir mouvant, qui au fil de la stigmergie contributive, consolide ses connaissances pour présenter les savoirs aux enfants du Web ?

Hiérarchisation ou organisation des connaissances ?

L'organisation du savoir des encyclopédies est toujours présentée comme un préalable aux encyclopédies elles-mêmes et c'est cette hiérarchie des savoirs qui ferait la richesse des encyclopédies. Nous savons aujourd'hui que cette organisation, cette hiérarchisation, n'est pas la cause à l'origine des encyclopédies, mais en fait, cette sélection des connaissances n'est que la conséquence de l'espace papier de ces encyclopédies finies. Imprimer l'ensemble du savoir, des connaissances humaines était et est toujours impossible au sein d'une encyclopédie. L'encyclopédie est née de la constatation que « l'honnête homme sachant » ne pouvait plus connaitre l'ensemble des savoirs de son temps ; il lui fallait une béquille, l'encyclopédie. Mais la soif de savoir de l'homme est telle que rapidement l'encyclopédie devient elle-même dépassée ; elle ne peut plus compiler, elle aussi, l'ensemble des savoirs de son temps. La hiérarchie, l'organisation et la sélection du savoir n'est pas la qualité, la richesse, d'une encyclopédie mais son exacte contraire, c'est son défaut, ses lacunes. Si ces encyclopédies pesaient d'un poids différents les connaissances c'était uniquement pour exclure les moins importantes pour faire la place à celles considérées alors comme plus importantes. Nous avons ainsi des pans entiers du savoir qui, en fonction des époques, prenaient place parmi les élus avant d'être rejetés, à une autre époque, au purgatoire des connaissances inutiles. Il ne faut pas chercher ailleurs, dans cette hiérarchisation de l'exclusion, dans cette inadaptation à leur temps des encyclopédies papier, la raison du déclin de ces encyclopédies traditionnelles et non l’existence de Wikipédia qui n’en peut tant. Ce n'est pas Wikipédia qui a tué les encyclopédies papier, c'est l'informatique et sa capacité à regrouper dans un espace pourtant limité une masse importante d'informations numériques ; au regard de la masse, l'espace parait infini. Aujourd'hui la Wikipédia francophone représente environ 500 volumes d'une encyclopédie imprimée et pourtant tous ses articles tiendraient sur une galette de plastique de 12 cm.

Il n'est donc plus nécessaire aujourd'hui de hiérarchiser les connaissances, la place n'est plus comptée, il n'y a donc plus aucune raison de supprimer des connaissances qui devraient être incluses dans une encyclopédie numérique. Il n'y a donc pas a priori des connaissances qui n'auraient pas leur place dans Wikipédia. Pour respecter la philosophie de ce projet d'encyclopédie, les principes de Wikipédia, tout contenu qui a été traité dans des sources secondaires de qualité est éligible au projet d'encyclopédie.

Il serait intellectuellement malhonnête de dire ou de laisser dire que le savoir, les connaissances incluses dans Wikipédia ne seraient pas organisées. Il existe en fait deux systèmes d'organisation complémentaires :
  • une organisation par thème, les portails ;
  • une organisation par classification hiérarchique mère-à-fille, l'arbre des catégories.
Il n'existe pas un seul article de ce projet d'encyclopédie en ligne qui ne soit rattaché à un ou plusieurs thèmes/portails, qui ne soit classifié dans une ou plusieurs catégories.

Un autre avantage indiscutable de Wikipédia, comme de toute encyclopédie numérisée, est la présence des liens hypertextes qui permettent de circuler dans cette somme de connaissances par six moyens aux finalités différentes et complémentaires :
  • les liens sur les mots, qui renvoient à des compléments textuels ;
  • les liens sur les articles, qui renvoient sur d'autres articles plus généraux ou plus détaillés ;
  • les liens sur les articles connexes, qui renvoient à des articles complémentaires ;
  • les liens dans les palettes d'orientation, qui renvoient aussi vers des articles complémentaires ;
  • les liens sur les catégories, qui renvoient vers une classification des articles ;
  • les liens sur les portails, qui renvoient sur les thèmes liés à l'article.
Au regard des moyens déployés, il est difficile de continuer à prétendre que le savoir et les connaissances de Wikipédia ne sont pas organisés et hiérarchisés, même si l'on entend hiérarchisation par exclusion. Ce projet d'encyclopédie rejette de son corpus, au grand désespoir de leurs contributeurs, encore beaucoup, trop diront certains, d'articles qui n'ont pas fait la preuve de leur encyclopédisme. Étant entendu que la qualification d'encyclopédisme tient uniquement à l’existence ou l'inexistence de sources secondaires de qualité.

Vers une encyclopédie du Web sémantique

J'apporterai ma conclusion en écrivant qu'il faut admettre qu’une encyclopédie est à l’image de son temps, c’est la meilleure photographie de la société qui l’a vue naître ; c’est sous cet angle qu’il faut juger d’une encyclopédie. Wikipédia est bien une encyclopédie de son temps, une encyclopédie du Web 2.0. Elle est particulièrement adapté au monde qui l'a vue naître, son indiscutable succès mondial en témoigne. Elle est effectivement critiquable, tout est critiquable, mais elle n'est pas critiquable avec les arguments de l'Aκαδήμεια ou des Lumières ; elle doit être critiquée avec les arguments de son siècle, le XXIe. Et son siècle évolue vite, aujourd'hui le Web 2.0, demain le Web sémantique. Il faudra que Wikipédia évolue vers ce nouveau Web, sinon comme les encyclopédies papier du XIXe et du XXe siècle, elle sera tout simplement dépassée par un autre projet encyclopédique qui aura compris l'air de son temps.

Aujourd'hui les contempteurs de Wikipédia ne sont que des hommes dépassés par leur siècle. Il est à leur honneur de défendre aujourd'hui les valeurs du passé, le temps du papier, du livre et des bibliothèques car c'est sur ce passé, ce papier, ces livres et ces bibliothèques que le présent numérique se construit. Vivre avec son temps, accepter ses contraintes, ce n'est pas nier le temps passé, c'est le transcender comme Wikipédia transcende l'Encyclopédie.