Skip to content

wikisource.org

estelledem edited this page Feb 1, 2016 · 5 revisions

https://fr.wikisource.org Demangeat Estelle, Muteba Nina

Wikisource : points forts et points faibles d’une librairie en ligne

Quel niveau de structuration ?

Nous pouvons distinguer six niveaux de structuration informatique d’un texte: Wikisource se situe au troisième niveau. Pour constituer sa bibliothèque en ligne, il se sert majoritairement de bibliothèques numériques qui possèdent des OCR avec les fac-similés. Le site se sert notamment de Gallica (mode texte) et de Google Books (dont les textes sont téléchargeables en format Epub et peuvent être convertis en txt) la qualité de leur OCR est souvent bonne, de fait, le gain de temps est considérable. Si la source ne contient pas d’OCR, Wikisource recommande aux membres de sa communauté l’utilisation Internet Archive qui se charge d’ajouter l’OCR. Le texte océrisé est ensuite relu et corrigé par un membre de la communauté wikisource : nous nous trouvons donc bien au niveau 3 relativement à notre page « niveau d’informatisation » puisque wikisource nous propose des traitements de textes « qui nous permettent de produire automatiquement un livre électronique (epub) de qualité honorable » et qu’une présence humaine a raisonné le texte d’origine.

L’état du corpus Jules Verne

Plusieurs personnes peuvent participer à l’élaboration de la bibliothèque numérique, en revanche, la qualité de reproduction du texte est relative à chaque personne participant à cette élaboration. Pour notre corpus Jules Verne nous remarquons une relecture attentive des textes, les coquilles ou erreurs typographiques sont souvent signalées et corrigées. Il existe un système de signalétique qui permet de connaître l’avancement de l’édition du texte et de distinguer ainsi, les textes de qualités des textes qui n’ont pas encore été corrigés.

Notons que Wikisource nous donne accès à l’intégralité des textes de Jules Verne, ce n’est pas le cas pour l’ensemble des textes de Wikisource. Le site est doté d’un système de signalétique présent pour chaque texte qui permet à tout utilisateur _ simple lecteur ou éditeur _ de savoir si le texte est dans son intégralité ou non, c’est ce même système qui mesure la qualité du texte : allant du niveau 0 (statut inconnu) au niveau 5 (texte intégral et validé, pages relues par au moins deux contributeurs et conforme à une source identifiée publiquement vérifiable) https://fr.wikisource.org/wiki/Aide:Qualité_des_textes Nous avons effectivement relu quelques textes de niveau 5, l’orthographe est irréprochable et la typographie est respectée : l’espace est simple lorsqu’il s’agit de signes simples, l’espace est double pour les signes doubles qui sont d’ailleurs toujours précédés d’une espace insécable. Pour des textes non vérifiés nous avons trouvés à de nombreuses reprises, coquilles, fautes et erreurs typographiques.

L’organisation de la structure

Wikisource nous permet de sourcer chaque texte : un petit onglet nous donne accès à diverses informations telles que la maison d’édition, le fac-similé et l’année de parution d’une œuvre : à titre d’exemple : Voyage au centre de la Terre de Jules Verne : éditions Hetzel, Paris, 1867. De plus, cet onglet « source » nous donne accès aux pages du livre papier : la page du livre papier et la page correspondante numérisée se juxtaposent et nous permettent de comparer, de juger de la qualité du texte wikisource (les bons textes se veulent similaires à l’édition papier de référence). Par ailleurs, notons que Wikisource possède un système de nommage : l’espace page, ce système offre un certain nombre de garanties, notamment pour la conformité du texte avec l’original, ensuite, le système de collaboration de Wikisource permet aux uns et aux autres d’apporter des corrections et enfin, la protection du texte est élevée puisque toute falsification ou modification est visible. À cet espace texte s’ajoute un espace livre, l’effort de structuration est notable : chaque texte est structuré en chapitres, et nous pouvons facilement voguer d’un chapitre à l’autre grâce aux hyperliens.
https://fr.wikisource.org/wiki/Livre:Verne_-_Voyage_au_centre_de_la_Terre.djvu

Les illustrations

Des illustrations de bonne qualité sont inclues dans quelques textes et l’auteur des illustrations est indiqué (ex : Edouard Riou pour Voyage au Centre de la Terre). Cependant, nous n’en trouvons pas systématiquement pour tous les textes de notre corpus Jules Verne.

Les formats

Les textes wikisource ne sont pas protégés par mot de passe et nous autorisent à copier, distribuer ou modifier le texte. Divers formats sont proposés afin de récupérer le texte : le format PDF pour la plupart les textes puis s’ajoutent les formats Epub ou Mobi pour quelques autres textes.

En somme, nous pouvons affirmer que les textes wikisource peuvent nous faire économiser un temps considérable : ces textes directement téléchargeables se veulent de qualité et évitent à l’éditeur numérique d’océriser lui-même les textes. Cette remarque est à pondérer : les textes ne présentent pas une qualité homogène mais le système de signalétique mis en place permet de se repérer quant à la qualité d’un texte. Si les textes wikisource sont destinés à des lecteurs en ligne, ce site s’adresse en amont à des éditeurs débutants ou confirmés qui ont la possibilité d’apporter une pierre à l’édifice. Divers conseils leurs sont prodigués, notamment la conversion du fichier pdf en Djvu qui permet un archivage des textes numériques efficace puisqu’il s’agit d’un système de compression du document incluant images et textes. Par ailleurs, différents sites de qualité ou non sont proposés pour la recherche de textes, là encore la récupération de textes contenant des OCR de qualité est recommandée puisque les corrections seront moindres.

Clone this wiki locally