Tutorial pour convertir en ePub un PDF de Gallica.Gallica propose plusiseurs millions de livres en format PDF que l'on peut transformer en ePub moyennant quelques manipulations et de la révision orthographique. Que sont exactement les PDF de Gallica.? Le PDF que Gallica vous propose contient en fait l'image du photographique du texte et le texte issu de l'OCR. Quand vous lisez le PDF en ligne ou dans Adobe, c'est l'image que vous voyez. quand vous faites un copier-collé du à partir du PDF vers un éditeur texte, c'est le texte scanné que vous prenez. La BNF scanne ses livres via des logiciels de reconnaissance de caractères (OCR) qui ont un taux de reconnaissance de plus de 99.9%. Quoiqu'honorable, ce taux n'est ni fixe ni suffisant. Il n'est pas fixe car il varie d'un livre à l'autre en fonction de l'état et il n'est pas suffisant car cela signifie une coquille par page au minimum. En pratique on constate que certaines pages sont parfaites et puis d'autres sont truffées des coquilles, de contre sens etc. Au niveau général du livres pris dans sa totalité, les erreurs typographique restent relativement nombreuses, audelà du supportable et les mots faussement reconnus sont légions. Il y a deux raisons qui poussent à vouloir convertir ces PDF en ePub:
Quel mode de sauvegarde du livre à partir de Gallica?PDF sans aucune image :Cela peut paraître paradoxle de se poser cette question si l'on ne veut que le texte, pourquoi ne pas choisir directement l'option texte de Gallica? La réponse est simple : on peut le faire directement, et le copier coller dans word. mais si vous voulez le corriger il vous faudra quand même une représentation extacte du texte et elle se trouve dans le PDF. Le tutorial pour le texte renseigne comment extraire vers Word et traiter le texte afin qui'il garde un maximum de son formatage initail.PDF avec image:Vous n'avez pas trop le choix que sauver le PDF, d'en extraire et traiter le texte et puis d'en extraire les images et de les traiters aussi.Suivez le tutorial pour le texte et puis le tutorial pour les images. Pourquoi avons nous besoin du document word (ou autre editeur)?Le document word va servir comme support de la phase de correction orthographique. On on peut y appliquer des outils puissants comme Antidote qui se présente dans Word sous la forme d'un pluggin. Mais il y en a d'autres. Ici chacune se fera son opinion.Une fois la correction finie et la conversion en epub, faite, il existe une autre raison pour laquelle on souhaite garder le document word : les images. En effect la plusparts des logicels de conversions diminuent la taille de l'image pour les rendre accessibles au eReader de nos jour (2013). D'ici quelques années la technique aura évoluée et l'on voudra des ePubs avec des images plus grandes mais les epubs aujourd'hui n'aurons que leurs images déjà réduites de tailles. Le document Word orignal garde lui les tailles et les résolutions originales. On garde donc précieusement les documents Word et on attend. La génération de l'epub.Produire son epub à partir de son document word: on suivra ce guide :http://www.ebooksgratuits.com/guides/methode_a_z_pour_creer_un_ebook.htm Des trois méthodes proposées, j'utilise celle qui consite à importer le document word dans calibre et et calibre se charge de converir en ePub. |