L’OCR où la magie de la reconnaissance de caractère

illustration de l'OCR

Un exemple de texte reconnu par un logiciel d’OCR (©wikicommons).

Il arrive parfois que l’on ait besoin d’une quinzaine de ligne perdue dans un fichier. Que faire ? Recopier ? Ça, c’est la méthode à papa, le travail à l’ancienne ! Aujourd’hui, il existe un acronyme magique, l’OCRQu’es aquò ? Il s’agit de l’Optical Character Recognition ou ROC (Reconnaissance Optique de Caractères). Des logiciels malins qui transforment une image, un fichier pdf en fichier texte. Il existe d’excellents logiciels, souvent onéreux, mais nous partirons de l’idée que le besoin d’OCR est plutôt marginal. Nous nous tournerons donc vers des solutions gratuites et de préférence en ligne. Le site IlovePdf est, à notre sens, la meilleure alternative. En effet, il fournit deux outils essentiels, l’un pour fusionner des fichiers pdf, tandis que l’autre propose l’opération inverse, la scission de pages. Une fois le fichier préparé, il ne reste plus qu’à convertir le fichier. Pas d’inscription en ligne, pas d’adresse de courriel. Un excellent moteur qui fournit un texte très propre, nécessitant très peu de retouches. En revanche, mais cela n’est pas étonnant, il n’est pas capable de reconnaître un multi-colonage et cela peut s’avérer ennuyeux.

Autre solution en ligne, I2OCR. Mêmes spécificités que IlovePDF, mais, en plus, il reconnait le multi-colonage. On peut lui soumettre soit une url, soit un fichier image. Cerise sur le gâteau, le résultat peut être directement ouvert dans un google doc.

Avec ces deux solutions, convertir à la volée une image ou un pdf en fichier-texte exploitable dans le cadre d’un cours devient un jeu d’enfant. Qu’il est loin le temps où cette manipulation demandait un bon scanner et surtout un excellent et onéreux logiciel d’OCR. Sans compter une bonne dose de patience pour relire et corriger le fichier obtenu.

À propos Crémieu-Alcan
Professeur en collège, Docteur en Histoire. Travaille sur les usages pédagogiques du web 2.0. Anime la classe Médias du collège Dupaty (une classe PEM) Site Perso : miscellanees33.wordpress.com, Les100livres.wordpress.com

One Response to L’OCR où la magie de la reconnaissance de caractère

  1. Ping: OCR, mon sauveur, Où Comment scanner avec mon Ipad | Miscellanées

Laisser un commentaire