L’OCR où la magie de la reconnaissance de caractère

illustration de l'OCR

Un exemple de texte reconnu par un logiciel d’OCR (©wikicommons).

Il arrive parfois que l’on ait besoin d’une quinzaine de ligne perdue dans un fichier. Que faire ? Recopier ? Ça, c’est la méthode à papa, le travail à l’ancienne ! Aujourd’hui, il existe un acronyme magique, l’OCRQu’es aquò ? Il s’agit de l’Optical Character Recognition ou ROC (Reconnaissance Optique de Caractères). Des logiciels malins qui transforment une image, un fichier pdf en fichier texte. Il existe d’excellents logiciels, souvent onéreux, mais nous partirons de l’idée que le besoin d’OCR est plutôt marginal. Nous nous tournerons donc vers des solutions gratuites et de préférence en ligne. Le site IlovePdf est, à notre sens, la meilleure alternative. En effet, il fournit deux outils essentiels, l’un pour fusionner des fichiers pdf, tandis que l’autre propose l’opération inverse, la scission de pages. Une fois le fichier préparé, il ne reste plus qu’à convertir le fichier. Pas d’inscription en ligne, pas d’adresse de courriel. Un excellent moteur qui fournit un texte très propre, nécessitant très peu de retouches. En revanche, mais cela n’est pas étonnant, il n’est pas capable de reconnaître un multi-colonage et cela peut s’avérer ennuyeux.

Autre solution en ligne, I2OCR. Mêmes spécificités que IlovePDF, mais, en plus, il reconnait le multi-colonage. On peut lui soumettre soit une url, soit un fichier image. Cerise sur le gâteau, le résultat peut être directement ouvert dans un google doc.

Avec ces deux solutions, convertir à la volée une image ou un pdf en fichier-texte exploitable dans le cadre d’un cours devient un jeu d’enfant. Qu’il est loin le temps où cette manipulation demandait un bon scanner et surtout un excellent et onéreux logiciel d’OCR. Sans compter une bonne dose de patience pour relire et corriger le fichier obtenu.

Publicités

À propos Crémieu-Alcan
Professeur en collège, Historien moderniste, spécialiste de la forêt, formateur wordpress (niveau 2), mène une réflexion sur les usages pédagogiques du web 2.0. Co-anime la classe Médias du collège Dupaty (une classe PEM).

One Response to L’OCR où la magie de la reconnaissance de caractère

  1. Ping : OCR, mon sauveur, Où Comment scanner avec mon Ipad | Miscellanées

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Classe Média Dupaty

Une classe qui a la classe !

K Elle Aime

Pâtisser, cuisiner, voyager

Esclaves en Amérique

Récits autobiographiques d'anciens esclaves 1760-1865

@-ZAP

Journal d'une zapette du web azimutée

Elles et sport

Les femmes et le sport : l'harmonie gagnante

Les EPI médias de Dupaty

Les EPI médias, c'est immédiat !

livres d'un jour

Lire c'est bien, partager c'est mieux !

L'opticoindescurieux

[Le goût 100% "pigmenté" des arts & des sciences de CuriousCat]

%d blogueurs aiment cette page :