OCR, mon sauveur, Où Comment scanner avec mon Ipad

Une secrétaire devant sa photocopieuse (Mario Klingemann, sur Flickr).

Une secrétaire devant sa photocopieuse (Mario Klingemann, sur Flickr).

Précédemment, je vous proposais quelques solutions d’OCR en ligne pour transformer quelques phrases en fichier texte. Il peut cependant être plus profitable d’investir dans une solution pérenne de reconnaissance de caractère,  d’autant qu’il est loin le temps où il fallait un bon gros scanner pour -seulement- tenter l’opération. De nombreuses applications utilisent l’appareil photo de l’iPad ou de l’iPhone. Pour les utilisateurs du génial Evernote, il y a Scannable, un scanner qui permet de poster des cartes de visite, voire des petits textes sur Evernote. Ici, c’est la fonction numériser qui importe. L’OCR, c’est le niveau suivant : transformer en fichier texte librement éditable un document papier pour pouvoir le modifier. Les amoureux de Microsoft© utiliseront son bloc-notes numérique, OneNotes, d’autant qu’un module d’OCR y a été greffé. OneNotes s’apparente à Evernote. Foin de ces produits hybrides, un pur OCR. Dans cette catégorie, j’aime bien l’application Prizmo3. Peu onéreuse, elle offre de multiples possibilités de scan, dont l’OCR. Des options permettent d’aider le logiciel à bien cerner le pavé de texte ou la colonne à traiter. D’autres options permettent d’améliorer le cliché avant que de faire mouliner le logiciel. Le résultat est assez époustouflant. Cuk.ch propose un banc d’essai très complet de cet outil. Il y a aussi ReadIris for Ipad. ReadIris est un pionnier de l’OCR, et il bénéficie à ce titre d’une expertise non négligeable. Son produit pour ipad est très complet. Il s’interface également avec certain de ses scanners portables, permettant de récupérer les scans à partir d’une carte sd. Et puis il y a Scanbot. Une application pour scanner tous les documents. Puis les sauvegarder dans le cloud (8 services accessibles). Et si l’on passe à la version pro, on change de monde ! Jugez-en plutôt. Les documents scannés peuvent être annotés, surlignés ou soulignés. Insuffisant ?Alors utilisez le module d’OCR.

Toutes ces applications sont relativement peu onéreuses. Comme d’habitude, il convient de réfléchir en amont à ses usages, avant de se décider. Comme souvent, il peut être judicieux non pas de chercher une panacée, mais d’en utiliser plusieurs.

 

L’OCR où la magie de la reconnaissance de caractère

illustration de l'OCR

Un exemple de texte reconnu par un logiciel d’OCR (©wikicommons).

Il arrive parfois que l’on ait besoin d’une quinzaine de ligne perdue dans un fichier. Que faire ? Recopier ? Ça, c’est la méthode à papa, le travail à l’ancienne ! Aujourd’hui, il existe un acronyme magique, l’OCRQu’es aquò ? Il s’agit de l’Optical Character Recognition ou ROC (Reconnaissance Optique de Caractères). Des logiciels malins qui transforment une image, un fichier pdf en fichier texte. Il existe d’excellents logiciels, souvent onéreux, mais nous partirons de l’idée que le besoin d’OCR est plutôt marginal. Nous nous tournerons donc vers des solutions gratuites et de préférence en ligne. Le site IlovePdf est, à notre sens, la meilleure alternative. En effet, il fournit deux outils essentiels, l’un pour fusionner des fichiers pdf, tandis que l’autre propose l’opération inverse, la scission de pages. Une fois le fichier préparé, il ne reste plus qu’à convertir le fichier. Pas d’inscription en ligne, pas d’adresse de courriel. Un excellent moteur qui fournit un texte très propre, nécessitant très peu de retouches. En revanche, mais cela n’est pas étonnant, il n’est pas capable de reconnaître un multi-colonage et cela peut s’avérer ennuyeux.

Autre solution en ligne, I2OCR. Mêmes spécificités que IlovePDF, mais, en plus, il reconnait le multi-colonage. On peut lui soumettre soit une url, soit un fichier image. Cerise sur le gâteau, le résultat peut être directement ouvert dans un google doc.

Avec ces deux solutions, convertir à la volée une image ou un pdf en fichier-texte exploitable dans le cadre d’un cours devient un jeu d’enfant. Qu’il est loin le temps où cette manipulation demandait un bon scanner et surtout un excellent et onéreux logiciel d’OCR. Sans compter une bonne dose de patience pour relire et corriger le fichier obtenu.

K Elle Aime

Pâtisser, cuisiner, voyager

Esclaves en Amérique

Récits autobiographiques d'anciens esclaves 1760-1865

@-ZAP

Journal d'une zapette du web azimutée

Elles et sport

Les femmes et le sport : l'harmonie gagnante

Les EPI médias de Dupaty

Les EPI médias, c'est immédiat !

livres d'un jour

Lire c'est bien, partager c'est mieux !

L'opticoindescurieux

[Le goût 100% "pigmenté" des arts & des sciences de CuriousCat]

Fantadys

parce que nos DYS sont parfois DYScrets, ou pleins de FANTAisie tous DYSfférents, parce qu'il faut se rendre DYSponible, souvent DYScuter et tout faire puissance DYS , parce que nos enfants sont tout simplement FANTAstiques !