4 outils d'OCR en ligne gratuits mis à l'épreuve

4 outils d'OCR en ligne gratuits mis à l'épreuve

Si vous souhaitez convertir un texte imprimé en texte numérique que vous pouvez copier, coller, modifier et rechercher, vous devrez utiliser des scanners à reconnaissance optique de caractères (OCR).





Lorsque vous choisissez de numériser ou de prendre une photo d'un document, celui-ci sera enregistré dans un format tel que JPEG ou PDF. Logiciel d'OCR peut alors reconnaître les lettres et les chiffres contenus dans ces documents et les convertir en un fichier PDF interrogeable ou en un fichier que vous pouvez modifier dans des programmes tels que Microsoft Word.





Le problème est que certains scanners OCR fonctionnent beaucoup mieux que d'autres, le meilleur étant assez lourd pour le portefeuille.





Omnipage18, par exemple, coûte 150 $, mais est particulièrement efficace pour reconnaître différentes langues. Adobe Acrobat Pro DC coûte 400 $, mais a une précision incroyable. ABBYY FineReader coûte 150 $, mais est fantastique pour convertir des documents tels que des magazines et des brochures en texte consultable. Nous testerons l'offre en ligne d'ABBYY plus loin dans cet article.

Cependant, si vous recherchez des alternatives gratuites que vous pouvez Télécharger et utiliser sous Windows ou OS X, vous devriez essayer ces outils OCR . Mais si vous préférez utiliser un gratuit, en ligne Outil OCR, continuez à lire, car nous avons essayé les premiers, avec les résultats ci-dessous.



Le test

Il semble que la plupart des gens utilisent maintenant leurs smartphones pour effectuer leur numérisation à leur place, j'ai décidé d'utiliser L'application Scannable d'Evernote (Gratuit sur iOS et Android). J'ai scanné la première page de Richard Dawkin Ascension du mont improbable , pour voir quels résultats nous pourrions obtenir avec un formatage très basique. J'ai aussi scanné une page de Tim Ferriss Le chef des 4 heures pour essayer les scanners avec un formatage un peu plus compliqué. J'ai enregistré chacun de ces fichiers au format PDF.

Ces documents ont ensuite été passés en revue certains des meilleurs outils OCR en ligne supposés pour voir à quel point ils se sont comportés.





OCR en ligne gratuit [N'est plus disponible]

Heureusement, aucune inscription n'est requise pour utiliser l'OCR en ligne gratuit. Et j'ai été doublement impressionné quand j'ai vu leur revendication de conserver la mise en forme et la mise en page de mon document.

Le site prétend pouvoir prendre en charge les fichiers PDF, GIF, BMP, JPEG, TIFF et PNG en entrée. Les sorties peuvent être soit DOC, un document texte PDF, RTF et TXT. Malheureusement, je n'ai pas pu savoir s'ils avaient une limite de taille de fichier.





Document de base au format PDF

Converti absolument parfaitement. Il n'y a plus grand chose à dire ! Nous partons pour un très bon départ.

Document de base au DOC

Les mots réels semblent s'être parfaitement convertis, à l'exception du 'quant' de 'Mount Rushmore' qui devient en quelque sorte AWOL. Le formatage est une autre histoire, cependant. De nombreuses virgules ont été remplacées par des traits de soulignement et des espaces aléatoires ont été insérés à des endroits dans le document. Lorsque vous verrez plus tard comment le logiciel premium s'est comporté dans ce test, ce n'est pas un mauvais effort du tout .

Document complexe en PDF

Document complexe vers DOC

Cette fois, la conversion n'a pris que 10 secondes, le texte étant à nouveau converti avec une précision d'environ 95 %. Il y avait d'étranges problèmes d'espacement et le logiciel avait du mal à convertir la police en haut à droite du document et manquait quelques caractères ici et là.

Verdict

i2OCR

i2OCR fait des affirmations impressionnantes. L'outil reconnaît plus de 60 langues, peut gérer les mises en page multi-colonnes (en supprimant le formatage), n'a pas de limite de taille de fichier, peut convertir les fichiers téléchargés et à partir d'URL. Et vous n'avez pas non plus besoin de vous inscrire pour utiliser cet outil.

Le service fonctionne en extrayant simplement le texte de votre image, puis en produisant du texte non formaté. Vous pouvez corriger rapidement toute erreur dans la vue côte à côte, avant de copier le texte dans d'autres programmes ou de le télécharger au format DOC, PDF ou HTML.

Remarque : lorsque j'ai essayé de télécharger mes documents PDF, ceux-ci ont été rejetés par i2OCR, j'ai donc dû les convertir en JPEG (en prenant une capture d'écran d'eux, puis en téléchargeant les fichiers).

Document de base en texte brut

Document complexe en texte brut

La majorité du texte a été convertie sans trop de fautes, à part le titre et la recette en haut à droite, qui étaient illisibles pour cet outil. La façon dont les colonnes ont été converties en texte brut était loin d'être idéale. Si vous voulez rendre cette conversion réalisable, il faudrait beaucoup de temps pour réorganiser les lignes en phrases cohérentes.

Verdict

OCR en ligne

L'OCR en ligne prend actuellement en charge 46 langues différentes et peut convertir des fichiers PDF, JPG, BMP, TIFF et GIF au format Word, Excel ou texte brut. Le site affirme que « les documents convertis ressemblent exactement à l'original – tableaux, colonnes et graphiques ».

La version que vous pouvez utiliser sans vous inscrire vous permet de convertir jusqu'à 15 images par heure (limite de 5 Mo). Si vous créez un compte, vous pouvez acheter plus de pages en plus de cette limite, tout en pouvant également convertir des documents de plusieurs pages et des archives ZIP.

Document de base au DOC

Le document de base converti parfaitement en dehors du chiffre romain je ne pas être ramassé. Comme le site l'avait promis, le formatage était exactement comme dans le livre. Bravo pour cet outil.

Document complexe vers DOC

Après avoir été déçu par les outils OCR précédents pour convertir le document complexe, j'ai été massivement impressionné par l'OCR en ligne. La mise en page était presque parfaite, comme vous pouvez le voir ci-dessus. Encore une fois, la recette n'a pas été très bien reprise, mais toute autre erreur mineure était négligeable.

Verdict

Des résultats absolument fantastiques de l'OCR en ligne. Le seul inconvénient que je vois est qu'il n'y a aucun moyen de télécharger les documents convertis au format PDF, car les formats de sortie mentionnés incluent uniquement DOCX, XLSX et TXT.

ABBYY FineReader Online (essai de 10 pages)

Comme mentionné précédemment, ABBYY est l'un des leaders du marché des logiciels d'OCR, coûtant environ 150 $ pour son programme complet téléchargeable. Ils offrent un Essai gratuit de 10 pages pour leur outil en ligne, cependant (inscription requise). Pour un abonnement de 5 $, leur outil en ligne vous permettra de convertir 200 pages chaque mois.

Les fichiers acceptés peuvent aller jusqu'à 100 Mo, dans l'un de ces formats : PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP et PNG. ABBYY reconnaît également près de 200 langues. Les sorties sont particulièrement impressionnantes, avec un choix entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 et EPUB.

Vous pouvez même essayer quelques fonctionnalités BETA pendant votre essai. La première est la possibilité de traduire votre document dans une autre langue. L'autre consiste à exporter votre document converti vers votre compte de stockage cloud, que ce soit Dropbox, Google Drive, Evernote, Microsoft OneDrive ou Box.

Document de base vers DOCX

Document complexe vers DOCX

Une fois converti, il y avait très peu de défauts dans le texte du document (à part l'OCR qui luttait à nouveau avec la police de cette recette !), mais la mise en forme laissait beaucoup à désirer.

Les trois colonnes occupaient en quelque sorte deux pages, la colonne centrale seul apparaissant sur la deuxième page. Si tu voulais vraiment faire quoi que ce soit avec ce document converti, vous finiriez par vous arracher les cheveux.

Document de base au format PDF

Document complexe en PDF

Verdict

Le résultat final

Si, comme la plupart des gens, vous cherchez simplement à numériser quelques articles de magazines et des factures de ménage, vous n'aurez pas besoin de modifier ces documents. Par conséquent, la conversion directe en PDF vous conviendra, car vous pourrez toujours rechercher ces documents. Pour cela, Free Online OCR était certainement le meilleur outil gratuit que nous ayons testé. Cela étant dit, si vous êtes prêt à payer 5 $ par mois pour une quasi-perfection, FineReader en ligne d'ABBYY était un peu plus précis.

En ce qui concerne la conversion de documents au format DOC, nous n'avons pas réussi à trouver de solution parfaite, mais les meilleurs résultats sont de loin OCR en ligne . La conversion n'était pas parfaite, mais l'intégrité du formatage était en grande partie intacte et les erreurs étaient négligeables. Lorsque nous comparons ces résultats à l'offre « premium » d'ABBYY, vous ne pouvez qu'être très impressionné.

Nous n'avons pas inclus les capacités OCR de Google Drive dans cet article ; un peu pour l'universalité de Google, mais plus pour le fait que nous voulions tester quelques autres services OCR en ligne gratuits.

À vous de jouer : quels autres outils d'OCR en ligne recommanderiez-vous à nos lecteurs ? Et qu'avez-vous essayé que vous n'utiliseriez plus jamais ?

Partager Partager Tweeter E-mail Guide du débutant pour animer un discours

Animer un discours peut être un défi. Si vous êtes prêt à commencer à ajouter du dialogue à votre projet, nous allons décomposer le processus pour vous.

que faire lorsque le paquet amazon est manquant
Lire la suite Rubriques connexes
  • l'Internet
  • Productivité
  • Conversion de fichiers
  • OCR
A propos de l'auteur Rob Rossignol(272 articles publiés)

Rob Nightingale est diplômé en philosophie de l'Université de York, au Royaume-Uni. Il a travaillé en tant que responsable des médias sociaux et consultant pendant plus de cinq ans, tout en donnant des ateliers dans plusieurs pays. Au cours des deux dernières années, Rob a également été rédacteur technologique, responsable des médias sociaux et rédacteur en chef de la newsletter de MakeUseOf. Vous le trouverez généralement en train de parcourir le monde, d'apprendre le montage vidéo et d'expérimenter la photographie.

Plus de Rob Nightingale

Abonnez-vous à notre newsletter

Rejoignez notre newsletter pour des conseils techniques, des critiques, des ebooks gratuits et des offres exclusives !

Cliquez ici pour vous abonner