Doc /

OCRAvecLinux

Noter qu'importer le document dans Google drive puis clic droit, ouvrir dans google docs donne de très bons résultats (meilleurs que tesseract)

Le principal programme de reconnaissance de caractères sous Linux est "Tesseract".

tesseract ~/<nom_de_l_image.tif> <nom_du_fichier_de_sortie_sans_l_extension> -l fra

for i in *.jpg ; do tesseract -l fra $i $i; done;

-l eng (pour l'anglais)