====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
reconnaissance_automatique_de_texte [2018/01/30 15:25] Léo Dumont [Abby FineReader] |
reconnaissance_automatique_de_texte [2021/03/07 22:58] (Version actuelle) Léo Dumont |
||
---|---|---|---|
Ligne 19: | Ligne 19: | ||
Alternative à PDF Sam | Alternative à PDF Sam | ||
http://jpdftweak.sourceforge.net/ | http://jpdftweak.sourceforge.net/ | ||
+ | |||
+ | Beaucoup de ressources consacrées à l'amélioration de la qualité des documents à OCRiser sont présentées dans la documentation de Tesseract : https://tesseract-ocr.github.io/tessdoc/ImproveQuality.html | ||
+ | |||
+ | Sur le découpage et l'amélioration des pages à partir de documents reliés : https://mzucker.github.io/2016/08/15/page-dewarping.html | ||
=====Les logiciels d'OCR===== | =====Les logiciels d'OCR===== | ||
Ligne 49: | Ligne 53: | ||
==== FreeOCR ==== | ==== FreeOCR ==== | ||
- | Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://www.free-ocr.com/ | + | Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://www.free-ocr.com/fr.html |
+ | |||
+ | ==== Adobe Scan ==== | ||
+ | |||
+ | Logiciel d'OCR pour smartphone (iPhone et Android) très efficace développé par Adobe : https://acrobat.adobe.com/fr/fr/mobile/scanner-app.html | ||
==== Transkribus ==== | ==== Transkribus ==== | ||
Ligne 56: | Ligne 64: | ||
Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://regis-schlagdenhauffen.eu/wp-content/uploads/2018/01/Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf | Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://regis-schlagdenhauffen.eu/wp-content/uploads/2018/01/Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf | ||
+ | |||
+ | ==== OCR4all ==== | ||
+ | |||
+ | Logiciel d'OCR //open source// spécialisé dans le traitement des imprimés anciens, permet la mise en place d'un flux de traitement (//workflow//) combinant plusieurs outils au sein d'une même interface utilisable facilement : https://www.uni-wuerzburg.de/en/zpd/ocr4all/ | ||
+ | |||
+ | |||
+ | ===== Librairies d'OCR ===== | ||
+ | |||
+ | |||
+ | ==== Kraken ==== | ||
+ | |||
+ | https://github.com/mittagessen/kraken | ||
+ | |||
+ | ==== OCRopy ==== | ||
+ | |||
+ | https://github.com/tianzhi0549/ocropy | ||
=====Correction et nettoyage des résultats de l'OCR===== | =====Correction et nettoyage des résultats de l'OCR===== |