====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
reconnaissance_automatique_de_texte [2020/11/18 13:13] Léo Dumont |
reconnaissance_automatique_de_texte [2021/03/07 22:58] (Version actuelle) Léo Dumont |
||
---|---|---|---|
Ligne 19: | Ligne 19: | ||
Alternative à PDF Sam | Alternative à PDF Sam | ||
http://jpdftweak.sourceforge.net/ | http://jpdftweak.sourceforge.net/ | ||
+ | |||
+ | Beaucoup de ressources consacrées à l'amélioration de la qualité des documents à OCRiser sont présentées dans la documentation de Tesseract : https://tesseract-ocr.github.io/tessdoc/ImproveQuality.html | ||
+ | |||
+ | Sur le découpage et l'amélioration des pages à partir de documents reliés : https://mzucker.github.io/2016/08/15/page-dewarping.html | ||
=====Les logiciels d'OCR===== | =====Les logiciels d'OCR===== |