Wiki PIREH

Des ressources pour utiliser le numérique en histoire

Outils pour utilisateurs

Outils du site


reconnaissance_automatique_de_texte

====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
reconnaissance_automatique_de_texte [2018/01/30 15:27]
Léo Dumont [FreeOCR]
reconnaissance_automatique_de_texte [2021/03/07 22:58] (Version actuelle)
Léo Dumont
Ligne 19: Ligne 19:
 Alternative à PDF Sam Alternative à PDF Sam
 http://​jpdftweak.sourceforge.net/​ http://​jpdftweak.sourceforge.net/​
 +
 +Beaucoup de ressources consacrées à l'​amélioration de la qualité des documents à OCRiser sont présentées dans la documentation de Tesseract : https://​tesseract-ocr.github.io/​tessdoc/​ImproveQuality.html
 +
 +Sur le découpage et l'​amélioration des pages à partir de documents reliés : https://​mzucker.github.io/​2016/​08/​15/​page-dewarping.html
  
 =====Les logiciels d'​OCR===== =====Les logiciels d'​OCR=====
Ligne 50: Ligne 54:
  
 Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://​www.free-ocr.com/​fr.html Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://​www.free-ocr.com/​fr.html
 +
 +==== Adobe Scan ====
 +
 +Logiciel d'OCR pour smartphone (iPhone et Android) très efficace développé par Adobe : https://​acrobat.adobe.com/​fr/​fr/​mobile/​scanner-app.html
  
 ==== Transkribus ==== ==== Transkribus ====
Ligne 56: Ligne 64:
  
 Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://​regis-schlagdenhauffen.eu/​wp-content/​uploads/​2018/​01/​Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://​regis-schlagdenhauffen.eu/​wp-content/​uploads/​2018/​01/​Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf
 +
 +==== OCR4all ====
 +
 +Logiciel d'OCR //open source// spécialisé dans le traitement des imprimés anciens, permet la mise en place d'un flux de traitement (//​workflow//​) combinant plusieurs outils au sein d'une même interface utilisable facilement : https://​www.uni-wuerzburg.de/​en/​zpd/​ocr4all/​
 +
 +
 +===== Librairies d'OCR =====
 +
 +
 +==== Kraken ====
 +
 +https://​github.com/​mittagessen/​kraken
 +
 +==== OCRopy ====
 +
 +https://​github.com/​tianzhi0549/​ocropy
  
 =====Correction et nettoyage des résultats de l'​OCR===== =====Correction et nettoyage des résultats de l'​OCR=====
reconnaissance_automatique_de_texte.1517322422.txt.gz · Dernière modification: 2018/01/30 15:27 par Léo Dumont