Wiki PIREH

Des ressources pour utiliser le numérique en histoire

Outils pour utilisateurs

Outils du site


reconnaissance_automatique_de_texte

====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
reconnaissance_automatique_de_texte [2020/11/17 10:21]
Léo Dumont
reconnaissance_automatique_de_texte [2021/03/07 22:58] (Version actuelle)
Léo Dumont
Ligne 19: Ligne 19:
 Alternative à PDF Sam Alternative à PDF Sam
 http://​jpdftweak.sourceforge.net/​ http://​jpdftweak.sourceforge.net/​
 +
 +Beaucoup de ressources consacrées à l'​amélioration de la qualité des documents à OCRiser sont présentées dans la documentation de Tesseract : https://​tesseract-ocr.github.io/​tessdoc/​ImproveQuality.html
 +
 +Sur le découpage et l'​amélioration des pages à partir de documents reliés : https://​mzucker.github.io/​2016/​08/​15/​page-dewarping.html
  
 =====Les logiciels d'​OCR===== =====Les logiciels d'​OCR=====
Ligne 50: Ligne 54:
  
 Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://​www.free-ocr.com/​fr.html Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://​www.free-ocr.com/​fr.html
 +
 +==== Adobe Scan ====
 +
 +Logiciel d'OCR pour smartphone (iPhone et Android) très efficace développé par Adobe : https://​acrobat.adobe.com/​fr/​fr/​mobile/​scanner-app.html
  
 ==== Transkribus ==== ==== Transkribus ====
Ligne 57: Ligne 65:
 Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://​regis-schlagdenhauffen.eu/​wp-content/​uploads/​2018/​01/​Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://​regis-schlagdenhauffen.eu/​wp-content/​uploads/​2018/​01/​Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf
  
-==== Adobe Scan ====+==== OCR4all ​====
  
-Logiciel d'​OCR ​pour smartphone ​(iPhone et Androidtrès efficace développé par Adobe : https://acrobat.adobe.com/fr/fr/mobile/scanner-app.html+Logiciel d'​OCR ​//open source// spécialisé dans le traitement des imprimés anciens, permet la mise en place d'un flux de traitement ​(//​workflow//​combinant plusieurs outils au sein d'une même interface utilisable facilement ​: https://www.uni-wuerzburg.de/​en/​zpd/​ocr4all/​ 
 + 
 + 
 +===== Librairies d'OCR ===== 
 + 
 + 
 +==== Kraken ==== 
 + 
 +https://​github.com/mittagessen/kraken 
 + 
 +==== OCRopy ==== 
 + 
 +https://github.com/​tianzhi0549/​ocropy
  
 =====Correction et nettoyage des résultats de l'​OCR===== =====Correction et nettoyage des résultats de l'​OCR=====
reconnaissance_automatique_de_texte.1605604914.txt.gz · Dernière modification: 2020/11/17 10:21 par Léo Dumont