Wiki PIREH

Des ressources pour utiliser le numérique en histoire

Outils pour utilisateurs

Outils du site


reconnaissance_automatique_de_texte

====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
reconnaissance_automatique_de_texte [2017/12/08 09:17]
Léo Dumont
reconnaissance_automatique_de_texte [2021/03/07 22:58] (Version actuelle)
Léo Dumont
Ligne 19: Ligne 19:
 Alternative à PDF Sam Alternative à PDF Sam
 http://​jpdftweak.sourceforge.net/​ http://​jpdftweak.sourceforge.net/​
 +
 +Beaucoup de ressources consacrées à l'​amélioration de la qualité des documents à OCRiser sont présentées dans la documentation de Tesseract : https://​tesseract-ocr.github.io/​tessdoc/​ImproveQuality.html
 +
 +Sur le découpage et l'​amélioration des pages à partir de documents reliés : https://​mzucker.github.io/​2016/​08/​15/​page-dewarping.html
  
 =====Les logiciels d'​OCR===== =====Les logiciels d'​OCR=====
Ligne 25: Ligne 29:
  
 Logiciel propriétaire d'OCR fonctionnant sur Windows et Mac : https://​www.abbyy.com/​fr-fr/​finereader/​ Logiciel propriétaire d'OCR fonctionnant sur Windows et Mac : https://​www.abbyy.com/​fr-fr/​finereader/​
 +Pour les étudiants en histoire de Paris 1, il est possible d'​utiliser ce logiciel sur certains postes. Contactez-nous directement en cas de besoin.
  
 Tutoriel pour l'​utilisation d'Abby FineReader sur le site de la MSH de Tours : http://​msh.univ-tours.fr/​sites/​default/​files/​oceriser.pdf Tutoriel pour l'​utilisation d'Abby FineReader sur le site de la MSH de Tours : http://​msh.univ-tours.fr/​sites/​default/​files/​oceriser.pdf
Ligne 48: Ligne 53:
 ==== FreeOCR ==== ==== FreeOCR ====
  
-Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://​www.free-ocr.com/​+Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://​www.free-ocr.com/​fr.html 
 + 
 +==== Adobe Scan ==== 
 + 
 +Logiciel d'OCR pour smartphone (iPhone et Android) très efficace développé par Adobe : https://​acrobat.adobe.com/​fr/​fr/​mobile/​scanner-app.html 
 + 
 +==== Transkribus ==== 
 + 
 +Plateforme d'OCR sur des textes manuscrits (nécessite la création préalable de données d'​apprentissage) : https://​transkribus.eu/​Transkribus/​ 
 + 
 +Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://​regis-schlagdenhauffen.eu/​wp-content/​uploads/​2018/​01/​Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf 
 + 
 +==== OCR4all ==== 
 + 
 +Logiciel d'OCR //open source// spécialisé dans le traitement des imprimés anciens, permet la mise en place d'un flux de traitement (//​workflow//​) combinant plusieurs outils au sein d'une même interface utilisable facilement : https://​www.uni-wuerzburg.de/​en/​zpd/​ocr4all/​ 
 + 
 + 
 +===== Librairies d'OCR ===== 
 + 
 + 
 +==== Kraken ==== 
 + 
 +https://​github.com/​mittagessen/​kraken 
 + 
 +==== OCRopy ==== 
 + 
 +https://​github.com/​tianzhi0549/​ocropy
  
 =====Correction et nettoyage des résultats de l'​OCR===== =====Correction et nettoyage des résultats de l'​OCR=====
reconnaissance_automatique_de_texte.1512721039.txt.gz · Dernière modification: 2017/12/08 09:17 par Léo Dumont