Wiki PIREH

====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.

--- reconnaissance_automatique_de_texte [2017/12/08 09:08]
Léo Dumont
+++ reconnaissance_automatique_de_texte [2021/03/07 22:58] (Version actuelle)
Léo Dumont
@@ Ligne 19: / Ligne 19: @@
 Alternative à PDF Sam
 http://jpdftweak.sourceforge.net/
+Beaucoup de ressources consacrées à l'amélioration de la qualité des documents à OCRiser sont présentées dans la documentation de Tesseract : https://tesseract-ocr.github.io/tessdoc/ImproveQuality.html
+Sur le découpage et l'amélioration des pages à partir de documents reliés : https://mzucker.github.io/2016/08/15/page-dewarping.html
 =====Les logiciels d'OCR=====
@@ Ligne 25: / Ligne 29: @@
 Logiciel propriétaire d'OCR fonctionnant sur Windows et Mac : https://www.abbyy.com/fr-fr/finereader/
+Pour les étudiants en histoire de Paris 1, il est possible d'utiliser ce logiciel sur certains postes. Contactez-nous directement en cas de besoin.
 Tutoriel pour l'utilisation d'Abby FineReader sur le site de la MSH de Tours : http://msh.univ-tours.fr/sites/default/files/oceriser.pdf
@@ Ligne 41: / Ligne 46: @@
 Reconnaissance optique de tableau pour conversion vers fichiers tabulaires (CSV, xls, ods...)
  http://tabula.technology/
+==== Antigrapheus ====
+Service d'OCR en ligne pour le latin et le grec ancien : https://dcthree.github.io/antigrapheus/
+==== FreeOCR ====
+Service d'OCR en ligne pour langues contemporaines basé sur Tesseract : http://www.free-ocr.com/fr.html
+==== Adobe Scan ====
+Logiciel d'OCR pour smartphone (iPhone et Android) très efficace développé par Adobe : https://acrobat.adobe.com/fr/fr/mobile/scanner-app.html
+==== Transkribus ====
+Plateforme d'OCR sur des textes manuscrits (nécessite la création préalable de données d'apprentissage) : https://transkribus.eu/Transkribus/
+Introduction à Transkribus mise en ligne par Régis Schlagdenhauffen : http://regis-schlagdenhauffen.eu/wp-content/uploads/2018/01/Comment-utiliser-Transkribus-%E2%80%93-en-10-%C3%A9tapes-ou-moins.pdf
+==== OCR4all ====
+Logiciel d'OCR //open source// spécialisé dans le traitement des imprimés anciens, permet la mise en place d'un flux de traitement (//workflow//) combinant plusieurs outils au sein d'une même interface utilisable facilement : https://www.uni-wuerzburg.de/en/zpd/ocr4all/
+===== Librairies d'OCR =====
+==== Kraken ====
+https://github.com/mittagessen/kraken
+==== OCRopy ====
+https://github.com/tianzhi0549/ocropy
 =====Correction et nettoyage des résultats de l'OCR=====

Wiki PIREH

Outils pour utilisateurs

Outils du site

Outils de la page