Wiki PIREH

Des ressources pour utiliser le numérique en histoire

Outils pour utilisateurs

Outils du site


Panneau latéral

utiliser_les_expressions_regulieres_pour_creer_son_corpus

====A quoi servent les expressions régulières ?==== Les expressions régulières (ou expressions rationelles, ou //regex//, de l'anglais //regular expressions//) permettent de rechercher (et éventuellement de remplacer) des séquences de texte correspondant à un motif abstrait, et non à une suite de mots ou de caractères précise. Par exemple, dans le texte suivant : //Après avoir vaincu Marc Antoine à la bataille navale d'Actium en septembre 31 av. J.C., Auguste devient seul détenteur du pouvoir.\\ Il meurt après 76 ans de règne en 14 ap. J.C.// L'expression régulière **\d+ (av\. J\.C\.|ap\. J\.C\.)** trouvera les dates "31 av. J.C." et "14 ap. J.C.", et **^\w+** trouvera les mots en tête de ligne, "Après" et "Il". \\ ====Ressources en ligne pour se former aux expressions régulières==== Beaucoup de sites sur Internet traitent des expressions régulières, peu importe si ils se concentrent sur un logiciel ou un langage de programmation en particulier.\\ Pour débuter, voir ce [[http://blog.lucaswillems.com/772/tutoriel-expressions-regulieres-regex|tutoriel]].\\ Dans un second temps, le site [[http://www.regular-expressions.info/|Regular-expressions.info]] propose des informations exhaustives, en anglais.\\ Enfin, le site [[http://regexpal.com/|RegExPal.com]], très utile, permet de tester facilement des expressions régulières. Citons également : [[http://www.regexr.com/]] \\ Pour s'initier aux expressions régulières : https://github.com/zeeshanu/learn-regex/blob/master/README-fr.md Autre tutoriel d'introduction aux expressions régulières pour les historiens-nes : https://programminghistorian.org/fr/lecons/comprendre-les-expressions-regulieres ====Logiciels gratuits permettant d'utiliser les expressions régulières==== ===LibreOffice (Windows, Mac OS et Linux)=== [[https://www.libreoffice.org/|Site web de LibreOffice]] **Recherche de nombres dans LibreOffice :** {{:regexcorpus..ex_regex_libreoffice.png?direct&500|}} \\ ===NotePad++ (Windows)=== [[http://notepad-plus-plus.org/fr/|Site web de NotePad++]] **Rajout de guillemets à l'intérieur de balises dans NotePad++ :** {{:regexcorpus:ex_regex_notepad.png?direct&500|}} \\ ===TextWrangler (Mac OS)=== [[http://www.barebones.com/products/textwrangler/|Site web de l'éditeur]] **Recherche des spécificités dans un tableau lexical de Lexico3 avec TextWrangler :** {{:regexcorpus..ex_regex_textwrangler.png?500|}}

utiliser_les_expressions_regulieres_pour_creer_son_corpus.txt · Dernière modification: 2020/03/13 11:25 par Léo Dumont