====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
quelques_ressources [2019/11/25 15:35] Léo Dumont |
quelques_ressources [2021/07/06 03:09] (Version actuelle) Octave Julien Rajout cours Boelaert et Ollion |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
==== Quelques ressources ==== | ==== Quelques ressources ==== | ||
- | |||
- | Là plus qu'ailleurs, les évolutions sont très rapides. | ||
Il existe de nombreuses solutions pour récupérer des informations du web quand on ne sait pas programmer et de nombreuses sont propriétaires. Voici une liste non exhaustive : | Il existe de nombreuses solutions pour récupérer des informations du web quand on ne sait pas programmer et de nombreuses sont propriétaires. Voici une liste non exhaustive : | ||
Ligne 13: | Ligne 11: | ||
- https://github.com/fredericvergnaud/extractify | - https://github.com/fredericvergnaud/extractify | ||
- | Sur le plan du vocabulaire, vous devez rencontrer : | + | Le cours en ligne de Julien Boelaert et Étienne Ollion : [[https://www.css.cnrs.fr/strategies-numeriques/]]. Il offre une introduction à l'analyse de données sur le Web avec une introduction à R, au HTML, à la syntaxe XPath, aux expressions régulières et à Selenium. |
+ | |||
+ | Sur le vocabulaire : | ||
* Web scraping ([[https://fr.wikipedia.org/wiki/Web_scraping|Ici]]) | * Web scraping ([[https://fr.wikipedia.org/wiki/Web_scraping|Ici]]) | ||