====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
|
quelques_ressources [2019/11/25 15:35] Léo Dumont |
quelques_ressources [2021/07/06 03:09] (Version actuelle) Octave Julien Rajout cours Boelaert et Ollion |
||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| ==== Quelques ressources ==== | ==== Quelques ressources ==== | ||
| - | |||
| - | Là plus qu'ailleurs, les évolutions sont très rapides. | ||
| Il existe de nombreuses solutions pour récupérer des informations du web quand on ne sait pas programmer et de nombreuses sont propriétaires. Voici une liste non exhaustive : | Il existe de nombreuses solutions pour récupérer des informations du web quand on ne sait pas programmer et de nombreuses sont propriétaires. Voici une liste non exhaustive : | ||
| Ligne 13: | Ligne 11: | ||
| - https://github.com/fredericvergnaud/extractify | - https://github.com/fredericvergnaud/extractify | ||
| - | Sur le plan du vocabulaire, vous devez rencontrer : | + | Le cours en ligne de Julien Boelaert et Étienne Ollion : [[https://www.css.cnrs.fr/strategies-numeriques/]]. Il offre une introduction à l'analyse de données sur le Web avec une introduction à R, au HTML, à la syntaxe XPath, aux expressions régulières et à Selenium. |
| + | |||
| + | Sur le vocabulaire : | ||
| * Web scraping ([[https://fr.wikipedia.org/wiki/Web_scraping|Ici]]) | * Web scraping ([[https://fr.wikipedia.org/wiki/Web_scraping|Ici]]) | ||