====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
quelques_ressources [2015/12/04 04:57] Stéphane Lamassé |
quelques_ressources [2021/07/06 03:09] (Version actuelle) Octave Julien Rajout cours Boelaert et Ollion |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
==== Quelques ressources ==== | ==== Quelques ressources ==== | ||
- | Là plus qu'ailleurs, les évolutions sont très rapides. | + | Il existe de nombreuses solutions pour récupérer des informations du web quand on ne sait pas programmer et de nombreuses sont propriétaires. Voici une liste non exhaustive : |
- | Il existe de nombreuses solutions pour récupérer des informations du web quand on ne sait pas programmer et de nombreuses sont propriétaires. Voici une liste non exhaustive: | + | |
- extension WebScraper pour Chromium [[http://webscraper.io/|Ici]] | - extension WebScraper pour Chromium [[http://webscraper.io/|Ici]] | ||
- Kimono [[https://www.kimonolabs.com/|Ici]] | - Kimono [[https://www.kimonolabs.com/|Ici]] | ||
- import.io [[presentation_d_import.io|Ici]] | - import.io [[presentation_d_import.io|Ici]] | ||
- winAutomation [[http://www.winautomation.com/|Ici]] | - winAutomation [[http://www.winautomation.com/|Ici]] | ||
+ | - Screen scraper [[http://www.screen-scraper.com/|Ici]] | ||
+ | - OutWitHub [[https://www.outwit.com/products/hub/|Ici]] | ||
+ | - https://github.com/fredericvergnaud/extractify | ||
+ | Le cours en ligne de Julien Boelaert et Étienne Ollion : [[https://www.css.cnrs.fr/strategies-numeriques/]]. Il offre une introduction à l'analyse de données sur le Web avec une introduction à R, au HTML, à la syntaxe XPath, aux expressions régulières et à Selenium. | ||
- | Sur le plan du vocabulaire, vous devez rencontrer : | + | Sur le vocabulaire : |
* Web scraping ([[https://fr.wikipedia.org/wiki/Web_scraping|Ici]]) | * Web scraping ([[https://fr.wikipedia.org/wiki/Web_scraping|Ici]]) | ||