Exploring internet with Hyphe
Introduction by OpenMethods editor (Florian Cafiero):
Given in French by Mathieu Jacomy – also known for his work on Gephi, this seminar presentation gives a substantial introduction to Hyphe, an open-source web crawler designed by a team of the Sciences Po Medialab in Paris. Specifically devised for the researchers’ use, Hyphe helps collecting and curating a corpus of web pages, through an easy to handle interface.
Le web c’est grand, surtout vers le fond. Et ce n’est pas très organisé, même si ce n’est pas non plus le chaos. Quelle est la structure du web, et comment s’y orienter ? Question plus difficile encore, comment trouver et identifier l’information pertinente sans amasser de téraoctets inutiles ? Le web nous oppose des défis à la fois méthodologiques et technologiques. Le médialab de Sciences Po a développé HYPHE, un robot amasseur de données web aussi appelé «crawler», ajusté aux besoins de la recherche en sciences sociales. Il s’adresse aux sociologues qui veulent investiguer le web comme terrain d’enquête qualitative et en tirer des indicateurs quantitatifs. S’appuyant sur le modèle du web «en couches», il guide son utilisateur pour construire, itération après itération, un corpus de ressources et/ou d’acteurs.