Crawling-Framework für Data Science

Lade...
Logo des Projekt
DOI der Originalpublikation
Projekttyp
angewandte Forschung
Projektbeginn
01.10.2015
Projektende
31.12.2016
Projektstatus
abgeschlossen
Projektkontakt
Projektmanager:in
Beteiligte
Beschreibung
Zusammenfassung
Ziel dieses Projekts ist die Entwicklung eines generischen Crawling-Frameworks, welches autonom im Internet nach einem definierten Webseitentyp sucht und wertvolle Informationen daraus extrahiert. Dieses Framework soll in Zukunft die Grundlage für verschiedene Anwendungsfälle bilden, weshalb ein starker Fokus auf dessen Erweiterbarkeit gelegt wird; auch auf andere Daten-Quellen als das Internet. Als Use-Case wird im bewilligten Projekt ein Job-Crawler implementiert, welcher das Web im DACH-Raum nach Stellenausschreibungen durchsucht.
Link
Während FHNW Zugehörigkeit erstellt
Hochschule
Hochschule für Technik
Institut
Institut für Data Science
Finanziert durch
Projektpartner
Finanziert durch
SAP Referenz
t396-0119-2
Schlagwörter
Fachgebiet (DDC)
600 - Technik, Medizin, angewandte Wissenschaften
Publikationen