Datenanalyse: Web Scraping mit Python
Web Scraping mit Python Social-Media-Plattformen, Onlineshops, Börsenkurse, Preisvergleiche, Produktbewertungen, Sportstatistiken: Solche Websites bergen eine Fülle an Informationen, die für uns relevant sein können.
In zahlreichen Projekten benötigen wir Zugriff auf Daten aus verschiedenen Quellen im Internet. Sei es für umfangreiche Machine-Learning-Projekte, die Aggregation von Produkttestergebnissen und Preisdaten zur Unterstützung von Kaufentscheidungen, für Wettbewerbsanalysen, Marktstudien, Preisvergleiche oder zur Erstellung von Datengrundlagen für weitere Analysen und Entscheidungen.
Je größer das Datenvolumen und die Anzahl der unterschiedlichen Websites als Datenquellen sind, umso aufwendiger ist die Datenakquise. Die manuelle Beschaffung und Zusammenführung der benötigten Informationen aus diversen Websites ist oft mühsam und zeitintensiv. Wir erklären in einer mehrteiligen Serie, wie man mit Web Scraping Daten von einer Webseite extrahiert, sammelt und in verschiedene nützliche Formate exportiert.