germanyuksettings
Alle Python Schulungen

Schulung Web Scraping und Web-Crawler mit Python - Komplett

5 Tage / S2605

Schulungsformen

Offene Schulung


Inhouse-/Firmenschulung

  • 5 Tage - anpassbar
  • Termin nach Wunsch
  • Preis nach Angebot
  • In Ihrem Hause oder bei der GFU

Individualschulung

  • 5 Tage - anpassbar
  • Termin nach Wunsch
  • Preis nach Angebot
  • In Ihrem Hause oder bei der GFU

Beschreibung

Das World Wide Web enthält eine Vielzahl von Daten. Die Fähigkeit, die benötigten  Informationen daraus zu extrahieren, ist heutzutage für alle, die mit Daten arbeiten,  eine Notwendigkeit. Natürlich gibt es bereits viele Datensätze, die in aufbereiteten  Formaten zum Download angeboten werden, aber in vielen Fällen wird man die  Daten, die man benötigt, nicht so einfach finden. 
Oft liegen die Daten nämlich  unstrukturiert vor und nicht per se in einem maschinenlesbaren, bequemen Format.  Zum Beispiel alle Blogartikel in einem Blog, die einem gewissen Kriterium  entsprechen oder Preise von Artikeln in einem Webshop.
Webscraping setzt einen Schritt vor dem Data-Mining an und beschäftigt sich daher  weniger mit dem Pre-Prozessing und der Analyse der Daten als eher mit dem  Extrahieren von Rohdaten in ein maschinenlesbares Format, zum Beispiel einer CSV Datei oder einer Datenbank-Tabelle. Web Scraping ist also das Verfahren, Daten aus (vornehmlich) Webseiten zu  extrahieren. 
Web Crawling hingegen ist das Verfahren, viele Seiten einer  Hauptdomain einzulesen und zu durchsuchen. Damit lassen sich Webspider  programmieren, die zum Beispiel periodisch Webangebote durchforsten. Python, als einsteigerfreundliche und einfache Skript- und Programmiersprache,  bietet sich für diese Aufgabe an. Mit relativ wenigen Zeilen Code lässt sich schon oft  ein sehr gutes Ergebnis erzielen um zum Beispiel alle Katalogpreise in eine Excel Datei überführen. 

Auf der Suche nach einem anderen Python Training?

Schulungsziel

In diesem 5-tägigen Seminar erlernen Sie, wie Sie Rohdaten aus dem Web extrahieren und in ein Maschinenlesbares Format bringen können.
Python wird als einsteigerfreundliche und einfache Skript- und Programmiersprache eingesetzt und Ihnen beigebracht.

Details

Wer teilnehmen sollte

Dieses Seminar richtet sich an Entwickler, Data-Scientists, Machine Learner, Wissenschaftler, Marketing Experten und Analysten die das Web gezielt und effizient nach Informationen durchsuchen und diese Daten extrahieren wollen.
Grundlegende Python-Kenntnisse und OOP sind von Vorteil, aber kein Muss.

Ihre Schulung


Präsenz-Schulung

Online-Schulung
Lernmethode

Ausgewogene Mischung aus Theorie und Praxis

Wie auch bei unseren Präsenz-Seminaren: Ausgewogene Mischung aus Theorie und praktischen Übungen. Trainer durchgehend präsent.

Unterlagen

Seminarunterlagen oder Fachbuch zum Seminar inklusive, das man nach Rücksprache mit dem Trainer individuell auswählen kann.

Seminarunterlagen oder Fachbuch inklusive (per Post). Das Fachbuch wählt der Trainer passend zum Seminar aus - Ihren individuellen Buch-Wunsch berücksichtigen wir auf Nachfrage gerne.

Arbeitsplatz
PC/VMs für jeden Teilnehmer
Hochwertige und performante Hardware
Große, höhenverstellbare Bildschirme
Zugang zu Ihrem Firmennetz erlaubt
  • Online Meeting + Remote Zugriff auf persönlichen GFU-Schulungs-PC
  • Keine Installation auf dem eigenen PC notwendig
Lernumgebung


Neu aufgesetzte Systeme für jeden Kurs in Abstimmung mit dem Seminarleiter.

Arbeitsmaterialien

DIN A4 Block, Notizblock, Kugelschreiber, USB-Stick, Textmarker, Post-its

Teilnahmezertifikat

Die Teilnahmezertifikat inkl. Inhaltsverzeichnis wird Ihnen am Ende des Seminars ausgehändigt.

Die Teilnahmezertifikat inkl. Inhaltsverzeichnis wird Ihnen per Post zugesandt.


Präsenz-Schulung

Online-Schulung
Teilnehmendenzahl

min. 1, max. 8 Personen

Garantierte Durchführung

Ab 1 Teilnehmenden*

Schulungszeiten
5 Tage, 09:00 - 16:00 Uhr
Ort der Schulung
GFU Schulungszentrum oder Virtual Classroom
GFU Schulungszentrum
Am Grauen Stein 27
51105 Köln-Deutz

oder online im Virtual Classroom oder europaweit bei Ihnen als Inhouse-Schulung

Um ein optimales Raumklima zu gewährleisten, haben wir das Schulungszentrum mit 17 hochmodernen Trotec TAC V+ Luftreinigern ausgestattet. Diese innovative Filtertechnologie (H14 zertifiziert nach DIN EN1822) sorgt dafür, dass die Raumluft mehrfach pro Stunde umgewälzt wird und Schadstoffe zu 99.995% im HEPA-Filter abgeschieden und infektiöse Aerosole abgetötet werden.

Zusätzlich sind alle Räume mit CO2-Ampeln ausgestattet, um jederzeit eine hervorragende Luftqualität sicherzustellen.

Räumlichkeiten

Helle und modern ausgestattete Räume mit perfekter Infrastruktur

Bequem aus dem Homeoffice von überall

Preisvorteil

Dritter Mitarbeitende nimmt kostenfrei teil.

Eventuell anfallende Prüfungskosten für den dritten Teilnehmenden werden zusätzlich berechnet.

Hinweis: Um den Erfolg der Schulung zu gewährleisten, sollte auch der dritte Teilnehmende die erwarteten Vorkenntnisse mitbringen.

All-Inclusive

Gebäck, Snacks und Getränke ganztägig, Mittagessen im eigenen Restaurant, täglich 6 Menüs, auch vegetarisch

Eine Auswahl unserer Frühstücks-Snacks und Nervennahrungs-Highlights senden wir Ihnen mit den Seminarunterlagen per Post zu.

Barrierefreiheit

Das GFU-Schulungszentrum (Am Grauen Stein 27) ist barrierefrei

-
Rechnungsstellung

Erst nach dem erfolgreichen Seminar. Keine Vorkasse.

Stornierung

Kostenfrei bis zum Vortag des Seminars

Vormerken statt buchen

Sichern Sie sich unverbindlich Ihren Seminarplatz schon vor der Buchung - auch wenn Sie selbst nicht berechtigt sind zu buchen


Präsenz-Schulung

Online-Schulung
  • Eigener Shuttle-Service
  • Reservierte Parkplätze
  • Hotelreservierung
  • Technik-Sofort-Support

Inhalt

1.-3. Tag auch separat buchbar als: 
Web Scraping und Web-Crawler mit Python - Grundlagen

  • Ziele und Erwartungen der Teilnehmenden
    • Klärung individueller Lernziele und Erwartungen, um das Seminar so praxisnah und relevant wie möglich zu gestalten
  • Einrichten der Entwicklungsumgebung
    • Anlegen der Ordnerstruktur
    • Einrichten der IDE VSCode
    • Virtuelle Umgebung und installieren der nötigen Software
  • Grundlagen
    • Python Wiederholung (Datentypen, Funktionen, Generatoren, OOP)
    • Einführung in Pandas
    • Einführung HTTP, HTML, CSS und DOM
    • Einführung JSON
    • Client-Server Architektur
    • Was ist denn eigentlich Scraping genau?
    • Webscraping ist NICHT Data-Mining
  • Web Scraping, erste Schritte
    • ethische und rechtliche Grenzen, Drosselung
    • die robots.txt Datei
    • Installieren von Beautiful Soup und der requests Bibliothek
    • Parsen einer einfachen Webseite 
    • Medien, Texte, Bilder und URLs extrahieren
    • Speichern der Informationen in einer CSV-Datei
    • Speichern der Informationen in einer Json-Datei
    • Speichern in einer Datenbank
    • Probleme erkennen: dynamische Webseiten, JavaScript, das DOM
  • HTML Vertiefung
    • Attribute, verschachtelte Strukturen
    • HTML als Baumstruktur, Knoten, Kanten
    • eine kleiner Exkurs über ascii, utf8 und den Zeichenkodierungs-Dschungel
  • Web Scraping, erweitert
    • eine URL-Liste abarbeiten
    • URLs extrahieren und URL-liste abarbeiten
    • einen Katalog nach Titeln parsen
    • einen Webshop nach Artikeln und Preisen parsen
    • Bilder runterladen, komprimieren und auf der HD speichern
    • Tabellen auslesen
    • Daten in einem Pandas Dataframe darstellen
    • Umgang mit fehlerhaften Daten

4.-5. Tag auch separat buchbar als: 
Web Scraping und Web-Crawler mit Python - Erweitert

  • xPath und Selenium
    • Grundlagen von xPATH
    • Installieren der Firebug und Firepath Extension
    • Selenium installieren, Chrome Webdriver festlegen, erste Schritte
    • Scrapen dynamischer Webseiten mit Selenium
    • Headless Selenium
    • Ausfüllen von Inputfeldern und Ergebnisse parsen
    • hinter passwortgeschützten Bereichen arbeiten
  • Scrapy und Spider Installieren und Programmieren
    • Installieren von Scrapy
    • einen ersten Spider bauen
    • einen Spider programmieren, der Seiten einer ganze Domain einlesen kann
    • Pydantic installieren und Modelle entwerfen
    • Daten in einer Sqlite Datenbank speichern

Buchungsmöglichkeiten

Online oder in Präsenz teilnehmen

Sie können sowohl Online als auch in Präsenz am Seminar teilnehmen. Klicken Sie bei Ihrer Buchung oder Anfrage einfach die entsprechende Option an.

Gesicherte offene Termine

Weiterbildung Web Scraping und Web-Crawler mit Python - Komplett

TerminOrtPreis
10.02.-14.02.2025
Plätze vorhanden
Köln / Online 3.090,00
Köln / Online 3.090,00 Buchen Vormerken
05.05.-09.05.2025
Plätze vorhanden
Köln / Online 3.090,00
Köln / Online 3.090,00 Buchen Vormerken
  • Buchen ohne Risiko
  • Keine Vorkasse
  • Kostenfreies Storno bis zum Vortag des Seminars
  • Rechnung nach erfolgreichem Seminar
  • All-Inclusive-Preis
  • Garantierter Termin und Veranstaltungsort
  • Preise pro Person zzgl. Mehrwertsteuer
  • Dritter Mitarbeitende kostenfrei
Inhouse-/Firmenschulung

Inhalte werden auf Wunsch an die Anforderungen Ihres Teams angepasst.

Individualschulung

Fokus aufs Fachliche und maximaler Raum für individuelle Fragen.

Nachbetreuung

Unterstützung nach der Schulung durch
individuelle Nachbetreuung

Details & Anfrage

So haben GFU-Kunden gestimmt

Zu diesem Seminar wurden noch keine Bewertungen abgegeben.

FAQ für Offene Schulungen
  • Alle folgenden Schulungsformen können auch Online als Virtual Classroom durchgeführt werden.
  • Eine Offene Schulung findet zu einem festgelegten Zeitpunkt im voll ausgestatteten Schulungszentrum oder Online/Remote statt. Sie treffen auf Teilnehmende anderer Unternehmen und profitieren vom direkten Wissensaustausch.
  • Eine Inhouse-/Firmen-Schulung geht auf die individuellen Bedürfnisse Ihres Unternehmens ein. Sie erhalten eine kostenfreie Beratung von Ihrem Seminarleiter und können Inhalte und Dauer auf Ihren Schulungsbedarf anpassen. Inhouse-Schulungen können Europaweit durchgeführt werden.
  • Bei einer Individual-Schulung erhalten Sie eine 1-zu-1 Betreuung und bestimmen Inhalt, Zeit und Lerntempo. Der Dozent passt sich Ihren Wünschen und Bedürfnissen an.

Sie können unsere Schulungen auch als Remote Schulung im Virtual Classroom anfragen.

In drei Schritten zum Online Seminar im Virtual Classroom:

  1. Seminar auswählen und auf "Buchen" klicken
  2. Wählen Sie bei "Wie möchten Sie teilnehmen?" einfach "Online" aus.
  3. Formular ausfüllen und über den Button "Jetzt buchen" absenden.

Unser Kundenservice meldet sich bei Ihnen mit der Buchungsbestätigung.

Unsere Online Schulungen finden im Virtual Classroom statt. Ein Virtual Classroom bündelt mehrere Werkzeuge, wie Audio-Konferenz, Text-Chat, Interaktives Whiteboard, oder Application Sharing.

Vorteile von Virtual Classroom:

  • Sie erhalten 1 zu 1 die gleiche Lernumgebung, die Sie auch vor Ort bei uns vorfinden
  • Die technische Vorbereitung wird von den GFU-Technikern vorgenommen
  • Sie erhalten remote Zugriff auf Ihren persönlichen Schulungs-PC im GFU-Seminarraum
  • Die Virtual Classroom Lösung lässt sich auch im Browser betreiben
  • Die GFU-Technik leistet wie gewohnt Soforthilfe bei Problemen
  • Die Schulungsunterlagen bekommen Sie per Post zugeschickt
  • Sie sparen Reisekosten und Zeit
  • 10. Feb. - 14. Feb. ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • 05. Mai - 09. Mai ✓ Noch einige Plätze frei ▶ Köln + Online/Remote
  • Auch als Inhouse-Schulung, bundesweit mit Termin nach Wunsch und individuellen Inhalten
  • Buchen ohne Risiko! Kostenfreie Stornierung bis zum Vortag des Seminars
Das GFU-Sorglos-Paket

Buchen Sie diese kostenfreien Serviceleistungen für Präsenzseminare ganz einfach während des Buchungsprozesses dazu!

Shuttle Service
Shuttle Service

Machen Sie sich keinen Kopf um die Anreise! Unser Shuttle fährt Sie. Oder Sie parken einfach auf einem extra für Sie reservierten Parkplatz.

Hotelreservierung
Hotelreservierung

Hotelzimmer gesucht? Wir organisieren Ihnen eins. Ihr Vorteil: Sie sparen Zeit und Geld!

Verpflegung
Verpflegung

Gesund oder lecker? Warum nicht beides? Freuen Sie sich auf unsere kulinarische Verpflegung!

Parkplätze
Parkplätze

Parkplätze sind in ausreichender Zahl vorhanden. Reisen Sie mit dem Auto an, reservieren wir Ihnen einen Parkplatz.

137.484
TEILNEHMENDE
3.129
SEMINARTHEMEN
33.888
DURCHGEFÜHRTE SEMINARE
aegallianzaxabayerElement 1boschdeutsche-bankdeutsche-postdouglasfordfujitsuhenkelhermeslufthansamercedesnokiasonytelekomvwzdf