Apache Spark Komplettkurs

Apache Spark Komplettkurs
Image from xing.com
From Mon 22 June 2020 to Wed 1 July 2020
From Monday 22 June 2020 to Wednesday 1 July 2020
9:00 AM - 5:00 PM
Ended

Über IT-Schulungen.com Das Education Center von IT-Schulungen.com zählt seit über 15 Jahren zu den Topadressen für Weiterbildung und gleichzeitig zur technologischen Avantgarde in den Bereichen Cloud, Big Data und Digitale Transformation. Jährlich über 1.400 zufriedene Bestandskunden und eine überproportional steigende Neukundenrate in den Bereichen Business, Management und IT bestätigen unseren Qualitätsanspruch unter dem Motto: Seminare in Perfektion. Seit 2012 ist das Education Center von IT-Schulungen.com nach dem International Training Center Rating® mit der höchsten Auszeichnung klassifiziert. Seminarziel: Schneller und universeller als MapReduce ist Spark, welches sich innerhalb weniger Jahre zum de facto Standard für die Ausführung verteilter Anwendungen entwickelt hat. In diesem Kurs lernen die Teilnehmer die Grundlagen von Spark kennen und können die Kenntnisse zu spezialisierten Spark-Bibliotheken vertiefen. Dieser Kurs ist für eine Dauer von zehn Tagen konzipiert und in folgende Module strukturiert: Spark Grundlagen (Modul 1) 1 Tag Spark Programmierung (Modul 2) 1 Tag Spark Tools (Modul 3) 1 Tag Spark SQL (Modul 4) 1 Tag GraphX (Modul 5) 1 Tag Machine Learning (Modul 6) 2 Tage R (Modul 7) 1 Tag Streaming (Modul 8) 2 Tage Aus diesem Komplettkurs sind einzelne Spezialkurse abgeleitet: Apache Spark Grundkurs (Modul 1, 2 und 3) 3 Tage Apache Spark SQL (Modul 4 und 5) 2 Tage Apache Spark ML (Modul 6 und 7) 3 Tage Apache Spark Streaming (Modul 8) 2 Tage Weitete Infos: Schwierigkeitsgrad: 300 Darreichung: PowerPoint-Präsentation, Live-Demos sowie eigenständige Übungen (Labs) der Teilnehmer. Der Anteil eigenständiger Übungen beträgt etwa 50 Prozent. Materialien: Präsentation in elektronischer Form (Format .PDF). Übungsunterlagen in gedruckter und elektronischer Form. Die für die Übungen erforderliche IT-Infrastruktur wird in virtualisierter Form bereitgestellt. Credits: Ja (Credits für die Zertifizierung) Preis 7.134,05 € inkl. MwSt., zzgl. Verpflegung und Unterlagen 5.995,00 € zzgl. MwSt., Verpflegung und Unterlagen, Nettopreis exklusiv für Geschäftskunden Art des Trainings: Präsenztraining mit Trainer mit Projekterfahrung Seminarzeiten: täglich von 9:00 - 17:00 inkl. 1 Stunde Mittagspause und Kaffeepausen Anmeldung und Seminaragenda finden Sie unter: https://www.it-schulungen.com/seminare/big-data/hadoop/apache-spark-komplettkurs.html Kontakt: info@it-schulungen.com | Tel.: 0911 6500830 Programm Modul 1: Spark Grundlagen Spark wurde im universitären AMPLab in Berkeley ersonnen und entwickelt sich seit 2013 unter dem Dach der Apache Software Foundation als defacto-Standard für nebenläufige Berechnungen rasant weiter. Kern von Spark ist eine Engine, die Daten in sogenannte RDDs (Resilient Distributed Datasets) so aufspaltet, dass diese über mehrere Knoten verteilt und parallel bearbeitet werden können, bis sie wieder zusammengeführt und erforderlichenfalls erneut aufgeteilt werden. Dieses Aufteilen und Zusammenführen wird größtmöglich im Hauptspeicher durchgeführt, weshalb die Performance von Spark deutlich höher ist als vergleichsweise in MapReduce. In diesem einführenden Modul lernen die Teilnehmer die grundlegenden Prinzipien von Spark und ihre Integration in das Hadoop Ökosystem kennen. Modul 2: Spark Programmierung Jedes Spark-Programm besteht aus einem zentralen Driver Program sowie zahlreichen Executor Programs, die auf den einzelnen Knoten ausgeführt werden. Es stehen verschiedene Schnittstellen zur Verfügung, um Spark-Programme in Java, Scala oder Python erstellen zu können. Aufbauend auf dem Grundkonzept, welches für alle Sprachen gleich ist, wird ein Überblick zu den einzelnen Sprachvarianten gegeben und auf Unterschiede eingegangen. Die Teilnehmer setzen eigenständig Aufgabenstellungen mit der Sprache ihrer Wahl um. Abschließend werden die Realisierungen mit verschiedenen Sprachen diskutiert. Modul 3: Spark Tools Die Liste der verfügbaren Werkzeuge für die Entwicklung und Ausführung von Spark-Programmen ist lang und reicht von (interaktiven) Shell-Tools bis zur mächtigen Spark-Plattform von Databricks. In diesem Modul lernen die Teilnehmer die interaktiven Shells in Hadoop für Scala und Python kennen, wenden webbasierte Notebooks wie Zeppelin und Jupyter an, nutzen die Entwickler-Tools Eclipse und Visual Studio und erhalten einen Überblick zur Spark-Plattform von Databricks. Modul 4: Spark SQL Der Durchbruch für Spark SQL erfolgte mit der Einführung von Datasets und DataFrames, die die performante verteilte Verarbeitung von strukturierten Daten möglich machte. Spark SQL ist heute eine der am häufigsten eingesetzten Komponenten und ermöglicht eine SQL-basierte Verarbeitung von verteilten Daten. Die Teilnehmer lernen die Konzepte von Spark SQL kennen und lösen unterschiedlichste Aufgabenstellungen zum Persistieren, Selektieren und Aggregieren strukturierter Daten ein einer verteilten Umgebung mit Hilfe von Scala. Modul 5: Spark GraphX GraphX ist eine Komponente in Spark, die speziell auf die Verarbeitung von Graphen ausgelegt ist. Jeder Graph besteht aus Knoten und Kanten, die wiederum durch Eigenschaften beschrieben sind. GraphX definiert sogenannte Eigenschafts-Graphen, über denen typische Graphen-Operationen ausgeführt werden können. Die Teilnehmer machen sich mit den Grundprinzipien der Implementierung von GraphX vertraut und lösen exemplarische Aufgabenstellungen mit Hilfe von Python. Modul 6: Spark Machine Learning (MLlib) Mit Spark MLlib steht eine Bibliothek für typische Aufgabenstellungen im Data Mining bzw. Machine Learning (ML) zur Verfügung, womit beispielsweise Vorhersagemodelle für diskrete oder stetige Werte trainiert werden können. Die Teilnehmer machen sich mit den Grundprinzipien der Implementierung von ML-Algorithmen in Spark vertraut und lernen verschiedene Ansätze für die Modellerstellung kennen. Der Schwerpunkt dieses Moduls liegt aber in der praktischen Umsetzung verschiedener Aufgabenstellungen durch die Teilnehmer mit Hilfe von Python. Modul 7: SparkR SparkR ist eine relativ junge Bibliothek in Spark, die den Bogen zwischen der frei verfügbaren Programmiersprache „R“ und Spark spannt. Damit ist es grundsätzlich möglich, bestimmte rechenintensive Aktivitäten wie Aggregationen, Selektionen und Filtern in einer verteilten Umgebung mit Hilfe von Spark auszuführen. Dies kann entweder aus der Spark-Umgebung heraus initiiert werden oder aus einer beliebigen IDE (Integrated Developer Environment) für R wie beispielsweise R Studio. Die Teilnehmer machen sich mit der Funktionalität von SparkR vertraut und erstellen einfache R-Programme unter Nutzung von Spark. Modul 8: Spark Streaming Spark Streaming ist eine Lösung, um in sogenannten Micro Batches Daten zeitnah verarbeiten zu können. Das ist zwar kein Ansatz, um im Hochgeschwindigkeitshandel bestehen zu können, aber allemal geeignet, um Daten im Sekundenbereich verarbeiten zu können. Das Konzept von Spark Streaming besteht darin, den permanenten Datenstrom in sogenannten DStreams zu portionieren und jedes dieser Pakete als Kleinststapel in der Spark Engine zu verarbeiten. Die Teilnehmer machen sich mit dem Konzept von Spark Streaming vertraut und lernen, wie Daten beispielsweise aus Kafka mit Hilfe von Java verarbeitet werden können. Darüber hinaus wird auf die recht anspruchsvolle Thematik der Optimierung derartiger Anwendungen eingegangen. Nützliche Funktionen:
Termin und Ort passen nicht? => Aktivieren Sie unser Terminradar.Das Terminradar von it-schulungen.com informiert Sie über aktuelle, neue Seminartermine zu Ihrem Thema.https://www.it-schulungen.com/seminare/big-data/hadoop/apache-spark-komplettkurs.htmlopen-seminardateradar
Mehr Teilnehmer geplant? => Fragen Sie unseren Seminar-Kalkulator.Der Seminar-Kalkulator errechnet, ob eine Inhouse-Buchung günstiger für Sie ist.https://www.it-schulungen.com/seminare/big-data/hadoop/apache-spark-komplettkurs.htmlkostenrechner-3
Ihr Ansprechpartner:Roland MladenovicSeminarberaterTelefon: 0911 6500 8 222Email: r.mladenovic@newelements.de
Über IT-Schulungen.com Das Education Center von IT-Schulungen.com zählt seit über 15 Jahren zu den Topadressen für Weiterbildung und gleichzeitig zur technologischen Avantgarde in den Bereichen Cloud, Big Data und Digitale Transformation. Jährlich über 1.400 zufriedene Bestandskunden und eine überproportional steigende Neukundenrate in den Bereichen Business, Management und IT bestätigen unseren Qualitätsanspruch unter dem Motto: Seminare in Perfektion. Seit 2012 ist das Education Center von IT-Schulungen.com nach dem International Training Center Rating® mit der höchsten Auszeichnung klassifiziert. Seminarziel: Schneller und universeller als MapReduce ist Spark, welches sich innerhalb weniger Jahre zum de facto Standard für die Ausführung verteilter Anwendungen entwickelt hat. In diesem Kurs lernen die Teilnehmer die Grundlagen von Spark kennen und können die Kenntnisse zu spezialisierten Spark-Bibliotheken vertiefen. Dieser Kurs ist für eine Dauer von zehn Tagen konzipiert und in folgende Module strukturiert: Spark Grundlagen (Modul 1) 1 Tag Spark Programmierung (Modul 2) 1 Tag Spark Tools (Modul 3) 1 Tag Spark SQL (Modul 4) 1 Tag GraphX (Modul 5) 1 Tag Machine Learning (Modul 6) 2 Tage R (Modul 7) 1 Tag Streaming (Modul 8) 2 Tage Aus diesem Komplettkurs sind einzelne Spezialkurse abgeleitet: Apache Spark Grundkurs (Modul 1, 2 und 3) 3 Tage Apache Spark SQL (Modul 4 und 5) 2 Tage Apache Spark ML (Modul 6 und 7) 3 Tage Apache Spark Streaming (Modul 8) 2 Tage Weitete Infos: Schwierigkeitsgrad: 300 Darreichung: PowerPoint-Präsentation, Live-Demos sowie eigenständige Übungen (Labs) der Teilnehmer. Der Anteil eigenständiger Übungen beträgt etwa 50 Prozent. Materialien: Präsentation in elektronischer Form (Format .PDF). Übungsunterlagen in gedruckter und elektronischer Form. Die für die Übungen erforderliche IT-Infrastruktur wird in virtualisierter Form bereitgestellt. Credits: Ja (Credits für die Zertifizierung) Preis 7.134,05 € inkl. MwSt., zzgl. Verpflegung und Unterlagen 5.995,00 € zzgl. MwSt., Verpflegung und Unterlagen, Nettopreis exklusiv für Geschäftskunden Art des Trainings: Präsenztraining mit Trainer mit Projekterfahrung Seminarzeiten: täglich von 9:00 - 17:00 inkl. 1 Stunde Mittagspause und Kaffeepausen Anmeldung und Seminaragenda finden Sie unter: https://www.it-schulungen.com/seminare/big-data/hadoop/apache-spark-komplettkurs.html Kontakt: info@it-schulungen.com | Tel.: 0911 6500830 Programm Modul 1: Spark Grundlagen Spark wurde im universitären AMPLab in Berkeley ersonnen und entwickelt sich seit 2013 unter dem Dach der Apache Software Foundation als defacto-Standard für nebenläufige Berechnungen rasant weiter. Kern von Spark ist eine Engine, die Daten in sogenannte RDDs (Resilient Distributed Datasets) so aufspaltet, dass diese über mehrere Knoten verteilt und parallel bearbeitet werden können, bis sie wieder zusammengeführt und erforderlichenfalls erneut aufgeteilt werden. Dieses Aufteilen und Zusammenführen wird größtmöglich im Hauptspeicher durchgeführt, weshalb die Performance von Spark deutlich höher ist als vergleichsweise in MapReduce. In diesem einführenden Modul lernen die Teilnehmer die grundlegenden Prinzipien von Spark und ihre Integration in das Hadoop Ökosystem kennen. Modul 2: Spark Programmierung Jedes Spark-Programm besteht aus einem zentralen Driver Program sowie zahlreichen Executor Programs, die auf den einzelnen Knoten ausgeführt werden. Es stehen verschiedene Schnittstellen zur Verfügung, um Spark-Programme in Java, Scala oder Python erstellen zu können. Aufbauend auf dem Grundkonzept, welches für alle Sprachen gleich ist, wird ein Überblick zu den einzelnen Sprachvarianten gegeben und auf Unterschiede eingegangen. Die Teilnehmer setzen eigenständig Aufgabenstellungen mit der Sprache ihrer Wahl um. Abschließend werden die Realisierungen mit verschiedenen Sprachen diskutiert. Modul 3: Spark Tools Die Liste der verfügbaren Werkzeuge für die Entwicklung und Ausführung von Spark-Programmen ist lang und reicht von (interaktiven) Shell-Tools bis zur mächtigen Spark-Plattform von Databricks. In diesem Modul lernen die Teilnehmer die interaktiven Shells in Hadoop für Scala und Python kennen, wenden webbasierte Notebooks wie Zeppelin und Jupyter an, nutzen die Entwickler-Tools Eclipse und Visual Studio und erhalten einen Überblick zur Spark-Plattform von Databricks. Modul 4: Spark SQL Der Durchbruch für Spark SQL erfolgte mit der Einführung von Datasets und DataFrames, die die performante verteilte Verarbeitung von strukturierten Daten möglich machte. Spark SQL ist heute eine der am häufigsten eingesetzten Komponenten und ermöglicht eine SQL-basierte Verarbeitung von verteilten Daten. Die Teilnehmer lernen die Konzepte von Spark SQL kennen und lösen unterschiedlichste Aufgabenstellungen zum Persistieren, Selektieren und Aggregieren strukturierter Daten ein einer verteilten Umgebung mit Hilfe von Scala. Modul 5: Spark GraphX GraphX ist eine Komponente in Spark, die speziell auf die Verarbeitung von Graphen ausgelegt ist. Jeder Graph besteht aus Knoten und Kanten, die wiederum durch Eigenschaften beschrieben sind. GraphX definiert sogenannte Eigenschafts-Graphen, über denen typische Graphen-Operationen ausgeführt werden können. Die Teilnehmer machen sich mit den Grundprinzipien der Implementierung von GraphX vertraut und lösen exemplarische Aufgabenstellungen mit Hilfe von Python. Modul 6: Spark Machine Learning (MLlib) Mit Spark MLlib steht eine Bibliothek für typische Aufgabenstellungen im Data Mining bzw. Machine Learning (ML) zur Verfügung, womit beispielsweise Vorhersagemodelle für diskrete oder stetige Werte trainiert werden können. Die Teilnehmer machen sich mit den Grundprinzipien der Implementierung von ML-Algorithmen in Spark vertraut und lernen verschiedene Ansätze für die Modellerstellung kennen. Der Schwerpunkt dieses Moduls liegt aber in der praktischen Umsetzung verschiedener Aufgabenstellungen durch die Teilnehmer mit Hilfe von Python. Modul 7: SparkR SparkR ist eine relativ junge Bibliothek in Spark, die den Bogen zwischen der frei verfügbaren Programmiersprache „R“ und Spark spannt. Damit ist es grundsätzlich möglich, bestimmte rechenintensive Aktivitäten wie Aggregationen, Selektionen und Filtern in einer verteilten Umgebung mit Hilfe von Spark auszuführen. Dies kann entweder aus der Spark-Umgebung heraus initiiert werden oder aus einer beliebigen IDE (Integrated Developer Environment) für R wie beispielsweise R Studio. Die Teilnehmer machen sich mit der Funktionalität von SparkR vertraut und erstellen einfache R-Programme unter Nutzung von Spark. Modul 8: Spark Streaming Spark Streaming ist eine Lösung, um in sogenannten Micro Batches Daten zeitnah verarbeiten zu können. Das ist zwar kein Ansatz, um im Hochgeschwindigkeitshandel bestehen zu können, aber allemal geeignet, um Daten im Sekundenbereich verarbeiten zu können. Das Konzept von Spark Streaming besteht darin, den permanenten Datenstrom in sogenannten DStreams zu portionieren und jedes dieser Pakete als Kleinststapel in der Spark Engine zu verarbeiten. Die Teilnehmer machen sich mit dem Konzept von Spark Streaming vertraut und lernen, wie Daten beispielsweise aus Kafka mit Hilfe von Java verarbeitet werden können. Darüber hinaus wird auf die recht anspruchsvolle Thematik der Optimierung derartiger Anwendungen eingegangen. Nützliche Funktionen:
Termin und Ort passen nicht? => Aktivieren Sie unser Terminradar.Das Terminradar von it-schulungen.com informiert Sie über aktuelle, neue Seminartermine zu Ihrem Thema.https://www.it-schulungen.com/seminare/big-data/hadoop/apache-spark-komplettkurs.htmlopen-seminardateradar
Mehr Teilnehmer geplant? => Fragen Sie unseren Seminar-Kalkulator.Der Seminar-Kalkulator errechnet, ob eine Inhouse-Buchung günstiger für Sie ist.https://www.it-schulungen.com/seminare/big-data/hadoop/apache-spark-komplettkurs.htmlkostenrechner-3
Ihr Ansprechpartner:Roland MladenovicSeminarberaterTelefon: 0911 6500 8 222Email: r.mladenovic@newelements.de

710 Views - 02/07/2020 Last update
music
it-schulungen.com hamburg zentrum hamburg, 20097, germany
Event from
xing.com

Are you an event organizer?
Create events for free. They will be immediately recommended to interested users.
Create event

Nearby hotels and apartments

it-schulungen.com hamburg zentrum hamburg, 20097, germany

Browse other venues in Hamburg-Mitte
Discover now


Discover more events in Hamburg-Mitte
Discover now



it-schulungen.com hamburg zentrum hamburg, 20097, germany
Event from
xing.com


Are you an event organizer?
Create events for free. They will be immediately recommended to interested users.
Create event
  1. Hamburg-Mitte
  2. IT-Schulungen.com
  3. Apache Spark Komplettkurs
 
 
 
 
Your changes have been saved.