seminar buchen
Seminar Cloudera Programmierung
Seminar / Training Cloudera Programmierung
Die Motivation für Hadoop
- Probleme mit traditionellen Large-Scale Systems
- Einführung Hadoop
- Probleme, die mit Hadoop gelöst werden können
Hadoop: Grundlegende Konzepte und HDFS
- Mappers und Hadoop Components Reducers
- Hadoop Distributed File System
Einführung in MapReduce
Hadoop Clusters und das Hadoop Ecosystem
- Hadoop Cluster Übersicht
- Hadoop Jobs und Tasks
- weitere Hadoop Komponenten
MapReduce Programmierung in Java
- Einfache MapReduce API Konzepte
- MapReduce Drivers, Mappers und Reducers
- Hadoop Entwicklung und Eclipse
- Unterschiede zwischen alter und neuer MapReduce API
MapReduce und Streaming
- Erstellen von Mappers und Reducers mit der Streaming API
Unit Testing von MapReduce Programmen
- Unit Testing
- JUnit und MRUnit Frameworks
- Unit Tests mit MRUnit
- Starten von Uni Tests
Hadoop API
- ToolRunner Class
- Einrichten und Beenden von Mappers und Reducers
- Reduzierung der Daten mit Combiners
- HDFS Zugriffe
- Distributed Cache
Tipps und Tricks
- Strategien für das Debugging
- LocalJobRunner
- Log Files analysieren
- Counter
- Objekte wiederverwenden
- Map-only MapReduce Jobs
Partitioners und Reducers
- Wie Partitioners und Reducers zusammenarbeiten
- Ermitteln der optimalen Anzahl von Reducers
- Schreiben von Customer Partitioners
Data Input und Output
- Custom Writebals
- SequenceFile und AvroData Files
- Dateikomprimierung
- Eingangsformate und Ausgangsformate
Übliche MapReduce Algorithmen
- Sortierung von großen Ergebnissen
- Indizierung von Daten
- Term Frequency
- Inverse Dokument Frequency
- Berechnen der Word Co-Occurence
- Secondary Sort
Verknüpfen von Data Sets in MapReduce Jobs
- Map-Side Join
- Reduce-Side Join
Hadoop und der Enterprise Workflow
- Integration von Hadoop in den Workflow
- Import von RDBMS nach HDFS mit Sqoop
- Flume und Echtzeitdatenverarbeitung
- Zugriff auf HDFS mit FuseDFS und HttpFS
Einführung in Hive, Impala und Pig
- Die Motivation für Hive, Impala und Pig
- Übersicht über Hive
- Übersicht über Impala
- Übersicht über Pig
- Vergleich von Impala, Pig und Hive
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-
Andreas Werkmeister
Telefon: + 49 (221) 74740003
E-Mail: -
Maik Thomas
Telefon: + 49 (221) 74740003
E-Mail:
Seminardetails
Dauer: | 4 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr |
Preis: |
Öffentlich und Webinar: € 2.396 zzgl. MwSt. Inhaus: € 6.800 zzgl. MwSt. |
Teilnehmeranzahl: | max. 8 Teilnehmer |
Voraussetzung: | Kenntnisse einer Programmiersprache |
Standorte: | Stream Live, Stream gespeichert, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Magdeburg, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal |
Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
Seminararten: | Öffentlich, Inhaus, Webinar |
Durchführungsgarantie: | ja, ab 3 Teilnehmern |
Sprache: | Deutsch (Englisch ist bei Firmenseminaren ebenfalls möglich) |
Seminarunterlage: | Dokumentation auf CD oder Papier |
Teilnahmezertifikat: | ja, selbstverständlich |
Verpflegung: | Kalt- / Warmgetränke, Mittagessen im Restaurant - (bei öffentlichen Seminaren) |
Support: | 3 Anrufe im Seminarpreis enthalten |
Barrierefreier Zugang: | an den meisten Standorten verfügbar |
Weitere Informationen unter + 49 (221) 74740003 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.