seminar buchen

Seminar Cloudera Analyst

Seminar / Training Cloudera Analyst

Einführung
Hadoop Grundlagen

  • Gründe für Hadoop
  • Hadoop Übersicht
  • HDFS
  • MapReduce
  • Das Hadoop Ökosystem
  • Data Ingest mit den Hadoop Werkzeugen

 Einführung in Pig

  • Was ist Pig?
  • Pigs Funktionen
  • Anwendungsszenarien für Pig >
  • Interaktionen mit Pig

Einfache Datenanalyse mit Pig

  • Pig Latin Syntax
  • Daten laden
  • Einfache Datentypen
  • Felddefinitionen
  • Data Output
  • Betrachten des Schemas
  • Filtern und sortieren der Daten
  • Häufig genutzte Funktionen
  • Pig und ETL Verarbeitung

Komplexe Daten mit Pig verarbeiten

  • Storage Formate
  • Komplexe und verschachtelte Datentypen
  • Gruppieren
  • Funktionen für komplexe Daten
  • Aufzählen gruppierter Daten

Multi-Dataset Operationen mit Pig

  • Techniken für die Kombination von Data Sets
  • Verknüpfen von Daten in Pig
  • Set Operations
  • Teilen von Data Sets

Pig erweitern

  • Die Flexibilität durch Parameter erhöhen
  • Makros und Importe
  • UDFs
  • Contributed Functions
  • Verwenden anderer Sprachen mit die Analyse mit Pig
  • Pig mit Streaming und UDFs erweitern

Pig Fehlerbereinigung und Optimierung

  • Troubleshooting Pig
  • Logging
  • Hadoops Web UI
  • Debugging
  • Geschwindigkeitsübersicht
  • Ausführungspläne
  • Beschleunigen der Pig Aufträge

Einführung in Hive

  • Was ist Hive?
  • Hive Schema und Datenspeicherung
  • Vergleich von Hive mit traditionellen Datenbanken
  • Hive verglichen mit Pig
  • Hive Anwendungsfälle
  • Interaktion mit Hive

Relationale Daten mit Hive analysieren

  • Hive Datenbanken und Tabellen
  • HiveQL Syntax
  • Datentypen
  • Verbinden von Datensets
  • Wichtige Funktionen
  • Starten von Hive Abfragen mit Shell, Scripts und Hue

Hive Datenmanagement

  • Hive Datenformate
  • Anlegen und Anpassen von Datenbanken und Tabellen
  • Laden von Daten in Hive
  • Selbstverwaltete Tabellen
  • Abfragen mit Views vereinfachen
  • Speichern von Abfrageergebnissen
  • Zugriffsrechte steuern
  • Datenmanagement mit Hive

Textverarbeitung mit Hive

  • Übersicht
  • String Funktionen
  • Regular Expressions in Hive
  • Sentiment Analysis und N-Grams

Hive Optimierung

  • Abfragen beschleunigen
  • Jobausführung kontrollieren Plan
  • Partitioning
  • Bucketing
  • Indexing Data Extending Hive
  • SerDes
  • Datentransformationen mit Custom Scripts
  • Benutzerdefinierte Funktionen
  • Parameterübergabe bei Abfragen

Einführung in Impala

  • Was ist Impala?
  • Unterschiede zwischen Impala, Hive und Pig
  • Wie sich Impala von relationalen Datenbanken unterscheidet
  • Grenzen von Impala
  • Impala Shell

Analyse von Daten mit Impala

  • Syntax
  • Datentypen
  • Filtern, Sortieren und begrenzen des Ergebnisse
  • Verknüpfen und Sortieren des Ergebnis
  • Beschleunigen von Impala

Auswahl des richtigen Werkzeugs

  • Vergleich von MapReduce, Pig, Hive, Impala, und relationalen Datenbanken

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

  • Andreas Werkmeister

    Telefon: + 49 (221) 74740003
    E-Mail: 

  • Maik Thomas

    Telefon:  + 49 (221) 74740003
    E-Mail:

Seminardetails

   
Dauer: 3 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr
Preis: Öffentlich und Webinar: € 1.797 zzgl. MwSt.
Inhaus: € 5.100 zzgl. MwSt.
Teilnehmeranzahl: max. 8 Teilnehmer
Voraussetzung: keine
Standorte: Stream Live, Stream gespeichert, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Magdeburg, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal
Methoden: Vortrag, Demonstrationen, praktische Übungen am System
Seminararten: Öffentlich, Inhaus, Webinar
Durchführungsgarantie: ja, ab 2 Teilnehmern; Details
Sprache: Deutsch (Englisch ist bei Firmenseminaren ebenfalls möglich)
Seminarunterlage: Dokumentation auf CD oder Papier
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen im Restaurant - (bei öffentlichen Seminaren)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
  Weitere Informationen unter + 49 (221) 74740003

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Nürnberg 3 Tage
Köln 3 Tage
Wuppertal 3 Tage
Münster 3 Tage
Mainz 3 Tage
Erfurt 3 Tage
Bremen 3 Tage
Berlin 3 Tage
Paderborn 3 Tage
Essen 3 Tage
Darmstadt 3 Tage
Frankfurt 3 Tage
Potsdam 3 Tage
Flensburg 3 Tage
Konstanz 3 Tage
Freiburg 3 Tage
Hamm 3 Tage
Rostock 3 Tage
Hamburg 3 Tage
Leipzig 3 Tage
Hannover 3 Tage
Stuttgart 3 Tage
Dresden 3 Tage
Luxemburg 3 Tage
Regensburg 3 Tage
Jena 3 Tage
Trier 3 Tage
Madgeburg 3 Tage
Friedrichshafen 3 Tage
Kassel 3 Tage
Ulm 3 Tage
München 3 Tage
Münster 3 Tage
Nürnberg 3 Tage
Köln 3 Tage
Wuppertal 3 Tage
Bremen 3 Tage
Berlin 3 Tage
Mainz 3 Tage
Erfurt 3 Tage
© 2025 www.networkuniversity.de All rights reserved. | Kontakt | Impressum | AGB | Nach oben