seminar buchen
Seminar Datenanalyse mit R kompakt
Seminar / Training Datenanalyse mit R kompakt
Einführung
- Hintergrund zu R und RStudio
- Installieren neuer Pakete und die Paketumgebung CRAN
- Aspekte von R, die sich von anderen Programmiersprachen unterscheiden
Einführung in das Data-Science-Paket data.table
- Struktur einer data.table und Ähnlichkeit zu SQL-Abfragen
- Verschiedene Möglichkeiten, Zeilen und Spalten zu extrahieren
- Möglichkeiten, Berechnungen direkt auf Spalten durchzuführen
- Abfragen nach Variablen gruppieren
Einlesen von Daten
- Einstellen des Arbeitsverzeichnisses in R und RStudio
- Lesen und Schreiben einer CSV- oder Excel-Datei und eine Übersicht über die nützlichsten Parameter
- Lesen und Schreiben einer SPSS-Datei
- Die Funktion fread () zum effizienten Einlesen großer Datenmengen
- Speichern und Laden von Daten im Binärformat in .RData
- Abfragen aus einer Datenbank (SQLite)
Datenhandling in einer data.table
- Der: = Operator in einer data.table
- Ersetzen von fehlenden Werten
- Anlegen, Löschen, Ändern einer Spalte
- Konvertieren zwischen Datentypen
- lapply () und die Anwendung in einer data.table (mit .SD und .SDcols)
Visualisierung mit ggplot2
- Die Idee hinter der Grammatik der Grafik
- Ästhetik-Schicht und Geometrie-Schicht zum Erstellen erster Plots (Box-Plots, Scatter-Plots, Bar-Plots, Kernel-Dichte-Schätzer, Histogramme, Line-Plots)
- Statistik-Schicht zum Plotten von Statistiken durch ggplot2
- Aspekte der Darstellung (Größe der Datenpunkte, Farbe, Gruppierung) über eine Variable steuern oder fest vorgeben
- Facettierung - Erstellen mehrerer Subplots, die nach einer Kategorie unterteilt sind
- Speichern der Plots
Algorithmen in der Datenwissenschaft
- Big Data und die vier Vs von Big Data
- Was ist maschinelles Lernen
- Die Klassifizierung von Algorithmen im maschinellen Lernen (überwachtes Lernen - unüberwachtes Lernen - Verstärkungslernen)
- Einführung in wichtige Algorithmen: lineare Regression, logistische Regression, Entscheidungsbäume, Random Forest, Support-Vektor-Maschine (SVM), K-means, Kernel-Dichte-Schätzer
- Overfitting und wie man es entdeckt und vermeidet
- Kreuzvalidierung, Konfusionsmatrix, ROC-Kurve
- Die Schritte bei der Modellierung (Aufteilung der Daten in Testzug, Erstellung eines Modells, Validierung des Modells)
- Praktische Umsetzung der theoretisch behandelten Algorithmen in R
- Training und Validierung verschiedener Algorithmen (lineare Regression, logistische Regression, Entscheidungsbäume, Random Forest, Support-Vektor-Maschine (SVM), K-means, Kernel-Dichte-Schätzer)
- Auswertung der Modellgüte auf dem Testdatensatz
- Aufzeichnen einer ROC-Kurve
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-
Andreas Werkmeister
Telefon: + 49 (221) 74740003
E-Mail: -
Maik Thomas
Telefon: + 49 (221) 74740003
E-Mail:
Seminardetails
Dauer: | 2 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr |
Preis: |
Öffentlich und Webinar: € 998 zzgl. MwSt. Inhaus: € 2.700 zzgl. MwSt. |
Teilnehmeranzahl: | max. 8 Teilnehmer |
Teilnehmer: | Technisch interessierte Fachkräfte oder Projektleiter, angehende Data Scientists und Datenanalysten, die eine Einführung in die Programmiersprache R wünschen, um selbstständig an Data Science-Projekten zu arbeiten oder ein besseres Verständnis für R-Code zu erlangen. Die Teilnehmer benötigen keine Erfahrung mit R, sollten aber grundlegende Erfahrungen mit einer Programmiersprache gemacht haben, um das Grundkonzept einer Programmiersprache zu verstehen. Darüber hinaus sind Grundkenntnisse statistischer Grundbegriffe hilfreich (z. B. Mittelwert, Median, Perzentil, lineare Regression). |
Standorte: | Stream Live, Stream gespeichert, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Magdeburg, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal |
Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
Seminararten: | Öffentlich, Inhaus, Webinar |
Durchführungsgarantie: | ja, ab 2 Teilnehmern; Details |
Sprache: | Deutsch (Englisch ist bei Firmenseminaren ebenfalls möglich) |
Seminarunterlage: | Dokumentation auf CD oder Papier |
Teilnahmezertifikat: | ja, selbstverständlich |
Verpflegung: | Kalt- / Warmgetränke, Mittagessen im Restaurant - (bei öffentlichen Seminaren) |
Support: | 3 Anrufe im Seminarpreis enthalten |
Barrierefreier Zugang: | an den meisten Standorten verfügbar |
Weitere Informationen unter + 49 (221) 74740003 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.