Building Batch Data Pipelines on GCP auf Deutsch
Offered By: Google Cloud via Coursera
Course Description
Overview
Datenpipelines folgen in der Regel dem Muster Extrahieren und Laden (EL), Extrahieren, Laden und Transformieren (ELT) oder Extrahieren, Transformieren und Laden (ETL). Im Kurs wird beschrieben, welcher Ansatz in welcher Situation für Batchdaten geeignet ist. Außerdem werden verschiedene Technologien der Google Cloud Platform zur Datentransformation behandelt, wie BigQuery, das Ausführen von Spark in Cloud Dataproc, Pipelinediagramme in Cloud Data Fusion und die serverlose Datenverarbeitung mit Cloud Dataflow. In Qwiklabs erstellen die Kursteilnehmer dann selbst Komponenten einer Datenpipeline in der Google Cloud Platform.
Syllabus
Einführung
-In diesem Modul werden der Kurs und die Agenda vorgestellt.
Einführung in Batch-Datenpipelines
-In diesem Modul werden verschiedene Methoden für das Laden von Daten vorgestellt – EL, ELT und ETL – und wann welches Modell zum Einsatz kommt.
Spark in Cloud Dataproc ausführen
-In diesem Modul wird behandelt, wie Sie Hadoop in Cloud Dataproc ausführen, wie Sie Google Cloud Storage nutzen und Dataproc-Jobs optimieren.
Datenpipelines mit Cloud Data Fusion und Cloud Composer verwalten
-In diesem Modul wird gezeigt, wie Sie Datenpipelines mit Cloud Data Fusion und Cloud Composer verwalten.
Serverlose Datenverarbeitung mit Cloud Dataflow
-In diesem Modul geht es darum, wie Sie mit Cloud Dataflow eigene Pipelines zur Datenverarbeitung erstellen.
Zusammenfassung
-In diesem Modul werden die Themen des Kurses noch einmal kurz wiederholt.
-In diesem Modul werden der Kurs und die Agenda vorgestellt.
Einführung in Batch-Datenpipelines
-In diesem Modul werden verschiedene Methoden für das Laden von Daten vorgestellt – EL, ELT und ETL – und wann welches Modell zum Einsatz kommt.
Spark in Cloud Dataproc ausführen
-In diesem Modul wird behandelt, wie Sie Hadoop in Cloud Dataproc ausführen, wie Sie Google Cloud Storage nutzen und Dataproc-Jobs optimieren.
Datenpipelines mit Cloud Data Fusion und Cloud Composer verwalten
-In diesem Modul wird gezeigt, wie Sie Datenpipelines mit Cloud Data Fusion und Cloud Composer verwalten.
Serverlose Datenverarbeitung mit Cloud Dataflow
-In diesem Modul geht es darum, wie Sie mit Cloud Dataflow eigene Pipelines zur Datenverarbeitung erstellen.
Zusammenfassung
-In diesem Modul werden die Themen des Kurses noch einmal kurz wiederholt.
Taught by
Google Cloud Training
Tags
Related Courses
Building Batch Data Pipelines on GCP en FrançaisGoogle Cloud via Coursera Mastering Azure Data Factory: From Basics to Advanced Level
Udemy Data Science de A a Z - Extraçao e Exibição dos Dados
Udemy Building Batch Data Processing Solutions in Microsoft Azure
Pluralsight Implementing a Data Warehouse SQL Server 2019
LinkedIn Learning