Building Batch Data Pipelines on GCP en Français
Offered By: Google Cloud via Coursera
Course Description
Overview
Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours indique quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il présente également plusieurs technologies Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.
Syllabus
- Introduction
- Dans ce module, nous vous présentons le cours et son déroulement.
- Présentation de la création de pipelines de données par lot
- Ce module passe en revue différentes méthodes de chargement de données (EL, ELT et ETL) et vous indique quand les utiliser.
- Exécuter Spark sur Dataproc
- Ce module vous apprend à exécuter Hadoop sur Dataproc, à exploiter Cloud Storage et à optimiser vos jobs Dataproc.
- Traitement des données sans serveur avec Dataflow
- Ce module vous explique comment utiliser Dataflow pour créer vos pipelines de traitement de données.
- Gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer
- Ce module vous montre comment gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer.
- Résumé du cours
- Résumé du cours
- Ressources du cours
- Liens PDF vers tous les modules
Taught by
Google Cloud Training
Tags
Related Courses
SAP Business Warehouse powered by SAP HANASAP Learning Relational Database Support for Data Warehouses
University of Colorado System via Coursera Data Warehouse Concepts, Design, and Data Integration
University of Colorado System via Coursera Business Intelligence Concepts, Tools, and Applications
University of Colorado System via Coursera Design and Build a Data Warehouse for Business Intelligence Implementation
University of Colorado System via Coursera