Analisar e preparar dados com o Amazon SageMaker Data Wrangler e o Amazon EMR (Português (Brasil)) | Lab - Analyze and Prepare Data with Amazon SageMaker Data Wrangler and Amazon EMR (Portuguese (Brazil))
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
Neste laboratório, você aprenderá a visualizar, preparar dados e transformar um conjunto de dados no SageMaker Data Wrangler. Você também usará o S3 e o SageMaker Studio para interagir com o Apache Hive usando o Apache Spark.
Objetivos
- Entender os métodos eficazes de visualização de dados
- Explorar métodos para limpeza e transformação de dados e para processar valores ausentes, valores discrepantes, dados duplicados etc.
- Saber como ingerir e transformar dados no Amazon Sagemaker Data Wrangler
- Experimentar como transformar dados usando o Spark no Amazon EMR
Pré-requisitos
- Navegação básica do Console de Gerenciamento da AWS.
- Compreensão dos conceitos de banco de dados, MySQL e disponibilidade do banco de dados.
Descrição
- Tarefa 1: Importar, visualizar e realizar uma análise preliminar dos dados com o SageMaker Data Wrangler
- Tarefa 2: Analisar e visualizar os dados
- Tarefa 3: Realizar transformações de dados e exportar os conjuntos de dados
- Tarefa 4: Configurar o ambiente
- Tarefa 5: Conectar-se a um cluster do EMR
- Tarefa 6: Explorar e consultar dados do kernel SparkMagic PySpark
Tags
Related Courses
Passion Driven StatisticsWesleyan University via Coursera Machine Learning With Big Data
University of California, San Diego via Coursera Big Data - Capstone Project
University of California, San Diego via Coursera Data Science at Scale - Capstone Project
University of Washington via Coursera Анализ данных: финальный проект
Moscow Institute of Physics and Technology via Coursera