Laboratório - Analisar e preparar dados com o Amazon SageMaker Data Wrangler e o Amazon EMR (Português (Brasil)) | Lab - Analyze and Prepare Data with Amazon SageMaker Data Wrangler and Amazon EMR (Portuguese (Brazil))
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
Neste laboratório, você aprenderá a visualizar, preparar dados e transformar um conjunto de dados no SageMaker Data Wrangler. Você também usará o S3 e o SageMaker Studio para interagir com o Apache Hive usando o Apache Spark.
Objetivos
- Entender os métodos eficazes de visualização de dados
- Explorar métodos para limpeza e transformação de dados e para processar valores ausentes, valores discrepantes, dados duplicados etc.
- Saber como ingerir e transformar dados no Amazon Sagemaker Data Wrangler
- Experimentar como transformar dados usando o Spark no Amazon EMR
Pré-requisitos
- Navegação básica do Console de Gerenciamento da AWS.
- Compreensão dos conceitos de banco de dados, MySQL e disponibilidade do banco de dados.
Descrição
- Tarefa 1: Importar, visualizar e realizar uma análise preliminar dos dados com o SageMaker Data Wrangler
- Tarefa 2: Analisar e visualizar os dados
- Tarefa 3: Realizar transformações de dados e exportar os conjuntos de dados
- Tarefa 4: Configurar o ambiente
- Tarefa 5: Conectar-se a um cluster do EMR
- Tarefa 6: Explorar e consultar dados do kernel SparkMagic PySpark
Tags
Related Courses
Intro to StatisticsStanford University via Udacity Introduction to Data Science
University of Washington via Coursera Passion Driven Statistics
Wesleyan University via Coursera Information Visualization
Indiana University via Independent DCO042 - Python For Informatics
University of Michigan via Independent