Lab - Analyze and Prepare Data with Amazon SageMaker Data Wrangler and Amazon EMR (Japanese)
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
このラボでは、SageMaker Data Wrangler でデータを可視化して準備し、データセットを変換する方法を学習します。また、S3 と SageMaker Studio を使用して Apache Spark で Apache Hive を操作します。
目標
- データを可視化するための効果的な方法を理解する。
- データをクリーニングおよび変換する手法と、欠損値、外れ値、重複データなどを処理する方法を確認する。
- データを Amazon Sagemaker Data Wrangler に取り込んで、変換する方法を学習する。
- Amazon EMR で Spark を使用してデータを変換する方法を試す。
前提条件
- AWS マネジメントコンソールの基本的な操作を行うことができる。
- データベースの概念、MySQL、データベースの可用性について理解している。
概要
- タスク 1: SageMaker Data Wrangler を使用してデータのインポート、可視化、予備分析を行う
- タスク 2: データを分析し可視化する
- タスク 3: データ変換を実行してデータセットをエクスポートする
- タスク 4: 環境を設定する
- タスク 5: EMR クラスターに接続する
- タスク 6: SparkMagic PySpark カーネルでデータを探索し、クエリを実行する
Tags
Related Courses
Data Wrangling with MongoDBMongoDB via Udacity Getting and Cleaning Data
Johns Hopkins University via Coursera 软件包在流行病学研究中的应用 Using software apps in epidemiological research
Peking University via Coursera Creating an Analytical Dataset
Udacity Implementing ETL with SQL Server Integration Services
Microsoft via edX