AWS ML Engineer Associate 1.2 Transform Data (Simplified Chinese)
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
本课程内容涉及机器学习 (ML) 生命周期中数据准备阶段的部分内容。在本课程中,您将学习数据转换的相关知识。本课程涵盖各种转换概念和技巧,例如数据清理、编码和特征工程。您将了解如何使用 Amazon SageMaker Feature Store、Amazon SageMakerData Wrangler 和 AWS Glue 等 Amazon Web Services (AWS) 服务来转换您的数据。
- 课程级别:300
- 时长:60 分钟
注意:本课程具有本地化的注释/字幕。 旁白保留英语。要显示字幕,请单击播放器右下角的 CC 按钮。
课程内容
- 在线资料
- 演示
- 知识考核问题
- 课程评估
课程目标
- 阐明数据清理和转换的价值。
- 说明如何处理错误或重复的数据。
- 说明如何检测和处理异常值。
- 说明如何处理缺失值。
- 介绍基本的编码技术。
- 确定特征工程使用案例。
- 介绍特征工程的基本概念、优势和技术。
- 介绍基本的特征选择技巧。
- 描述用于验证和标记数据的 AWS 服务。
- 确定用于可视化和转换数据的 AWS 工具和服务。
- 说明如何使用 SageMaker Feature Store 摄取数据和管理特征。
- 说明如何使用 Amazon Sagemaker Data Wrangler 摄取和转换数据。
- 说明如何使用 AWS Glue 转换数据。
- 确定用于转换流数据的 AWS 工具和服务。
- 说明如何使用 AWS Lambda 和 Apache Spark on Amazon EMR 转换流数据。
培训对象
- 云架构师
- 机器学习工程师
建议具备的技能
- 拥有至少 1 年使用 Amazon SageMaker 和其他 AWS 服务进行 ML 工程工作的经验。
- 至少从事 1 年相关角色的工作,例如后端软件开发人员、DevOps 开发人员、数据工程师或数据科学家。
- 对 Python 等编程语言有基本的了解。
- 已完成 AWS ML Engineer Associate 学习计划的前几门课程。
课程大纲
- 第 1 部分:简介
- 第 1 课:如何学习本课程
- 第 2 课:课程概览
- 第 3 课:数据转换的基础知识
- 第 2 部分:数据清理技术
- 第 4 课:错误数据和重复数据
- 第 5 课:数据异常值
- 第 6 课:数据不完整或缺失
- 第 3 部分:分类编码技术
- 第 7 课:分类编码
- 第 8 课:编码技术
- 第 4 部分:特征工程
- 第 9 课:特征工程概念
- 第 10 课:数值特征工程
- 第 11 课:文本特征工程
- 第 12 课:特征选择技巧
- 第 5 部分:用于数据转换的 AWS 工具和服务
- 第 13 课:使用 AWS 进行数据标注
- 第 14 课:使用 AWS 进行数据摄取
- 第 15 课:使用 AWS 进行数据转换
- 第 16 课:使用 AWS Glue 转换数据
- 第 6 部分:总结
- 第 17 课:课程总结
- 第 18 课:评估
- 第 19 课:联系我们
Tags
Related Courses
Amazon SageMaker: Simplifying Machine Learning Application DevelopmentAmazon Web Services via edX Developing Machine Learning Applications
Amazon via Independent AWS Computer Vision: Getting Started with GluonCV
Amazon Web Services via Coursera AWS Machine Learning Engineer Nanodegree
Kaggle via Udacity Image Classification with Amazon Sagemaker
Coursera Project Network via Coursera