Data Analytics Fundamentals (Vietnamese)
Offered By: Amazon Web Services via AWS Skill Builder
Course Description
Overview
Mô tả
Trong khóa học theo nhịp độ cá nhân này, bạn sẽ tìm hiểu về quá trình lên kế hoạch các giải pháp phân tích dữ liệu và các quy trình phân tích dữ liệu khác nhau có liên quan. Khóa học này sẽ đưa bạn tiếp cận 5 yếu tố chính cho thấy sự cần thiết của các dịch vụ AWS cụ thể trong việc thu thập, xử lý, phân tích và trình bày dữ liệu của bạn. Khóa học cung cấp kiến thức về các kiến trúc cơ bản, đề xuất giá trị và trường hợp sử dụng tiềm năng. Khóa học này giới thiệu các dịch vụ và giải pháp AWS cho phép bạn xây dựng và tăng cường các giải pháp phân tích dữ liệu.
Đối tượng mục tiêu
Khóa học này dành cho:
- Kiến trúc sư dữ liệu
- Nhà khoa học dữ liệu
- Chuyên viên phân tích dữ liệu
Mục tiêu khóa học
Trong khóa học này, bạn sẽ tìm hiểu cách:
- Xác định đặc điểm của các giải pháp phân tích dữ liệu và những đặc điểm cho thấy một giải pháp có thể cần thiết
- Xác định các loại dữ liệu, bao gồm dữ liệu có cấu trúc, dữ liệu bán cấu trúc và dữ liệu phi cấu trúc
- Xác định các loại lưu trữ dữ liệu như hồ dữ liệu, AWS Lake Formation, kho dữ liệu và Amazon Simple Storage Service (Amazon S3)
- Phân tích đặc điểm và sự khác biệt giữa xử lý hàng loạt và xử lý theo luồng dữ liệu
- Xác định cách sử dụng Amazon Kinesis để xử lý dữ liệu truyền phát
- Phân tích đặc điểm của các hệ thống lưu trữ dữ liệu nguồn khác nhau
- Phân tích đặc điểm của hệ thống xử lý giao dịch trực tuyến (OLTP) và xử lý phân tích trực tuyến (OLAP), cũng như tác động của chúng đến việc tổ chức dữ liệu trong các hệ thống này
- Phân tích sự khác biệt giữa phương pháp lưu trữ dữ liệu dạng cột và dạng hàng
- Xác định phương thức hoạt động của Amazon EMR, AWS Glue và Amazon Redshift để xử lý, làm sạch và chuyển đổi dữ liệu trong một giải pháp phân tích dữ liệu
- Phân tích khái niệm về tuân thủ tính nguyên tố, nhất quán, tách biệt và bền vững (ACID), cũng như tuân thủ độ khả dụng cơ bản, trạng thái mềm, tính nhất quán toàn bộ (BASE) và tìm hiểu một quy trình trích xuất, chuyển đổi và tải (ETL) có thể giúp đảm bảo tuân thủ như thế nào
- Khám phá khái niệm sơ đồ dữ liệu, hiểu rõ cách chúng định nghĩa dữ liệu và thông tin này được lưu trữ trong các kho siêu dữ liệu như thế nào
- Phân tích khái niệm dữ liệu và thông tin
- Nhận diện các phương thức phân tích dữ liệu để cung cấp thông tin cho báo cáo thông qua những công cụ như Amazon QuickSight và Amazon Athena
- Xác định cách thức kết hợp các dịch vụ AWS để trực quan hóa dữ liệu
Điều kiện tiên quyết
Học viên tham gia khóa học này cần đáp ứng các điều kiện tiên quyết sau:
- Có kiến thức thực hành về các khái niệm cơ sở dữ liệu
- Có kiến thức cơ bản về lưu trữ, xử lý và phân tích dữ liệu
- Có kinh nghiệm liên quan đến các hệ thống CNTT doanh nghiệp
Phương pháp giảng dạy
Khóa học này sẽ được cung cấp thông qua việc kết hợp:
- Đào tạo kỹ thuật số
Thời lượng
3,5 giờ
Đề cương khóa học
Khóa học này cung cấp các khái niệm sau:
Bài 1: Giới thiệu các giải pháp phân tích dữ liệu
- Phân tích dữ liệu và các khái niệm phân tích dữ liệu
- Giới thiệu những thách thức trong phân tích dữ liệu
Bài 2: Ổ đĩa – lưu trữ dữ liệu
- Giới thiệu về Amazon S3
- Giới thiệu về hồ dữ liệu
- Giới thiệu các phương thức lưu trữ dữ liệu
Bài 3: Tốc độ – xử lý dữ liệu
- Giới thiệu các phương thức xử lý dữ liệu
- Giới thiệu về xử lý dữ liệu hàng loạt
- Giới thiệu về xử lý dữ liệu theo luồng
Bài 4: Đa dạng – các loại và cấu trúc dữ liệu
- Giới thiệu về lưu trữ dữ liệu nguồn
- Giới thiệu kho dữ liệu có cấu trúc
- Giới thiệu kho dữ liệu bán cấu trúc và kho dữ liệu phi cấu trúc
Bài 5: Tính chính xác – làm sạch và chuyển đổi dữ liệu
- Hiểu rõ về tính toàn vẹn dữ liệu
- Hiểu rõ về tính nhất quán của cơ sở dữ liệu
- Giới thiệu về quy trình ETL
Bài 6: Giá trị – báo cáo và nghiệp vụ thông minh
- Giới thiệu về phân tích dữ liệu
- Giới thiệu về trực quan hóa dữ liệu
Bài 7: Điểm chính cần nhớ
- Kết hợp các thành phần với nhau
- Nội dung tiếp theo
Tags
Related Courses
Understanding China, 1700-2000: A Data Analytic Approach, Part 1The Hong Kong University of Science and Technology via Coursera The Analytics Edge
Massachusetts Institute of Technology via edX 大数据与信息传播 Big Data and Information Dissemination
Fudan University via Coursera The Future of Fashion
Marist College via Independent The Mobile Consumer
Marist College via Independent