Сбор и анализ данных в Python
Offered By: Higher School of Economics via Coursera
Course Description
Overview
В этом онлайн-курсе НИУ ВШЭ мы познакомимся с базовыми понятиями статистики, научимся аккуратно собирать данные, обрабатывать их и визуализировать. Также мы поговорим про базовые теоремы, которые используются в математической статистике: ЗБЧ и ЦПТ.
В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.
Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.
Github со всеми материалами курса: https://github.com/FUlyankin/matstat_online
Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач.
На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.
В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.
Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.
Github со всеми материалами курса: https://github.com/FUlyankin/matstat_online
Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач.
На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.
Syllabus
- Распределения и описательные статистики
- Вспоминаем основные определения из теории вероятностей. Говорим про описательные статистики. Пробуем делать в python простые вещи, связанные с визуализацией, случайными величинами и табличками.
- Особенности в данных
- Говорим про зависимые случайные величины, нормальное распределение и проблемы в данных.
- Сбор и очистка данных
- Разведочный анализ данных и визуализация
- Анализируем данные по мемам и логи магазина. Смотрим на пайплайн знакомства с данными.
- Закон больших чисел и центральная предельная теорема
- Говорим о том, какими бывают сходимости случайных величин, учимся решать задачи с помощью симуляций.
Tags
Related Courses
Artificial Intelligence for RoboticsStanford University via Udacity Intro to Computer Science
University of Virginia via Udacity Design of Computer Programs
Stanford University via Udacity Web Development
Udacity Programming Languages
University of Virginia via Udacity