Сбор и анализ данных в Python
Offered By: Higher School of Economics via Coursera
Course Description
Overview
В этом онлайн-курсе НИУ ВШЭ мы познакомимся с базовыми понятиями статистики, научимся аккуратно собирать данные, обрабатывать их и визуализировать. Также мы поговорим про базовые теоремы, которые используются в математической статистике: ЗБЧ и ЦПТ.
В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.
Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.
Github со всеми материалами курса: https://github.com/FUlyankin/matstat_online
Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач.
На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.
В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.
Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.
Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.
Github со всеми материалами курса: https://github.com/FUlyankin/matstat_online
Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач.
На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.
Syllabus
- Распределения и описательные статистики
- Вспоминаем основные определения из теории вероятностей. Говорим про описательные статистики. Пробуем делать в python простые вещи, связанные с визуализацией, случайными величинами и табличками.
- Особенности в данных
- Говорим про зависимые случайные величины, нормальное распределение и проблемы в данных.
- Сбор и очистка данных
- Разведочный анализ данных и визуализация
- Анализируем данные по мемам и логи магазина. Смотрим на пайплайн знакомства с данными.
- Закон больших чисел и центральная предельная теорема
- Говорим о том, какими бывают сходимости случайных величин, учимся решать задачи с помощью симуляций.
Tags
Related Courses
Introduction to Artificial IntelligenceStanford University via Udacity Probabilistic Graphical Models 1: Representation
Stanford University via Coursera Statistics One
Princeton University via Coursera Intro to Statistics
Stanford University via Udacity Passion Driven Statistics
Wesleyan University via Coursera