Статистическое мышление
Offered By: Moscow Institute of Physics and Technology via Coursera
Course Description
Overview
Цель: Сформировать у слушателей статистическую парадигму восприятия действительности (в качестве альтернативы причинной), а также навыки для успешной деятельности в современном мире, имеющем статистическую (вероятностную) природу.
Задачи:
• сформировать у слушателей понимание базовых концепций статистики, теории вероятностей, теории информации, обработки больших данных, планирования и оценки результатов эксперимента;
• сформировать у слушателей базовые навыки обработки данных в Excel;
• сформировать у слушателей базовые навыки презентации итогов анализа средствами Excel;
• сформировать у слушателей навыки сбора данных, и управления качеством на основе контрольных карт Шухарта.
Курс разработан кафедрой технологического предпринимательства МФТИ-РОСНАНО совместно с АНО "еНано".
Задачи:
• сформировать у слушателей понимание базовых концепций статистики, теории вероятностей, теории информации, обработки больших данных, планирования и оценки результатов эксперимента;
• сформировать у слушателей базовые навыки обработки данных в Excel;
• сформировать у слушателей базовые навыки презентации итогов анализа средствами Excel;
• сформировать у слушателей навыки сбора данных, и управления качеством на основе контрольных карт Шухарта.
Курс разработан кафедрой технологического предпринимательства МФТИ-РОСНАНО совместно с АНО "еНано".
Syllabus
- Статистическое мышление против причинного
- Эволюция и причинное мышление. Системное и статистическое мышление. От данных к пониманию. Инструменты системного подхода. Системная динамика. Модель черного ящика. Эмерджентные (возникающие) свойства. Измерение эмерджентных свойств. История возникновения контрольных карт. Практикум: сводные таблицы в Excel.
- Разведочный анализ
- Сбор данных. Генеральная совокупность и выборка. Методы выборки: детерминированная и вероятностная. Простая случайная выборка. Распределение частот, формула Стерджесcа. Типы диаграмм. Принцип Эдварда Тафти минимизации количества элементов диаграммы. Фактор лжи Эдварда Тафти. Как рассказать историю с помощью данных.
- Описательные статистики
- Сводки данных. Меры центральной тенденции. Меры изменчивости. Смещенная и несмещенная оценка. Коэффициент вариации. Пакет анализа. Вычисление параметров генеральной совокупности. Распределения случайной величины. Прямые и обратные функции в Excel. Качество шести сигм. Центральная предельная теорема.
- Теория вероятностей
- Три типа вероятностей. Вероятность события. Закон больших и малых чисел. Выборочное пространство и события. Таблица сопряженности признаков. Безусловная вероятность. Вероятность совместных событий. Вывод формулы Байеса. Байесовский подход. Оптические иллюзии. Проверка гипотез. Формула Байеса, как взвешивание и нормализация. Дерево решений или естественная частота.
- Статистический вывод
- Взаимосвязь разведочного анализа и статистического вывода. Подход пивовара. Переход от физических к t-значениям. Функции статистики Стьюдента в Excel. Степени свободы. t-критерий. Одно- и двунаправленные тесты. Предположения и опровержения. Расчет t-значения, соответствующего заданному уровню значимости. Ошибка первого рода. Ошибка второго рода. Методы повышения статистической мощности эксперимента.
- Распределения с толстыми хвостами
- Закон Бенфорда или закон первой цифры. Закон Ципфа. Логарифмические шкалы. Принцип Парето. Фракталы. Фрактальная размерность. Фрактальная природа экономических и социальных явлений. R/S-анализ. Асимметрия шансов. Масштабируемые и немасштабируемые профессии. Бизнес в длинном хвосте.
- Прогнозирование
- Регрессия. Прогноз на основе экспоненциального сглаживания. Западный и восточный взгляд на тенденции. Управление по тенденциям и событиям. Использование метода Монте-Карло для расчета риска. Оптимизация методом линейного программирования. Кластерный анализ методом k-средних для сегментирования клиентской базы. Системная динамика и iThink. Прогностический анализ и Google Trends.
- Теория информации
- Формулы Хартли и Шеннона. Информация и энтропия. Информация как алгоритм. Избыточность естественных языков. Не всё измеряется в битах. Взгляд изнутри и извне. Метод Ферми оценки нематериального. Оценка Брайера: количественное измерение неопределенности. Тест на калибровку. Дилемма заключенного. Кооперативные игры. Поведенческие финансы. Риск и неопределенность
- Заключение
Taught by
Багузин Сергей Викторович
Tags
Related Courses
Introduction to Artificial IntelligenceStanford University via Udacity Probabilistic Graphical Models 1: Representation
Stanford University via Coursera Statistics One
Princeton University via Coursera Intro to Statistics
Stanford University via Udacity Passion Driven Statistics
Wesleyan University via Coursera