Сравнение и создание групп
Offered By: Novosibirsk State University via Coursera
Course Description
Overview
Курс посвящен статистическому сравнению характеристик групп и категорий.
В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок. Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Случайны различия между группами или закономерны?
Курс научит искать ответы на такие вопросы.
Вторая половина курсов посвящена выделению групп на основе эмпирических данных. Есть ли структура в данных? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные, узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи.
В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков.
Узнать об образовательных программах Новосибирского государственного университета: https://education.nsu.ru/bachelor/
В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок. Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Случайны различия между группами или закономерны?
Курс научит искать ответы на такие вопросы.
Вторая половина курсов посвящена выделению групп на основе эмпирических данных. Есть ли структура в данных? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные, узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи.
В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков.
Узнать об образовательных программах Новосибирского государственного университета: https://education.nsu.ru/bachelor/
Syllabus
- Одновыборочные и двухвыборочные критерии
- В первом модуле курса мы начнем разбираться со статистическими инструментами сравнения параметров и распределений в группах. Сначала поговорим об основных задачах межгрупповых сравнений, затем рассмотрим одновыборочные и двухвыборочные критерии, научимся сравнивать связанные и несвязанные выборки и посмотрим на практике, на реальных данных, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты.
- Сравнение нескольких выборок
- В этом модуле мы продолжим разговор о сравнении групп. Мы научимся сравнивать несколько групп при помощи разных инструментов, грамотно выбирать инструменты исходя из задачи и типа данных, с которыми мы работаем, и на практике, на реальных данных посмотрим, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты.
- Введение в кластерный анализ
- В третьем модуле курса мы поговорим о методах выделения групп. Если до этого мы сравнивали группы, которые уже были нам известны, то во второй половине курса мы будем говорить о том, как обнаружить группы в данных, как их выделить, охарактеризовать, и что можно делать с построенной классификацией дальше. Основной фокус модуля - агломеративные методы классификации. В заключении, как всегда, практика на реальных данных.
- Итерационные методы кластерного анализа
- В заключительном модуле курса мы разберемся с еще одним классом методов кластеризации - с итерационными методами: увидим, как работают алгоритмы, каковы возможности и ограничения разных алгоритмов, научимся строить классификации, оценивать их качество, характеризовать и анализировать полученные группы, а также разберем некоторые инструменты визуализации результатов классификации. В заключении, как всегда, практика на реальных данных.
- Итоговое задание
- В заключительном модуле курса вам предлагается применить полученные в курсе знания и выполнить собственный проект на реальных данных, предоставленных компанией 2GIS. Сначала пройдите итоговый тест и оцените, насколько хорошо вы усвоили материал курса. Затем внимательно прочтите инструкции и выполните расчетное задание. Вам предстоит построить кластерную модель, а также попрактиковаться в сравнении групп. Не забывайте о том, что в вашем распоряжении форум, и если что-то не получается, можно обратиться за помощью к сокурсникам, которые, возможно, встречались с теми же проблемами и нашли решение.
Taught by
Ольга Ечевская, Виктор Дёмин and Наталья Галанова
Tags
Related Courses
Introduction to Artificial IntelligenceStanford University via Udacity Probabilistic Graphical Models 1: Representation
Stanford University via Coursera Statistics One
Princeton University via Coursera Intro to Statistics
Stanford University via Udacity Passion Driven Statistics
Wesleyan University via Coursera