YoVDO

Сравнение и создание групп

Offered By: Novosibirsk State University via Coursera

Tags

Social Sciences Courses Statistics & Probability Courses R Programming Courses SPSS Courses Statistical Analysis Courses Non-Parametric Tests Courses Data-Driven Decision Making Courses Clustering Algorithms Courses

Course Description

Overview

Курс посвящен статистическому сравнению характеристик групп и категорий.
В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок. Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Случайны различия между группами или закономерны?
Курс научит искать ответы на такие вопросы.
Вторая половина курсов посвящена выделению групп на основе эмпирических данных. Есть ли структура в данных? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные, узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи.
В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков.

Узнать об образовательных программах Новосибирского государственного университета: https://education.nsu.ru/bachelor/

Syllabus

  • Одновыборочные и двухвыборочные критерии
    • В первом модуле курса мы начнем разбираться со статистическими инструментами сравнения параметров и распределений в группах. Сначала поговорим об основных задачах межгрупповых сравнений, затем рассмотрим одновыборочные и двухвыборочные критерии, научимся сравнивать связанные и несвязанные выборки и посмотрим на практике, на реальных данных, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты.
  • Сравнение нескольких выборок
    • В этом модуле мы продолжим разговор о сравнении групп. Мы научимся сравнивать несколько групп при помощи разных инструментов, грамотно выбирать инструменты исходя из задачи и типа данных, с которыми мы работаем, и на практике, на реальных данных посмотрим, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты.
  • Введение в кластерный анализ
    • В третьем модуле курса мы поговорим о методах выделения групп. Если до этого мы сравнивали группы, которые уже были нам известны, то во второй половине курса мы будем говорить о том, как обнаружить группы в данных, как их выделить, охарактеризовать, и что можно делать с построенной классификацией дальше. Основной фокус модуля - агломеративные методы классификации. В заключении, как всегда, практика на реальных данных.
  • Итерационные методы кластерного анализа
    • В заключительном модуле курса мы разберемся с еще одним классом методов кластеризации - с итерационными методами: увидим, как работают алгоритмы, каковы возможности и ограничения разных алгоритмов, научимся строить классификации, оценивать их качество, характеризовать и анализировать полученные группы, а также разберем некоторые инструменты визуализации результатов классификации. В заключении, как всегда, практика на реальных данных.
  • Итоговое задание
    • В заключительном модуле курса вам предлагается применить полученные в курсе знания и выполнить собственный проект на реальных данных, предоставленных компанией 2GIS. Сначала пройдите итоговый тест и оцените, насколько хорошо вы усвоили материал курса. Затем внимательно прочтите инструкции и выполните расчетное задание. Вам предстоит построить кластерную модель, а также попрактиковаться в сравнении групп. Не забывайте о том, что в вашем распоряжении форум, и если что-то не получается, можно обратиться за помощью к сокурсникам, которые, возможно, встречались с теми же проблемами и нашли решение.

Taught by

Ольга Ечевская, Виктор Дёмин and Наталья Галанова

Tags

Related Courses

Bioinformatics Algorithms (Part 2)
University of California, San Diego via Coursera
Genomic Data Science and Clustering (Bioinformatics V)
University of California, San Diego via Coursera
Fraud Detection in Python
DataCamp
Deep Learning and Reinforcement Learning
IBM via Coursera
AI Workflow: Feature Engineering and Bias Detection
IBM via Coursera