Обобщенные линейные модели
Offered By: Saint Petersburg State University via Coursera
Course Description
Overview
Результаты подсчета чего-либо или вероятности возникновения событий - это величины, практически не поддающиеся моделированию при помощи обычных линейных моделей, так как не подчиняются нормальному распределению. Обобщенные линейные модели (Generalized Linear Models, GLM) позволяют обойти это ограничение. В этом курсе мы постараемся с минимальным количеством математики рассказать об устройстве GLM и многочисленных подводных камнях, связанных с анализом. GLM для счетных данных основаны на распределении Пуассона или отрицательном биномиальном распределении. Модели для бинарных данных (например, логистическая регрессия) - на биномиальном распределении. Мы обсудим особенности диагностики моделей, возникающие в зависимости от выбранного распределения. Параметры GLM подбирают при помощи метода максимального правдоподобия, поэтому и аппарат тестирования гипотез и техники упрощения моделей довольно сильно отличаются от привычного для простых линейных моделей. Для анализа данных мы будем использовать язык R, чтобы вы могли лучше разобраться в тонкостях работы с обобщенными линейными моделями. Вас ждут интерактивные задания на платформе Stepic и проект по анализу данных в конце курса.
Этот курс для всех, кто хочет научиться строить модели для счетных или бинарных величин. Для успешного прохождения пригодятся базовые представления о регрессионном анализе, умение создавать простейшие .html документы при помощи rmarkdown и knitr.
Этот курс для всех, кто хочет научиться строить модели для счетных или бинарных величин. Для успешного прохождения пригодятся базовые представления о регрессионном анализе, умение создавать простейшие .html документы при помощи rmarkdown и knitr.
Syllabus
- Знакомство с обобщенными линейными моделями
- Обобщенные линейные модели (GLM) позволяют моделировать поведение величин, не подчиняющихся нормальному распределению. Чтобы первые шаги в мире GLM были легче, мы разберем их устройство на примере GLM для нормально распределенных величин - так вы сможете проводить параллели с простыми линейными моделями. Вы узнаете, что такое функция связи, как работает метод максимального правдоподобия и научитесь тестировать гипотезы о GLM при помощи тестов Вальда и тестов отношения правдоподобий.
- Проблема выбора модели
- В этом модуле мы поговорим о методологических проблемах, связанных с построением моделей. Модель есть упрощенное отображение реальности и выбор между разными конкурирующими способами такого упрощения - частая задача аналитика. В этом модуле вы научитесь сравнивать модели при помощи информационных критериев. Мы обсудим основные варианты хода анализа при выборе моделей и поговорим о сложностях, возникающих в связи со скрытой множественностью моделей. Наконец, мы научим вас распознавать основные виды злоупотреблений при выборе моделей (data-fishing, p-hacking).
- Обобщенные линейные модели для счетных данных
- В этом модуле мы обсудим основные методы моделирования счетных величин. Для начала мы обсудим, почему обычные линейные модели не годятся для счетных данных. Свойства счетных распределений помогут вам понять отличия разновидностей GLM для счетных данных и особенности их диагностики. Вы своими глазами увидите работу функции связи, когда будете визуализировать предсказания GLM в масштабе функции связи и в масштабе переменной отклика.
- Обобщенные линейные модели с бинарным откликом
- Иногда возникает необходимость моделировать наступило ли какое-то событие или нет, выиграла ли футбольная команда или проиграла, выздоровел ли пациент после лечения или нет, совершил ли клиент покупку или нет. Для модели рования таких бинарных данных (событий с двумя исходами) не подходят обычные линейные модели, но это легко можно сделать при помощи обобщенных линейных моделей. В этом модуле вы научитесь моделировать вероятности наступления событий, представляя их в виде шансов. Мы разберем, как устроена функция связи логит и как интерпретируются коэффициенты GLM в случае ее применения. Наконец, вы сможете попрактиковаться в анализе обобщенных линейных моделей с разными распределениями, выполнив проект по анализу данных. Результаты этого анализа нужно будет представить в виде отчета в формате html, написанного при помощи rmarkdown/knitr.
Taught by
Варфоломеева Марина Александровна and Хайтов Вадим Михайлович
Tags
Related Courses
MBA Core CurriculumUniversity System of Maryland via edX حدث كايزن في شرائح جوجل
Coursera Project Network via Coursera A Organização Centrada na Jornada do Cliente
Fundação Instituto de Administração via Coursera Accounting Data Analytics
University of Illinois at Urbana-Champaign via Coursera Data Analytics in Accounting Capstone
University of Illinois at Urbana-Champaign via Coursera