YoVDO

Математика и Python для анализа данных

Offered By: Moscow Institute of Physics and Technology via Coursera

Tags

Data Science Courses Machine Learning Courses Python Courses Linear Algebra Courses Matplotlib Courses pandas Courses NumPy Courses SciPy Courses Probability Theory Courses

Course Description

Overview

Анализ данных и машинное обучение существенно опираются на результаты из математического анализа, линейной алгебры, методов оптимизации, теории вероятностей. Без фундаментальных знаний по этим наукам невозможно понимать, как устроены методы анализа данных. Задача этого курса — сформировать такой фундамент. Мы обойдёмся без сложных формул и доказательств и сделаем упор на интерпретации и понимании смысла математических понятий и объектов.

Для успешного применения методов анализа данных нужно уметь программировать. Фактическим стандартом для этого в наши дни является язык Python. В данном курсе мы предлагаем познакомиться с его синтаксисом, а также научиться работать с его основными библиотеками, полезными для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas.

Видео курса разработаны на Python 2. Задания и ноутбуки к ним адаптированы к Python 3.

Syllabus

  • Введение
    • Добро пожаловать! На этой неделе мы начнём осваивать язык Python — один из главных инструментов специалиста в науке о данных, и вспомним кое-что о производных, которые активно используются при настройке моделей машинного обучения.
  • Библиотеки Python и линейная алгебра
    • На этой неделе мы познакомимся с Python-библиотеками, содержащими большое количество полезных инструментов: от быстрых операций с многомерными массивами до визуализации и реализации различных математических методов. Кроме того, мы освоим линейную алгебру — основной математический аппарат для работы с данными: в большинстве задач данные можно представить в виде векторов или матриц.
  • Оптимизация и матричные разложения
    • На этой неделе мы научимся с помощью методов оптимизации находить наилучшие значения параметров системы, чтобы минимизировать затраты или максимизировать точность предсказаний, а также познакомимся с матричными разложениями, которые используются при построении регрессионных моделей, для уменьшения размерности данных, в рекомендательных системах и в анализе текстов.
  • Случайность
    • На этой неделе мы освоим базовые концепции теории вероятностей и статистики, которые необходимы для понимания механизма работы практически всех методов анализа данных. Мы разберёмся с самыми популярными распределениями, узнаем, какие явления ими описываются и какими статистиками оцениваются их параметры, а также научимся строить доверительные интервалы.

Taught by

Евгений Соколов, Эмели Драль, Виктор Кантор and Евгений Рябенко

Tags

Related Courses

Address Business Issues with Data Science
CertNexus via Coursera
Advanced Clinical Data Science
University of Colorado System via Coursera
Advanced Data Science Capstone
IBM via Coursera
Advanced Data Science with IBM
IBM via Coursera
Advanced Deep Learning Methods for Healthcare
University of Illinois at Urbana-Champaign via Coursera