YoVDO

Управление вычислениями

Offered By: Bioinformatics Institute via Stepik

Tags

DevOps Courses Data Analysis Courses Docker Courses Linux Containers Courses

Course Description

Overview

Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.

Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.

 


Syllabus

Введение


1.1 Введение

Контейнеризация и Docker


2.1 Знакомство с Docker


2.2 Работа с файлами в контейнерах Docker


2.3 Взаимодействие контейнеров Docker


2.4 Работа с образами Docker


2.5 Технологические основы и роль контейнеризации

Workflows и Pipelines


3.1 Работа с данными и пайплайны


3.2 Инструменты пайплайнинга и подходы к описанию пайплайнов


3.3 Snakemake: имплицитное описание графа анализа


3.4 Snakemake: создание пайплайнов

Common Workflow Language


4.1 Знакомство с CWL


4.2 Описание инструментов с использованием CWL


4.3 CWL: полезные компоненты


4.4 CWL: создание пайплайнов

Заключение


5.1 Заключение


Taught by

Anton Bragin and Sergei Mozgov

Tags

Related Courses

Startup Engineering
Stanford University via Coursera
Developing Scalable Apps in Java
Google via Udacity
Cloud Computing Concepts, Part 1
University of Illinois at Urbana-Champaign via Coursera
Cloud Networking
University of Illinois at Urbana-Champaign via Coursera
Cloud Computing Concepts: Part 2
University of Illinois at Urbana-Champaign via Coursera