Управление вычислениями
Offered By: Bioinformatics Institute via Stepik
Course Description
Overview
Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.
Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.
Syllabus
Введение
1.1 Введение
Контейнеризация и Docker
2.1 Знакомство с Docker
2.2 Работа с файлами в контейнерах Docker
2.3 Взаимодействие контейнеров Docker
2.4 Работа с образами Docker
2.5 Технологические основы и роль контейнеризации
Workflows и Pipelines
3.1 Работа с данными и пайплайны
3.2 Инструменты пайплайнинга и подходы к описанию пайплайнов
3.3 Snakemake: имплицитное описание графа анализа
3.4 Snakemake: создание пайплайнов
Common Workflow Language
4.1 Знакомство с CWL
4.2 Описание инструментов с использованием CWL
4.3 CWL: полезные компоненты
4.4 CWL: создание пайплайнов
Заключение
5.1 Заключение
Taught by
Anton Bragin and Sergei Mozgov
Tags
Related Courses
A Beginner’s Guide to DockerPackt via FutureLearn A Beginner's Guide to Kubernetes for Container Orchestration
Packt via FutureLearn Beginner’s Guide to Containers and Orchestration
A Cloud Guru Designing High Availability, Fault Tolerance, and DR with AWS Services
A Cloud Guru Docker Certified Associate (DCA)
A Cloud Guru