LLMOps: Optimización de Memoria y Computación en LLMs

Offered By: The Machine Learning Engineer via YouTube

Course Description

Overview

Save Big on Coursera Plus. 7,000+ courses at $160 off. Limited Time Only!

Explora técnicas avanzadas de optimización para Modelos de Lenguaje Grande (LLMs) en este tutorial de 27 minutos. Aprende sobre FlashAttention y GQA como métodos para optimizar las capas de atención, y profundiza en las técnicas de entrenamiento DDP (Distributed Data Parallel) y FSDP (Fully Sharded Data Parallel). Accede a una presentación detallada y un notebook práctico para implementar estos conceptos, mejorando la eficiencia en memoria y computación de tus modelos de lenguaje.

Syllabus

LLMOps: Optimizacion Memoria y Computación en LLM,s #machinelearning #datascience

Taught by

The Machine Learning Engineer

LLMOps: Optimización de Memoria y Computación en LLMs

Tags

Course Description

Overview

Syllabus

Taught by

Related Courses

LLMOps: Optimización de Memoria y Computación en LLMs

Tags

Course Description

Overview

Syllabus

Taught by

Related Courses

Login to Continue