LLMOps: Optimización de Memoria y Computación en LLMs
Offered By: The Machine Learning Engineer via YouTube
Course Description
Overview
Explora técnicas avanzadas de optimización para Modelos de Lenguaje Grande (LLMs) en este tutorial de 27 minutos. Aprende sobre FlashAttention y GQA como métodos para optimizar las capas de atención, y profundiza en las técnicas de entrenamiento DDP (Distributed Data Parallel) y FSDP (Fully Sharded Data Parallel). Accede a una presentación detallada y un notebook práctico para implementar estos conceptos, mejorando la eficiencia en memoria y computación de tus modelos de lenguaje.
Syllabus
LLMOps: Optimizacion Memoria y Computación en LLM,s #machinelearning #datascience
Taught by
The Machine Learning Engineer
Related Courses
Data AnalysisJohns Hopkins University via Coursera Computing for Data Analysis
Johns Hopkins University via Coursera Scientific Computing
University of Washington via Coursera Introduction to Data Science
University of Washington via Coursera Web Intelligence and Big Data
Indian Institute of Technology Delhi via Coursera