Открытая лекция «Путешествие в мир LLM Pretrain или как обучить модель весом в терабайт»

16 февраля в 16:40 магистратура «Прикладное машинное обучение и большие данные» и Школа анализа данных Яндекса проведут открытую лекцию «Путешествие в мир LLM Pretrain или как обучить модель весом в терабайт» Валентина Мамедова, руководителя команды претрейнов GigaChat.

На лекции разберём, как на практике обучают модели размером в сотни миллиардов параметров на примере GigaChat Ultra. 

Поговорим о распределённом обучении больших LLM: чем большие модели отличаются от маленьких, зачем нужны MoE-модели и какие оптимизации помогают ускорять и стабилизировать pretrain.

Для кого:

Лекция рассчитана на студентов различных курсов, выпускников и всех, кто интересуется темой ML и программирования.

Место проведения:

Мероприятие пройдёт в НГУ, в аудитории 211КПА, вход открыт для всех желающих, количество мест ограничено. 

Обязательно зарегистрируйтесь в форме.

Продолжая использовать сайт, вы даете согласие на использование cookies и обработку своих данных. Узнайте подробности или измените свои настройки cookies.