Как строить Low Latency-рекомендательный трансформер на миллион RPS / Всеволод Светлов (Яндекс)
Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке:
--------
HighLoad Foundation 2022
Презентация и тезисы:
Я хочу рассказать о нашей модели пользовательских рекомендаций в рекламной сети Яндекса и некоторых проблемах, которые могут возникнуть при внедрении тяжелых нейросетевых моделей в высоконагруженный продакшн.
Примерный план доклада:
* высокоуровневое описание модели, для чего она нужна и как она работает;
* зачем мы разделили полноценный рекомендательный трансформер с early fusion-подходом на независимые части;
...
Нашли ошибку в видео? Пишите нам на support@
1 view
314
93
7 months ago 00:55:32 1
О чем бардак в твоей квартире? Интерьер, ремонт и недвижимость Как определить тип человека по жилью?
7 months ago 00:32:40 1
Как живет Мариуполь-2024. Большая стройка, проблемы, настроения людей
7 months ago 00:06:39 1
Русские идут - русский боевой марш
7 months ago 00:01:50 1
Работаете в сетевом, а команда не строится
7 months ago 00:04:01 1
Как выбрать бассейн для дачи Строительство бассейна
7 months ago 00:00:55 1
Белый Орел - Как упоительны в России вечера калимба
7 months ago 00:08:48 1
Линейная Функция — как БЫСТРО построить график и получить 5-ку