RLHF Intro: from Zero to Aligned Intelligent Systems | Igor Kotenkov
Ссылка на презентацию: !AlnN0aqNwShslWtiuDJOR_qt3Urn
Мой телеграм канал:
Список всех моих образовательных материалов, статей, лекций итд:
Перед вами - обзорная-лекция блока Instruct Models Датафеста 2023го года. В ней рассказано о проблемах в мире машинного обучения, о несоответствии функций для оптимизации и реальных задач, для которых модели предназначаются.
В лекции будут рассказаны основы RL, языковых моделей, а затем показано, как эти два направления можно объединить, чтобы тренировать модель напрямую оптимизировать воспринимаемое человеком качество генерации. В заключении будет дан обзор текущих тенденций в мире RLHF (Reinforcement Learning from Human Feedback) и рассказано про то, что же такое AI Alignment и почему им нужно заниматься уже сейчас.
Подпишитесь на наш канал, чтобы не пропустить новые видео о машинном обучении и искусственном интеллекте. Не забудьте поставить лайк и поделиться эти
3 views
122
64
4 months ago 00:02:37 1
ROSALÍA - Despecha (Letra/Lyrics)
4 months ago 00:04:14 1
Daddy Yankee - Gasolina (Video Oficial)
4 months ago 00:06:30 1
Nightwish - Shudder Before The Beautiful (OFFICIAL LIVE)
4 months ago 00:21:02 1
Katana is The Most Fun Melee Weapon in Hunt
4 months ago 00:39:55 1
The Callous Daoboys on Audiotree Live (Full Session)
4 months ago 00:24:14 1
Трагедия Отара Кушанашвили. Драма Зайцева. Жизнь ад Мэттью Перри. Травля Адель. Любовница Лепса
4 months ago 00:20:09 1
Back Connect Beauty! The ASUS GT302 Build
4 months ago 00:14:09 1
Hiking Alone in the Azores
4 months ago 00:28:07 1
Боня настоящая рожа безумия. Решетова и муж Алсу позор! Цирк с битвой экстрасенсов. Путин в КНДР
4 months ago 00:35:04 1
KIA K8 и KIA K5 С МАКСИМАЛЬНОЙ ВЫГОДОЙ ИЗ ЮЖНОЙ КОРЕИ / ПОДБОР ПОД КЛЮЧ / ОТВЕТЫ НА ЧАСТЫЕ ВОПРОСЫ