Обучение с подкреплением в марковских и дифференциальных играх с нулевой суммой
ฝัง
- เผยแพร่เมื่อ 16 ก.ย. 2024
- В этом видео поговорили про два взгляда на формулировку динамических игр с нулевой суммой: марковский и дифференциальный. Для каждого рассмотрим оптимальные стратегии игроков и равновесие в игре. Обсудим плюсы и минусы подходов и выведем адекватные алгоритмы мультиагентного обучения с подкреплением для решения таких задач.
Спикер: Антон Плаксин. Исследователь в Imperial College London. Ранее работал в Yandex.Research и ИММ УрО РАН.
#вк #яндекс #айти #vk #yandex #it #llm
__________
Подписывайся на наши соц. сети:
LinkedIn UnionVK: / unionvk
Instagram UnionVK: / unionvk_
LinkedIn YNDX Family: / yndx-family
Instagram YNDX Family: / yndxfamily