Обучение с подкреплением в марковских и дифференциальных играх с нулевой суммой

แชร์
ฝัง
  • เผยแพร่เมื่อ 16 ก.ย. 2024
  • В этом видео поговорили про два взгляда на формулировку динамических игр с нулевой суммой: марковский и дифференциальный. Для каждого рассмотрим оптимальные стратегии игроков и равновесие в игре. Обсудим плюсы и минусы подходов и выведем адекватные алгоритмы мультиагентного обучения с подкреплением для решения таких задач.
    Спикер: Антон Плаксин. Исследователь в Imperial College London. Ранее работал в Yandex.Research и ИММ УрО РАН.
    #вк #яндекс #айти #vk #yandex #it #llm
    __________
    Подписывайся на наши соц. сети:
    LinkedIn UnionVK: / unionvk
    Instagram UnionVK: / unionvk_
    LinkedIn YNDX Family: / yndx-family
    Instagram YNDX Family: / yndxfamily

ความคิดเห็น •