Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как переписать код Reinforcement Learning алгоритма под Multi-Agent RL?

Насколько сложно было бы изменить существующий алгоритм обучения с подкреплением для многоагентного случая? Знаю, что существуют определенные фреймворки, разработанные специально для MARL (например, MAVA), но трудно сказать, подходит ли существующий алгоритм RL (решение задачи JSSP) для MARL и нуждается ли он в полном переписывании.
ПрограммированиеМашинное обучение+2
  · 359
Программист  · 13 янв 2022
Скорее всего алгоритм придётся полностью переписать. В обучении с подкреплением агент ищет оптимальные действия. В мультиагентной среде, оптимальность будет зависеть от действий других агентов. Найти её будет гораздо труднее.