Нейронные сети для подкрепленного обучения. Q-learning, Policy Gradient. Решение задач оптимизации и планирования.
Введение в подкрепленное обучение и его задачи Подкрепленное обучение — это область машинного обучения, которая занимается изучением того, как участники, называемые агентами, должны принимать решения в некоторой среде, чтобы максимизировать некоторую награду. В отличие от других типов обучения, где обучающие…