reinforcement-learning

1зной

1ответ

В настоящее время я использую Q-Learning, чтобы попытаться научить бота перемещаться в комнате, заполненной стенами/препятствиями. Он должен начинаться в любом месте комнаты и добираться до состояния

1зной

1ответ

Функции обобщения для Q-Learning

Мне нужно выполнить некоторую работу с Q Learning, о парне, который должен перемещать мебель вокруг дома (это в основном это). Если дом достаточно мал, я могу просто иметь матрицу, которая представляе

1зной

1ответ

QLearning и нескончаемые эпизоды

Представим себе, что у нас есть плоскость (x, y), где робот может двигаться. Теперь мы определяем середину нашего мира как состояние цели, а это означает, что мы собираемся дать вознаграждение 100 наш

5зной

4ответ

Как использовать нейронные сети для решения «мягких» решений?

Я рассматриваю возможность использования нейронной сети для вождения своих врагов в космической шутерской игре, которую я создаю, и мне интересно; как вы тренируете нейронные сети, когда нет ни одного

23зной

6ответ

Хорошие реализации обучения усилению?

Для проекта ai-class мне нужно реализовать алгоритм обучения подкрепления, который превосходит простую игру тетриса. Игра написана на Java, и у нас есть исходный код. Я знаю основы теории обучения под