В настоящее время я использую Q-Learning, чтобы попытаться научить бота перемещаться в комнате, заполненной стенами/препятствиями. Он должен начинаться в любом месте комнаты и добираться до состояния
Мне нужно выполнить некоторую работу с Q Learning, о парне, который должен перемещать мебель вокруг дома (это в основном это). Если дом достаточно мал, я могу просто иметь матрицу, которая представляе
Представим себе, что у нас есть плоскость (x, y), где робот может двигаться. Теперь мы определяем середину нашего мира как состояние цели, а это означает, что мы собираемся дать вознаграждение 100 наш
Я рассматриваю возможность использования нейронной сети для вождения своих врагов в космической шутерской игре, которую я создаю, и мне интересно; как вы тренируете нейронные сети, когда нет ни одного
Для проекта ai-class мне нужно реализовать алгоритм обучения подкрепления, который превосходит простую игру тетриса. Игра написана на Java, и у нас есть исходный код. Я знаю основы теории обучения под