Я только что увидел эту лекцию MIT по игровым деревьям и алгоритмам MinMax, где обсуждалась обрезка альфа-бета и прогрессивное углубление.
https://www.youtube.com/watch?v=STjW3eH0CikАлгоритмы игрового дерева и прогрессивное углубление: как аппроксимировать ответ, не доходя до листовых узлов?
Так что если я правильно понял прогрессирующее углубление, когда вы пытаетесь приблизить ответ на каждом уровне и попытаться углубиться в стороне листьев узлов в зависимости от срока вы имеете для вашего переезда. Важно иметь какой-то ответ в любой момент времени. Теперь, в 36:22 Профессор обсуждает случай, когда нам не хватает времени, и мы шли только до уровня (d-1), где d - глубина дерева. И затем он также предлагает, чтобы мы могли иметь временный ответ на каждом уровне по мере того, как мы спускаемся, поскольку мы должны иметь приблизительный ответ в любой момент времени.
Мой вопрос в том, как мы можем получить любой ответ, не обращаясь к узлам листа, потому что только на листовых узлах мы можем заключить, кто может выиграть игру. Подумайте об этом для игры tic-tac-toe. На (d-1) -м уровне нам не хватает информации, чтобы решить, будет ли эта серия движений до тех пор, пока этот узел в (d-1) не выиграет меня или не потеряет меня. На более высоких уровнях говорят (d-3), это еще больше размывается! Все возможно, когда мы идем вниз. Не так ли? Итак, если алгоритм решает вычислить до (d-1) -го уровня, тогда все эти параметры пути равны! Ничто не гарантирует победу, и ничто не гарантирует потерю на уровне (d-1), потому что, если я правильно понимаю победы и потери, можно рассчитать только на листовых узлах. Это так верно, особенно в чистом алгоритме MinMax.
Итак, как именно мы будем иметь «приблизительный ответ» на уровне (d-1) или сказать (d-5) уровень?
Я не уверен, что это то, что вы ищете, но есть много игр, для которых мы можем рассчитать какую-то оценку (вероятность выигрыша) для любой данной позиции.Я думаю, самым известным примером будет шахматы, где вы можете рассчитать балл, основанный на значениях частей и некоторых более сложных вещах. Вы также можете сделать это для Tic-Tac-Toe. – Nelfeal
ОП, я думаю, вы неправильно понимаете смысл страхового полиса. Даже на уровне d вы не «завершаете, кто может выиграть игру» - вы просто размышляете о лучшем возможном действии, зная, что может произойти, если ваш оппонент будет играть наилучшие шаги после вас. Когда вы опускаетесь настолько глубоко, временные ограничения становятся огромной проблемой. Вместо того, чтобы выплескивать случайный ответ, вы можете выбрать лучший ход на основе значений, вычисленных на предыдущей глубине. Таким образом, вы можете продолжать вычислять до и после уровня d, если позволяют время. – arao6