Minimax, похоже, отлично справляется с тем, чтобы не проиграть, но это очень фаталистично, если предположить, что противник не допустит ошибку. Конечно, многие игры решаются на ничью, но нужно играть за «максимально возможное стремление к победе, не рискуя проиграть», даже если нет принудительных побед. То есть, если два дерева с одинаковым (вытянутым) конечным положением, которым придается оптимальное воспроизведение, как можно настроить алгоритм, чтобы предпочесть тот, который, скорее всего, выиграет, если противник сделает субоптимальное движение или сделает противника более вероятно, ускорится?Как алгоритм минимакса может быть более оптимистичным?
Используя простой пример Tic-Tac-Toe, более сильный игрок часто стремился устанавливать вилки и тем самым гарантировать победы. Несмотря на то, что противник мог видеть такой трюк и останавливать его заранее, они с большей вероятностью пропустят это, чем если бы вы просто положили два Xs в пустую строку и надеетесь, что они на мгновение забудут, в какую игру они играют. Точно так же сильный игрок будет стремиться начинать в центре или, возможно, в углу, но в простом минимаксном нет никакой причины (так как вы все равно можете заставить ничью) не выбрать краевой квадрат.
Я не думаю, что это решение напрямую связано с тем, что оно связано с неполными информационными играми (то есть вы должны предвидеть (относительно простой и предсказуемый) хаос из игры, а не хаос от вашего противника.) Тем не менее, это, безусловно, кажется хорошей отправной точкой для дальнейшего мышления. Спасибо. – Josiah