В настоящее время я пытаюсь реализовать AI для своей игры Python TicTacToe. Все работает очень, кроме одной ситуации. Мой текущий код:Python TicTacToe minimax неправильно выбрал опцию
def testLine(line):
'''
' :param line: Liste containing 3 ints
' :return: 1, if all elements of the list == 1
' -1, if all elements of the list == -1
' 0, otherwise
'''
if line[0] == 1 and line[1] == 1 and line[2] == 1:
return 1
elif line[0] == -1 and line[1] == -1 and line[2] == -1:
return -1
return 0
def getWinner(board):
# test columns
for idx in range(3):
line = [board[0][idx], board[1][idx], board[2][idx]]
if not testLine(line) == 0:
return line[0]
# test rows
for idx in range(3):
line = board[idx]
if not testLine(line) == 0:
return line[0]
# test diagonals
line = [board[0][0], board[1][1], board[2][2]]
if not testLine(line) == 0:
return line[0]
line = [board[0][2], board[1][1], board[2][0]]
if not testLine(line) == 0:
return line[0]
# no winner
return 0
def count(board, obj):
c = 0
for r in range(len(board)):
for col in range(len(board[r])): # FIXED IT
if board[r][col] == obj:
c += 1
return c
def nextMove(board, player):
if len(board[0]) + len(board[1]) + len(board[2]) == 1: return 0, 4
nextPlayer = player * (-1)
if not getWinner(board) == 0:
if player is 1: return -1, (-1, -1)
else: return 1, (-1, -1)
listOfResults = [] # empty array
if count(board, 0) == 0: # there is no empty field
return 0, (-1, -1)
_list = []
for i in range(len(board)):
for j in range(len(board[i])):
if board[i][j] == 0:
_list.append((i, j))
for (i, j) in _list:
board[i][j] = player
ret, move = nextMove(board, nextPlayer)
listOfResults.append(ret)
board[i][j] = 0
if player is 1:
maxPossibleValue = max(listOfResults)
return maxPossibleValue, _list[listOfResults.index(maxPossibleValue)]
else:
minPossibleValue = min(listOfResults)
return minPossibleValue, _list[listOfResults.index(minPossibleValue)]
if __name__ == '__main__':
print(str(nextMove([[ 1, -1, 0],
[ -1, -1, 1],
[ 1, 1, 0]],
-1)))
Выход: (0, (0, 2))
Я могу с уверенностью сказать, что count
, getWinner
и testLine
работу отлично. Но вывод сценария в самом конце кода просто неверен, так как должно быть (0, 2, 2)
, потому что компьютер должен «заблокировать» мой шанс выиграть в нижней строке. У вас есть предложения по исправлению моего минимаксного алгоритма?
EDIT: Я исправил его. Ошибка была в методе count
. Вы не должны говорить
for col in board[r]
но
for col in range(len(board[r]))
Потому что в противном случае он не будет держать элементы в правильном порядке, и весь метод возвращается ложное значение.
1) пишите unittests для каждого метода 2) Я предполагаю, что эта проблема может быть связана с списками (они изменяемы, кроме того, если вы изменяете связанную копию списка (созданного путем присвоения), также изменяется исходный список) – Sergius
@ Сер Я только что отредактировал этот вопрос, поскольку я успешно его исправил. Спасибо за идею unittests, они мне очень помогли. Первоначально я думал, что в методе 'count' никогда не будет ошибки, поэтому я ее не испытал. Вы заставили меня задуматься об этом, и мне удалось получить эту функцию правильно. Спасибо огромное! – dv02