Alpha Beta Checkers — всегда побеждает один и тот же игрок

Я реализую простой ИИ для шашек с использованием альфа-бета (минимаксного) поиска и завершаю реализацию. У меня есть два игрока, 1 и 2, но независимо от того, какую глубину я использую для поиска (даже если глубина 1 больше глубины 2), кажется, что игрок 2 побеждает. Кажется, я не могу понять, что я делаю неправильно. Есть ли у вас какие-либо мысли о том, что может быть причиной этого? Я не уверен, что моя реализация альфа-бета-поиска полностью правильна или я что-то неправильно понимаю. Игра работает нормально, просто результаты не такие, как ожидалось. Пожалуйста, дайте мне знать, если я могу прояснить это каким-либо образом. Ваша помощь очень ценится! Я удалил графический интерфейс для целей этого вопроса, но это не должно ни на что влиять. Большое спасибо!

Board — это класс с атрибутом board, представляющим собой массив целых чисел 8x8. 0 пустое место

1 белая часть

2 красный кусок

3 белых короля

4 красный король

class Player:
    def __init__(self, id, depth):
        self.id = id
        self.depth = depth

    def board_eval(self, board):
        if len(board.get_moves(self.id)) == 0:
            return float('inf')*-1
        else:
            red = 0
            redK = 0
            white = 0
            whiteK = 0
            for r in range(len(board.board[0])):
                for c in range(len(board.board[0])):
                    if board.board[r][c]>0:
                        if board.board[r][c]==1:
                            white+=1
                        elif board.board[r][c]==2:
                            red+=1
                        elif board.board[r][c]==3:
                            whiteK+=1
                        elif board.board[r][c]==4:
                            redK+=1
            if self.id == 1:
                return white+whiteK-red-redK
            else:
                return red+redK-white-whiteK

    def minimax (self, board, depth, alpha, beta, player):
        board_value = self.board_eval(board)
        if depth == 0 or board_value == float('inf') or board_value == float('inf')*-1:
            return board_value
        if self.id == player:
            for poss_board in board.get_moves(player):
                alpha = max(alpha, self.minimax(poss_board, depth - 1, alpha, beta, (player%2)+1))
                if (alpha >= beta):
                    break
            return alpha
        else:
            for poss_board in board.get_moves(player): #TODO: should this be the other player? pretty sure no
                beta = min(beta, self.minimax(poss_board, depth - 1, alpha, beta, (player%2)+1))
                if (beta <= alpha):
                    break
            return beta


    def update_board(self, board):
        best_move = None
        best_score = float('inf') * -1
        for poss_move in board.get_moves(self.id):
            alpha = self.minimax(poss_move, self.depth-1, best_score, float('inf'), (self.id%2)+1)
            if best_move is None or alpha > best_score:
                best_move = poss_move
                best_score = alpha
            elif alpha == best_score and random.random() <= 0.3: #arbitrary randomness if multiple best moves
                best_move = poss_move
        return best_move

class Game:
    def __init__(self):
        self.board = Board()
        self.p1 = Player(1, 4) #id, depth
        self.p2 = Player(2, 2) 
        self.height=800
        self.width=800
        self.win= GraphWin("Checkerboard", self.width, self.height)
        self.lag_win = GraphWin("Prev Board", self.width, self.height)
        self.lag_board = copy.deepcopy(self.board)
        self.cell_size = 50     # Height and width of checkerboard squares.
        self.offset_x = (self.width - 8*self.cell_size) / 2
        self.offset_y = (self.height - 8*self.cell_size) / 2

    def play(self):
        while True:
            self.board = self.p1.update_board(self.board)
            if self.board is None: #print("Game over, player 2 wins\n")
                return 2
            self.board = self.p2.update_board(self.board)
            if self.board is None: #print("Game over, player 1 wins\n")
                return 1

game = Game()
winner = game.play()

user3587051 17.12.2015 источник

Ответы (1)

arrow_upward
-1
arrow_downward

Кажется, что ваш board_eval возвращает счет относительно игрока, но минимаксная часть кода, похоже, предполагает абсолютный счет. Что произойдет, если исключить if из board_eval и только return white+whiteK-red-redK?

Jeff Y 29.12.2015

Alpha Beta Checkers — всегда побеждает один и тот же игрок

Ответы (1)

Похожие вопросы