как следует расширить дерево, если мы хотим максимизировать выгоду от αβ-обрезки?

Привет, ребята, кто-нибудь знает, как решить эту проблему, меня смущает то, как получить ответ, есть ли видео или что-нибудь, что научит вас расширять дерево.

Предположим, вы играете в игру по очереди с нулевой суммой, в которой противник является рациональным агентом, и вы хотели бы использовать двухэтапный взгляд вперед, чтобы решить свой ход. Вы знаете, что полное дерево min-max стратегии двухэтапного просмотра вперед для этой игры будет полным двоичным деревом, как показано на рисунке 1. Предположим, вам предоставлен доступ к эвристической функции, которая даст вам хорошую оценку значения. конечных узлов полного дерева (эти оценочные значения также записаны на рисунке 1).

введите здесь описание изображения

Опираясь на данную эвристику, как следует расширить дерево, если мы хотим максимизировать выгоду от αβ-обрезки? Запишите ответ в виде последовательности ребер, которые нужно посетить.

Мне был дан ответ: e1-e4-e10-e9-e3-e8-e2-e6-e13-e14.


person AnonyGummy    schedule 09.12.2019    source источник


Ответы (1)


Отсечение альфа-бета исключит большинство ветвей из оценки, если лучший дочерний узел (с точки зрения игрока от первого лица на этом уровне) оценивается первым, поэтому e1 перед e2 на глубине 1, потому что e1 имеет более высокий балл, e4 перед e3, потому что мы минимизируем на этом уровне, e10 перед e9 (более высокий балл) и так далее.

person 500 - Internal Server Error    schedule 09.12.2019
comment
хорошо, да, я понимаю, что вы имеете в виду, исходя из порядка, но почему он пропускает часть листа, например, если я сделаю то, что вы сказали, да, я могу придумать порядок, но что заставляет его пропустить часть листа - person AnonyGummy; 09.12.2019
comment
Допустим, мы оцениваем узел после хода e1. Если мы сначала оценим следующий ход e4, мы получим результат 4. Теперь перейдем к оценке дерева игры с ходом e3. Первый ход - е8. Это дает 5, что лучше, чем 4, которые мы получили на e4 с точки зрения игрока 1. Игрок 2 может отказать игроку 1 в возможности сыграть e8 после e3, вместо этого играя e4, поэтому необходимость оценивать e3-e7 отпадает. Это может показаться не такой уж большой оптимизацией для такого неглубокого дерева, как это, но это будет иметь огромное значение для реальных деревьев, например. для шахмат. - person 500 - Internal Server Error; 09.12.2019