Насколько я понимаю, цель этапа воспроизведения или моделирования в MCTS — получить результат и наградить или наказать узлы на пути от корня во время обратного распространения. (Пожалуйста, поправьте меня, если я ошибаюсь)
Мой вопрос заключается в том, могу ли я использовать эвристику знания предметной области, чтобы получить этот результат, вместо того, чтобы фактически моделировать игру до конца.
Причина, по которой я спрашиваю, заключается в том, что я делаю что-то похожее на поиск пути, и цель состоит в том, чтобы найти путь к целевому состоянию (узлу), что означает, что симуляция игры до конца в моем случае очень сложна.