コンテンツにスキップ

Search Modules

対象: pca.search.mcts, pca.search.belief, pca.search.determinized

Purpose

ISMCTS 以外の探索共通部品と hidden-information sampling を提供する。value shaping は mcts.py、hidden state prior/constraint は belief.py、旧探索 path は determinized.py に分かれる。

Modules

Module Role Implementation Details
pca.search.mcts value shaping / legacy root rollout SearchValueConfig、terminal/progress value、selected action delta、aux prize value、旧 root rollout score を実装する。
pca.search.belief belief prior / hidden sampler BeliefPrior, HiddenStateSample, PublicKnowledgeTracker, sample_hidden_state() を持つ。
pca.search.determinized legacy determinized search hidden state を determinization ごとに固定し、root rollout 的に policy score を補正する旧 path。

Public API

API Usage
SearchValueConfig search value の重み設定。
search_value_config_for_profile(name) current, v12_prize_race, v13_aux_prize_race などを解決する。
terminal_value_for_player(...) result reason を考慮して terminal value を返す。
progress_value_for_player(...) サイド・盤面進捗から leaf value を作る。
BeliefPrior hidden hand/deck/prize の soft prior。
PublicKnowledgeTracker.update(obs) 公開ログから hidden constraints を更新する。
sample_hidden_state(...) CABT search API に渡す determinization を作る。
determinized_policy(...) 旧 determinized search policy。

Usage

from pca.search.mcts import search_value_config_for_profile
from pca.search.belief import sample_hidden_state

value_config = search_value_config_for_profile("v13_aux_prize_race")
hidden = sample_hidden_state(obs, your_deck, opponent_deck, rng)

Notes

  • BeliefNet は hidden zone を直接確定しない。soft prior として sampler に渡す。
  • 公開ログから確定できるカードは PublicKnowledgeTracker の hard constraint が優先される。