Search Modules¶
対象: pca.search.mcts, pca.search.belief, pca.search.determinized
Purpose¶
ISMCTS 以外の探索共通部品と hidden-information sampling を提供する。value shaping は mcts.py、hidden state prior/constraint は belief.py、旧探索 path は determinized.py に分かれる。
Modules¶
| Module | Role | Implementation Details |
|---|---|---|
pca.search.mcts |
value shaping / legacy root rollout | SearchValueConfig、terminal/progress value、selected action delta、aux prize value、旧 root rollout score を実装する。 |
pca.search.belief |
belief prior / hidden sampler | BeliefPrior, HiddenStateSample, PublicKnowledgeTracker, sample_hidden_state() を持つ。 |
pca.search.determinized |
legacy determinized search | hidden state を determinization ごとに固定し、root rollout 的に policy score を補正する旧 path。 |
Public API¶
| API | Usage |
|---|---|
SearchValueConfig |
search value の重み設定。 |
search_value_config_for_profile(name) |
current, v12_prize_race, v13_aux_prize_race などを解決する。 |
terminal_value_for_player(...) |
result reason を考慮して terminal value を返す。 |
progress_value_for_player(...) |
サイド・盤面進捗から leaf value を作る。 |
BeliefPrior |
hidden hand/deck/prize の soft prior。 |
PublicKnowledgeTracker.update(obs) |
公開ログから hidden constraints を更新する。 |
sample_hidden_state(...) |
CABT search API に渡す determinization を作る。 |
determinized_policy(...) |
旧 determinized search policy。 |
Usage¶
from pca.search.mcts import search_value_config_for_profile
from pca.search.belief import sample_hidden_state
value_config = search_value_config_for_profile("v13_aux_prize_race")
hidden = sample_hidden_state(obs, your_deck, opponent_deck, rng)
Notes¶
- BeliefNet は hidden zone を直接確定しない。soft prior として sampler に渡す。
- 公開ログから確定できるカードは
PublicKnowledgeTrackerの hard constraint が優先される。