Search Modules¶

対象: pca.search.mcts, pca.search.belief, pca.search.determinized

Purpose¶

ISMCTS 以外の探索共通部品と hidden-information sampling を提供する。value shaping は mcts.py、hidden state prior/constraint は belief.py、旧探索 path は determinized.py に分かれる。

Modules¶

Module	Role	Implementation Details
`pca.search.mcts`	value shaping / legacy root rollout	`SearchValueConfig`、terminal/progress value、selected action delta、aux prize value、旧 root rollout score を実装する。
`pca.search.belief`	belief prior / hidden sampler	`BeliefPrior`, `HiddenStateSample`, `PublicKnowledgeTracker`, `sample_hidden_state()` を持つ。
`pca.search.determinized`	legacy determinized search	hidden state を determinization ごとに固定し、root rollout 的に policy score を補正する旧 path。

Public API¶

API	Usage
`SearchValueConfig`	search value の重み設定。
`search_value_config_for_profile(name)`	`current`, `v12_prize_race`, `v13_aux_prize_race` などを解決する。
`terminal_value_for_player(...)`	result reason を考慮して terminal value を返す。
`progress_value_for_player(...)`	サイド・盤面進捗から leaf value を作る。
`BeliefPrior`	hidden hand/deck/prize の soft prior。
`PublicKnowledgeTracker.update(obs)`	公開ログから hidden constraints を更新する。
`sample_hidden_state(...)`	CABT search API に渡す determinization を作る。
`determinized_policy(...)`	旧 determinized search policy。

Usage¶

from pca.search.mcts import search_value_config_for_profile
from pca.search.belief import sample_hidden_state

value_config = search_value_config_for_profile("v13_aux_prize_race")
hidden = sample_hidden_state(obs, your_deck, opponent_deck, rng)

Notes¶

BeliefNet は hidden zone を直接確定しない。soft prior として sampler に渡す。
公開ログから確定できるカードは PublicKnowledgeTracker の hard constraint が優先される。