Models Modules¶

対象: pca.models

Purpose¶

Policy/Value model と Belief model の Torch 実装を保持する。legacy checkpoint 互換と v13 unified model を両立するため、model factory と checkpoint metadata を使って構築する。

Module	Role	Implementation Details
`pca.models.belief`	BeliefNet	public observation tokens から opponent hand/deck/prize/threat/KO を予測する supervised model。
`pca.models.policy_value`	legacy model	`ActionConditionedPolicyValueNet`。state/history/action を encode し、legal option ごとの policy score と value を出す。
`pca.models.policy_value_unified.model`	unified model	v13 `UnifiedTokenPolicyValueNet`。object tokens、static card/attack embeddings、shared trunk、multi-head output を持つ。
`pca.models.policy_value_unified.factory`	model factory	checkpoint/model config から legacy/unified model を構築する。
`pca.models.policy_value_unified.tokens`	tensor conversion	unified input tensors を作る。
`pca.models.policy_value_unified.card_static`	static features	static card/attack feature table を embedding input にする。
`pca.models.policy_value_unified.heads`	output heads	policy/value/aux/belief heads を定義する。

API	Usage
`BeliefNet`	hidden zone supervised model。
`ActionConditionedPolicyValueNet`	legacy policy/value checkpoint。
`UnifiedTokenPolicyValueNet`	v13 unified checkpoint。
`create_policy_value_model(model_config, model_class)`	train / inference 共通の model construction。
`load_policy_value_checkpoint(path, torch, ...)`	checkpoint から model と metadata を復元する。

from pca.models.policy_value_unified import create_policy_value_model

model = create_policy_value_model(model_config, model_class="unified")