Models Modules¶
対象: pca.models
Purpose¶
Policy/Value model と Belief model の Torch 実装を保持する。legacy checkpoint 互換と v13 unified model を両立するため、model factory と checkpoint metadata を使って構築する。
Modules¶
| Module | Role | Implementation Details |
|---|---|---|
pca.models.belief |
BeliefNet | public observation tokens から opponent hand/deck/prize/threat/KO を予測する supervised model。 |
pca.models.policy_value |
legacy model | ActionConditionedPolicyValueNet。state/history/action を encode し、legal option ごとの policy score と value を出す。 |
pca.models.policy_value_unified.model |
unified model | v13 UnifiedTokenPolicyValueNet。object tokens、static card/attack embeddings、shared trunk、multi-head output を持つ。 |
pca.models.policy_value_unified.factory |
model factory | checkpoint/model config から legacy/unified model を構築する。 |
pca.models.policy_value_unified.tokens |
tensor conversion | unified input tensors を作る。 |
pca.models.policy_value_unified.card_static |
static features | static card/attack feature table を embedding input にする。 |
pca.models.policy_value_unified.heads |
output heads | policy/value/aux/belief heads を定義する。 |
Public API¶
| API | Usage |
|---|---|
BeliefNet |
hidden zone supervised model。 |
ActionConditionedPolicyValueNet |
legacy policy/value checkpoint。 |
UnifiedTokenPolicyValueNet |
v13 unified checkpoint。 |
create_policy_value_model(model_config, model_class) |
train / inference 共通の model construction。 |
load_policy_value_checkpoint(path, torch, ...) |
checkpoint から model と metadata を復元する。 |
Usage¶
from pca.models.policy_value_unified import create_policy_value_model
model = create_policy_value_model(model_config, model_class="unified")
Notes¶
- checkpoint の
model_classとmodel_configを優先して復元する。 - v13 unified は policy/value に加えて aux prize heads と integrated belief heads を持てる。