コンテンツにスキップ

Models Modules

対象: pca.models

Purpose

Policy/Value model と Belief model の Torch 実装を保持する。legacy checkpoint 互換と v13 unified model を両立するため、model factory と checkpoint metadata を使って構築する。

Modules

Module Role Implementation Details
pca.models.belief BeliefNet public observation tokens から opponent hand/deck/prize/threat/KO を予測する supervised model。
pca.models.policy_value legacy model ActionConditionedPolicyValueNet。state/history/action を encode し、legal option ごとの policy score と value を出す。
pca.models.policy_value_unified.model unified model v13 UnifiedTokenPolicyValueNet。object tokens、static card/attack embeddings、shared trunk、multi-head output を持つ。
pca.models.policy_value_unified.factory model factory checkpoint/model config から legacy/unified model を構築する。
pca.models.policy_value_unified.tokens tensor conversion unified input tensors を作る。
pca.models.policy_value_unified.card_static static features static card/attack feature table を embedding input にする。
pca.models.policy_value_unified.heads output heads policy/value/aux/belief heads を定義する。

Public API

API Usage
BeliefNet hidden zone supervised model。
ActionConditionedPolicyValueNet legacy policy/value checkpoint。
UnifiedTokenPolicyValueNet v13 unified checkpoint。
create_policy_value_model(model_config, model_class) train / inference 共通の model construction。
load_policy_value_checkpoint(path, torch, ...) checkpoint から model と metadata を復元する。

Usage

from pca.models.policy_value_unified import create_policy_value_model

model = create_policy_value_model(model_config, model_class="unified")

Notes

  • checkpoint の model_classmodel_config を優先して復元する。
  • v13 unified は policy/value に加えて aux prize heads と integrated belief heads を持てる。