テスト妥当性レビュー: workflow

判定: 概ね良い

確認範囲

Crate: crates/workflow
確認した責務:
- Workflow フロントマターの分割と schema defaults
- 人間編集向け Workflow linter
- builtin resources と .yoi/workflow からの Workflow discovery/loading
- SKILL.md parsing と Skill-to-Workflow projection
- Workflow registry の collision/shadowing behavior
- Workflow directory write-deny scope helper
主に読んだファイル:
- crates/workflow/README.md
- crates/workflow/Cargo.toml
- crates/workflow/src/{lib.rs,schema.rs,linter.rs,workflow.rs,skill.rs,scope.rs,error.rs}
- 狭い integration 参照: Workflow invocation resolution 周辺の crates/pod/src/workflow/mod.rs tests

現在のテストがよくカバーしていること

この crate には、純粋な parsing/loading 責務に対する堅実な unit-test set がある: cargo test -p workflow は 34 unit tests を実行し、すべて成功している。
Workflow loading は妥当にカバーされている:
- valid workspace Workflow loading と default flags
- model_invokation / user_invocable behavior
- workspace Workflow が slug で builtin Workflow を override すること
- 少なくとも 1 つの builtin Workflow の builtin provenance
- invalid filename が hard error になること
- required description の欠落が hard error になること
- legacy .yoi/memory/workflow が無視されること
- resident description cap enforcement
Registry/Skill collision behavior がカバーされている:
- collision がない場合の insertion
- workspace Workflow が Skill を shadow すること
- first-fed Skill が later-fed Skill に勝つこと
- human-readable shadow message の smoke check
SKILL.md parsing は主要な invariants をよくカバーしている:
- minimal valid skill
- directory/name mismatch
- invalid slug names
- empty description
- description が cap ちょうど、および cap 超過の場合
- missing frontmatter
- allowed-tools を含む optional spec fields が受け入れられること
- scan behavior: missing root、deterministic ordering、broken sibling を skip しつつ good sibling を保持すること
- Skill-to-Workflow defaults
Linter tests は現在の重要な linter checks をカバーしている:
- required Knowledge が存在する valid file
- missing required Knowledge
- resident description cap
- Workflow body size limit
テストは temporary directories を使い、private implementation details よりも observable API behavior を主に assert しており、この crate には適切である。

ギャップ / 疑問のあるテスト

Builtin Workflow coverage はやや弱い。missing_directory_loads_builtin_registry は unrelated slug が存在しないことだけを確認しており、builtin_workflow_records_have_visible_provenance は multi-agent-workflow だけを確認している。別のテストがたまたま触れない限り、1 つの builtin slug が削除または misconfigure される regression を見逃す可能性がある。
Loader と linter の invariants がテスト上で完全には揃っていない。linter は WORKFLOW_BODY_LIMIT を enforce するが、load_workflows は現在 enforce していない。body size が runtime/load invariant の意図なら loader test がない。意図的に lint-only なら、その境界を明示したままにすべきである。
requires validation は linter と後段の pod invocation resolution でのみテストされており、load_workflows ではテストされていない。これは意図的かもしれないが、crate tests だけでは責務分担が明確ではない。
linter の Knowledge existence check は filename-stem ベースである。テストは malformed Knowledge files、invalid Knowledge filenames、または「一致する .md file が存在する」と「valid Knowledge record が存在する」の違いをカバーしていない。意図する invariant が「valid Knowledge record」なら、現在のテストは許容しすぎている。
複数の hard-error paths が十分にテストされていない:
- Workflow files の malformed YAML frontmatter
- Workflow files の missing frontmatter
- SKILL.md の missing name / missing description
- .yoi/workflow 配下の non-.md files と subdirectories
- Workflow description cap と body cap の exact boundary
skill::tests::invalid_slug_name_is_error は必要以上に緩い: fixture は uppercase の directory/name が一致しているため、期待される error は InvalidName であるべき。NameDirMismatch も許容すると、validation ordering や fixture の regression を隠してしまう。
skill::tests::extra_frontmatter_fields_are_kept は名前がやや不自然である: parsed SkillRecord はそれらの optional fields を保持しない。このテストが実際に assert しているのは「optional/spec-compatible fields are accepted and ignored」であり、それ自体は妥当だが、より直接的に表現すべきである。
crate-level tests は、「workspace Workflows を load し、configured directories から Skills を load し、registry に merge し、shadowed Skills を report する」という full pipeline を exercise していない。隣接する一部 behavior は pod でカバーされているが、workflow crate 自体では pieces を独立にテストしているだけである。

追加するとよいもの

builtin assertions を強化する:
- 期待されるすべての builtin slugs が存在することを assert する
- それらの source, path, model_invokation, user_invocable, および選択した requires values を assert する
- builtin resource changes が明確に fail するよう、小さな contract test として維持する
Workflow loader の negative/edge tests を追加する:
- missing frontmatter
- malformed YAML
- model_invokation: true のとき description cap ちょうどが accepted になること
- non-.md files が ignored されること
- subdirectories が ignored されること
- workspace Workflow が requires values を preserve すること
- body limit が lint-only なのか load-time でもあるのかをテストで明確にする
linter edge tests を追加する:
- body が WORKFLOW_BODY_LIMIT ちょうどなら accepted
- resident description が cap ちょうどなら accepted
- 複数の requires がすべての missing references を report すること
- invalid requires slug が malformed frontmatter または slug parse error になること
- valid Knowledge parsing が意図されている場合、malformed Knowledge record behavior
Skill tests を引き締める:
- matching invalid directory/name に対して invalid slug test が SkillParseError::InvalidName を assert するようにする
- missing name と missing description を追加する
- optional-field test を、それらの fields が accepted/ignored されることを表す名前または内容にする
parsed Skills からの registry assembly に対する crate-level integration-style unit test を 1 つ追加する:
- builtin/workspace registry を load する
- 2 つの Skill directories を parse する
- priority order で merge する
- accepted Skill、shadowed Skill、および結果の user-invocable/resident entries を assert する

実行したコマンド

cargo test -p workflow
- 結果: passed
- 34 unit tests passed, 0 failed; doc-tests: 0 tests
cargo test -p workflow -- --list
- 結果: passed
- 34 unit tests, 0 benchmarks を確認; doc-tests: 0 tests
git status --short
- Read-only check; この review の変更外に既存の modified paths があることを示した:
  - .yoi/tickets/00001KTVPS6K3/item.md
  - .yoi/tickets/00001KTVPS6K3/thread.md
  - crates/tui/src/multi_pod.rs

8.0 KiB Raw Permalink Blame History

テスト妥当性レビュー: workflow

確認範囲

現在のテストがよくカバーしていること

ギャップ / 疑問のあるテスト

追加するとよいもの

実行したコマンド

8.0 KiB

Raw Permalink Blame History