From d9ca5e8c4138aa40d2948f14a6755ac587b961a0 Mon Sep 17 00:00:00 2001 From: Hare Date: Sat, 23 May 2026 00:09:34 +0900 Subject: [PATCH] docs: add pod discovery restore tools ticket --- TODO.md | 1 + tickets/pod-discovery-restore-tools.md | 69 ++++++++++++++++++++++++++ 2 files changed, 70 insertions(+) create mode 100644 tickets/pod-discovery-restore-tools.md diff --git a/TODO.md b/TODO.md index 53cdd640..eb95e789 100644 --- a/TODO.md +++ b/TODO.md @@ -7,6 +7,7 @@ - Pod: 空応答ターン (Submit 後 AI 応答ゼロで Pause/Cancel) を自動巻き戻し → [tickets/pod-empty-turn-rollback.md](tickets/pod-empty-turn-rollback.md) - Pod: 任意ターンからの Fork(複数ターン巻き戻しを汎用化) → [tickets/pod-session-fork.md](tickets/pod-session-fork.md) - Pod: Inbound PodEvent ハンドリングの重複を統合 → [tickets/pod-inbound-pod-event-dedup.md](tickets/pod-inbound-pod-event-dedup.md) +- Pod: 過去 Pod の探索と restore ツール → [tickets/pod-discovery-restore-tools.md](tickets/pod-discovery-restore-tools.md) - llm-worker のエラー耐性 - ストリーム途中失敗時の継続 → [tickets/llm-worker-stream-continuation.md](tickets/llm-worker-stream-continuation.md) - llm-worker: history append を callback 経由の単一経路に閉じる → [tickets/worker-history-append-contract.md](tickets/worker-history-append-contract.md) diff --git a/tickets/pod-discovery-restore-tools.md b/tickets/pod-discovery-restore-tools.md new file mode 100644 index 00000000..92c5d077 --- /dev/null +++ b/tickets/pod-discovery-restore-tools.md @@ -0,0 +1,69 @@ +# Pod: 過去 Pod の探索と restore ツール + +## 背景 + +Pod state の永続化と `--pod ` resume が入ったことで、名前が分かっている Pod は復元できるようになった。一方で、AI / operator が「過去にどんな Pod があったか」「この名前の Pod は復元できるか」「live attach できるのか、restore が必要なのか」を機械的に調べる導線はまだない。 + +現在の `ListPods` は主に spawner が知っている spawned child の live/runtime registry を見るためのツールであり、永続化された全 Pod の探索や、過去 Pod の restore 導線としては不十分。今後 Pod 単位で作業を再開する運用を成立させるには、Pod state を正本として過去 Pod を列挙・確認・復元できる tool surface が必要。 + +## 要件 + +- 永続化された Pod state から、既知の Pod 一覧を取得する tool / protocol API を追加する。 + - 実際の Method / tool 名は実装時に確定する。 + - `session-store` の Pod state backend/FsStore を正本にし、runtime dir の `spawned_pods.json` を正本にしない。 + - state が壊れている Pod や active segment 未確定の Pod は、全体失敗ではなく item 単位の状態として返せるようにする。 +- 一覧 item には最低限以下を含める。 + - `pod_name` + - active `SessionId` / `SegmentId`(未確定ならその状態) + - live socket / runtime が到達可能かどうか + - restore 可能かどうかと、restore に必要な名前 + - spawned children が永続化されている場合は、その概要(件数や reachable 状態。詳細展開は別 API でもよい) +- Pod 名指定で詳細を取得できる API を用意する。 + - active pointer + - restoreability + - live attach 可能性 + - spawned child registry の概要 + - 読めない state / 消えた socket / lock 衝突を区別したエラー +- Pod 名指定で restore / attach を開始できる tool 導線を用意する。 + - live socket が到達可能なら attach 相当の扱いにする。 + - 到達不能だが Pod state があるなら既存の `--pod ` / `Pod::restore_from_pod_metadata(...)` 経路で restore する。 + - Pod state が存在しない名前を指定した場合に新規 Pod を作るか、明示エラーにするかは API ごとに曖昧にせず決める。探索・復元ツールとしては、意図しない新規作成を避けるため default はエラー寄りが望ましい。 +- 既存の `--pod ` / `--session ` / spawned child 向け `ListPods` / `SendToPod` / `StopPod` と責務を混ぜない。 + - `ListPods` は現在接続中の spawned child registry を見る用途として維持してよい。 + - 過去 Pod の探索 API は Pod state を正本にする。 +- live writer 二重起動防止、scope delegation、session lock の責務は既存 registry / lock に任せ、Pod state に lock 責務を追加しない。 +- tool result として LLM に返す情報は通常の tool call 履歴に残る形にし、history に残らない context 差し込みで実現しない。 + +## 完了条件 + +- 永続化済み Pod を Pod state から列挙できる。 +- runtime dir の `spawned_pods.json` が存在しない状態でも、Pod state から過去 Pod を探索できる。 +- Pod 名指定で詳細を取得し、live attach 可能 / restore 可能 / state 不在 / state 破損 / lock 衝突を区別できる。 +- Pod 名指定の restore / attach tool が、到達可能 live Pod には attach し、到達不能だが state がある Pod には既存 restore 経路で復元できる。 +- 既存の `ListPods` / `SendToPod` / `StopPod` / `--pod` / `--session` の挙動を壊さない。 +- unit / integration test で以下を確認する。 + - 複数 Pod metadata の列挙 + - active segment 未確定 Pod の表示 + - runtime file が消えても Pod state から探索できる + - socket 到達可否の反映 + - restore / attach の分岐 + - lock 衝突時に二重 writer を起動しない +- `cargo fmt --check` +- `cargo check --workspace` +- 関連 crate の tests(少なくとも `cargo test -p pod`。tool surface を置く crate に応じて追加) + +## 範囲外 + +- 過去 Pod 一覧の本格 UI / picker +- fork tree の可視化 +- transcript 全文検索 / semantic search +- Pod の自動再起動 +- 古い Pod state の GC / retention policy +- session / segment 単位の新しい resume 引数 + +## 依存 / 関連 + +- Pod state backend / FsStore 実装 +- Pod lifecycle write-through +- Pod 名単位の resume / attach 導線 +- SpawnedPodRegistry の永続化と復元