6.5 KiB
6.5 KiB
メモリ機構: Phase 2 consolidation + 整理
背景
docs/plan/memory.md §自動化メカニズム / §整理(GC 相当)の扱い の実装。staging の活動ログ + 既存 memory/* + Knowledge 化候補レポート + 整理材料を入力に、consolidation Worker が 統合 phase(活動ログを memory/knowledge へ落とす) と 整理 phase(既存 record の drop / merge / split / trim / rewrite) を 1 セッション内で順に実行する。Phase 1 を終えた pod が spawn し、並走防止は staging 配下の進行状況ファイルで担保する。
整理 phase は Phase 2 とは別 trigger を持たない。同じ Worker 同じツール surface で済むため、別 Agent / 別 spawn 経路は設けない。
Knowledge 新規作成は「候補レポート掲載の source から派生する場合」に限る。使用頻度メトリクス(候補レポートと保護閾値の集計元)が未完のうちは、レポートと整理材料は空入力として動作し、統合 phase は decisions / requests / summary / 既存 Knowledge update のみ、整理 phase は Linter Warn と replaced chain と sources 累積を見るに留まる(保護閾値による drop 抑制は metrics 完成後に有効化)。
要件
Trigger
- staging の累積ファイル数 or bytes 閾値(設定で tune)
- compact 同期発火は持たない(raw 保全は Phase 1 が compact 前に走ることで担保される)
実行主体と入力
- Phase 1 を終えた pod が consolidation Worker を spawn
- 起動時スナップショットで consumed ID list を確定
- 入力:
- consumed ID 分の staging エントリ(活動ログ +
source) - 既存
memory/*(summary / decisions / requests)全文 - Knowledge 化候補レポート(メトリクスチケットの成果物。未完のうちは空)
- 整理材料(使用頻度メトリクス、Linter Warn、
replacedchain、sources 過多情報。メトリクス未完のうちは Linter Warn /replaced/ sources のみ) - 既存
knowledge/*は prompt に埋めず、Knowledge 検索ツール経由で agent が引く
- consumed ID 分の staging エントリ(活動ログ +
渡すツール
- 汎用 CRUD(file read / write / edit)
- memory 検索ツール
- Knowledge 検索ツール
- post-write Linter Hook(違反時 turn 戻し、N 回失敗 abort)
常駐注入の無効化
- consolidation Worker の Pod 起動直後に
Pod::set_resident_knowledge_injection(false)を呼ぶ model_invokation: ONの Knowledge description を system prompt に載せず、Knowledge 検索ツール経由で agent に引かせる方針(本セクション「入力」と整合)- 仕組み自体は
tickets/memory-resident-injection.mdで導入済み。lever は用意されているが Phase 2 spawn 経路がまだないので、本チケットの実装範囲で必ず呼ぶこと
処理内容
統合 phase
- 新規 decisions / requests を 1 件 1 ファイルで追加、
sourcesは staging のsourceをコピー(LLM 推論ではない) - 活動ログから派生する Knowledge を新規作成 or 既存 patch。新規作成は候補レポート掲載の source 由来に限る
- summary を必要に応じて rewrite(1-5k tokens 目安)
- Decision の置き換えは
status: replaced+replaced_by: <slug>、直接削除しない - 書き込み先:
memory/*,knowledge/*。memory/workflow/は Linter で弾かれる
整理 phase(統合 phase 完了後、余力で実行)
- 既存 record 群を
outdated | superseded | unused | noisyの評価カテゴリで分類 - 操作粒度はファイル単位(drop / merge / split)とファイル内部分(節・箇条削除、
sources古いエントリ trim) - 保護閾値: 明示 invoke
frequency >= 1.0 invokes/Mtokenの record は drop / 大幅圧縮の対象外(初期値 1.0、workspace 設定でカスタマイズ可、metrics 未完のうちは閾値判定スキップで保守的に振る舞う) - 単一 record が複数カテゴリに該当してもよい
- 直接削除してよいが、誤判定しやすいものは merge / trim を優先(prompt 側で誘導)
- Linter Warn で検出した類似 slug 乱立 / sources 過多 /
replaced滞留はここで収斂
並走防止
- staging 配下に 1 ファイル(Pod 識別子 + consumed ID list)
- 存在し、示された Pod が動作している間、そのプロセスが排他占有
- 実行中に Phase 1 が追加した staging は触らず、次回 Phase 2(Coalesce)に委ねる
- 完了時は consumed ID list の staging のみ cleanup、追加分は残す
- Phase 2 完了時に staging 新着があれば次を発火(Coalesce)
- 占有の実現方法(pid 存在確認 / flock / 他)は実装判断
モデル
- 設定 key
memory.consolidation_model(reasoning 系)
prompt
docs/plan/memory-prompts.md§共通原則 / §Phase 2: 統合 + 整理 prompt / §Phase 2: Knowledge 書き込み prompt に従う
範囲外
- 使用頻度メトリクスと Knowledge 化候補レポート / 保護閾値の集計(別チケット。未完の間は空入力で動作)
- Workflow 関連の offer(別チケット、Notification 経路が先)
- 意味破壊検出の監査 LLM 層(将来検討)
完了条件
- Phase 1 が staging に残した活動ログを統合 phase が
memory/*/knowledge/*に統合する - 統合 phase 完了後、整理 phase が同じ agent セッション内で続けて走り、既存 record を整理する
- Linter 違反時は turn が戻り、sub-Worker が自己修正する
- 並走防止ファイルが想定通り機能し、複数 Phase 2 の重複起動が防げる
- Coalesce で実行中追加分が次回に引き継がれる
- 空レポートでも新規 Knowledge を作らずに動く(統合は decisions / requests / summary / 既存 Knowledge update のみ)
- 整理 phase は git diff で drop / merge / split / trim / rewrite の理由(評価カテゴリ)が読める形で記録される
- 置き換えは
status: replaced+replaced_byで残り、直接削除と区別可能
参照
docs/plan/memory.md§自動化メカニズム / §整理(GC 相当)の扱い / §Compact との関係docs/plan/memory-prompts.md§Phase 2 関連tickets/memory-file-format.md(Linter)tickets/memory-search-tools.md(検索ツール)tickets/memory-phase1-extract.md(staging 生産)tickets/memory-usage-metrics.md(候補レポート / 保護閾値の供給)