コンテキスト圧縮: Prune + Compact

背景

長時間実行エージェントにとって、コンテキストウィンドウの管理はコア要件。現状の Worker は history をそのまま保持し、オーバーフロー時の対策がない。

OpenCode は2段階のアプローチを採る:

Insomnia では Hook ベースで同等の機能を実現できる。

PreLlmRequest 相当のポイントで、古いツール出力を除去する。

history 内のツール出力を走査:
  - 直近 N ターン以内 → 保護
  - それ以前 → 出力を "[pruned — stored as blob {id}]" に置換

トークン数が閾値を超えた場合、Controller が要約を挿入する。

1. OnTurnEnd でトークン使用量をチェック
2. 閾値超過 → Controller が要約生成を実行
3. history を [system_prompt, compaction_summary, 直近の会話] に圧縮
4. resume で作業を継続

要約フォーマット（OpenCode の構造化要約を参考）:

## Goal
（元のユーザー指示）

## Accomplished
（完了した作業の箇条書き）

## Key Discoveries
（判明した事実・制約）

## Current State
（ファイル変更・残タスク）

~~remove-hook-module.md~~ — 完了。PreLlmRequest は Pod 層の hook::Hook<PreLlmRequest> として利用可能