llm-engine 要件

前提

a. userメッセージを追加しなくてもagentの途中ママ投げれば、AIはそれを自身の生成途中と認識して普通に継続する b. KVキャッシュは速度・効率の面で有利で、コンテキストの事後改変はキャッシュヒット率を大幅に下げる c. ツール・フックの基本的なスキーマ自動化を提供する

メッセージの送信と生成のResume、一時停止/再開。

実装: engine.rs — resume(), get_pending_tool_calls(), EngineResult::Paused

キャッシュを破壊しうる操作を明示的にブロックせずとも、いつの間にかキャッシュ破壊してた状態にはしたくない。

実装: state.rs (sealed trait), engine.rs (state-specific impl blocks)

実装: llm-engine-macros/, tool.rs, tool_server.rs, hook.rs

フックはLLMクライアント層ではなく、Engine（オーケストレーション）層に配置する。

実装: engine.rs (hook integration), hook.rs (trait definitions)