Commit Graph

51 Commits

Author SHA1 Message Date
7183847ee5
feat(llm-worker): HTTP transient エラーへのリトライを追加
`transport.rs` の HTTP 送信〜ステータスチェック区間に指数バックオフ
+ フルジッターのリトライループを追加する。SSE 読み出し開始後 (
`bytes_stream()` 以降) のエラーは従来どおりそのまま流す。

- `is_retryable(&ClientError)`: 408/425/429/500/502/503/504/529 と
  reqwest の connect/timeout のみ true
- `RetryPolicy` (default: base 500ms / cap 10s / max_attempts 4 /
  total_timeout 30s)
- `Retry-After` ヘッダ (秒数) があればバックオフを上書き
- リトライ発火ごとに warn! でステータス・attempt・wait を出す

ref: tickets/llm-worker-transient-retry.md
2026-05-04 12:45:33 +09:00
ac1a672973
feat: システムメッセージをTUIで表示させる 2026-05-04 12:04:09 +09:00
e8045776f2
feat: notify-history-persist実装 2026-05-03 19:27:22 +09:00
b9635c5002
feat: session-metrics実装 2026-05-03 15:10:43 +09:00
6ebd10a006
update: codexのキャッシュ利用が出来てなかった問題 2026-05-02 03:23:44 +09:00
31d9b9b2b7
fix(llm-worker): openai_responsesのroleの最新の投影を反映 2026-05-01 23:55:26 +09:00
776a6a29bd
chore: 依存パッケージの集約 2026-05-01 23:35:46 +09:00
c331936455
ファイル参照を与えた際に自動的に読ませる実装 2026-04-30 21:58:10 +09:00
d2ee84775b
cargo fmt 2026-04-29 23:20:25 +09:00
cb1d3e72e4
templatureがcodexエンドポイントで使えない件の修正 2026-04-29 23:20:16 +09:00
af57d5b566 max_tokensのスキーマ不整合に関する修正 2026-04-28 17:58:24 +09:00
b192a3ce4e TUIにThinkingを表示する実装 2026-04-28 16:10:48 +09:00
e72aac8cf2 セッション関連の責務の分離 2026-04-28 15:43:34 +09:00
7d0b639fa4 cargo fmt 2026-04-27 22:51:07 +09:00
f8948be43d model-reasoning-control実装 2026-04-27 22:25:27 +09:00
b8d5398520 TUIに向けたprotocolの詳細調整 2026-04-21 20:50:59 +09:00
822f8d9ec2 モデル性能のハードコードを消し飛し、Codexのフォーマットの修正 2026-04-21 18:35:56 +09:00
177ff80615 codexのOAuthを使う実装 2026-04-20 23:13:52 +09:00
97326eef04 openai-responses対応 2026-04-20 02:59:16 +09:00
bf072cc4f0 llm-model-config完了 2026-04-20 00:57:27 +09:00
b1e4572823 llm-model-configの実装 2026-04-19 23:32:14 +09:00
fc634bcd87 Anthropicのキャッシュポイントを打つ実装 2026-04-19 11:57:55 +09:00
a88febc15e 引数なしでToolCallすると構造エラーになる問題の修正 2026-04-19 08:39:16 +09:00
62c5cb87dd warn/errorのTUIへの通知ルート 2026-04-15 12:58:31 +09:00
3a02358668 tool出力制限の修正 2026-04-15 04:23:07 +09:00
fade875c6f tool出力の制限 2026-04-15 04:08:56 +09:00
34ac754644 システムプロンプトの実装 2026-04-15 02:44:42 +09:00
f8eabd3ac8 prune-savings-estimation完了 2026-04-14 03:42:04 +09:00
9eef8117c8 cargo fmt 2026-04-14 03:13:36 +09:00
ff88fbc7e4 pruneのトークン計算置き換え・Podに接続 2026-04-14 02:35:35 +09:00
0a1d01d9b5 pruneで用いるトークン計算の改善 2026-04-14 00:15:09 +09:00
13d83e0fd3 token-counter実装 2026-04-13 20:21:26 +09:00
d5e2c3819d usage永続化のdoc修正 2026-04-13 07:13:49 +09:00
101679dbb8 usageデータの永続化実装 2026-04-13 07:09:05 +09:00
029bb1fba7 Compactの実装 2026-04-13 02:08:25 +09:00
48e62f65df compactの実装 2026-04-12 07:09:48 +09:00
be1119d859 Pruneの実装 2026-04-12 06:02:46 +09:00
0c9551eef0 Tool Outputの仕様簡素化 2026-04-12 05:19:00 +09:00
444c90d7e4 コンテキスト圧縮の設計更新 2026-04-12 04:47:42 +09:00
26f9294f42 ツールの動的削除の実装 2026-04-11 20:01:55 +09:00
982e0d2dbb Workerのリファクタリング 2026-04-11 19:47:34 +09:00
e1cf8fad0f Workerの自動キャッシュロック 2026-04-11 18:47:33 +09:00
748e858ec5 HookのPod側への移動・Interceptorの実装 2026-04-11 17:19:20 +09:00
88aa2cf953 llm-workerのAPI改善 2026-04-11 14:11:40 +09:00
5af96aa191 Max Turnの実装 2026-04-11 03:16:36 +09:00
ee307e2926 Add README to all crates 2026-04-11 03:07:56 +09:00
ac5d352f31 Tool Resultのファイル分離・事後参照可能にする実装 2026-04-06 04:28:40 +09:00
00e3ae1932 persistence 2026-04-05 05:14:20 +09:00
ed1db41319 refactor llm_client 2026-04-05 01:02:31 +09:00
865c89e553 migrate docs 2026-04-04 04:27:46 +09:00