Commit Graph

47 Commits

Author SHA1 Message Date
19df6340cd feat(llm-worker): HTTP transient エラーへのリトライを追加
`transport.rs` の HTTP 送信〜ステータスチェック区間に指数バックオフ
+ フルジッターのリトライループを追加する。SSE 読み出し開始後 (
`bytes_stream()` 以降) のエラーは従来どおりそのまま流す。

- `is_retryable(&ClientError)`: 408/425/429/500/502/503/504/529 と
  reqwest の connect/timeout のみ true
- `RetryPolicy` (default: base 500ms / cap 10s / max_attempts 4 /
  total_timeout 30s)
- `Retry-After` ヘッダ (秒数) があればバックオフを上書き
- リトライ発火ごとに warn! でステータス・attempt・wait を出す

ref: tickets/llm-worker-transient-retry.md
2026-05-04 12:45:33 +09:00
a0e1583916 feat: システムメッセージをTUIで表示させる 2026-05-04 12:04:09 +09:00
9e58149dda feat: notify-history-persist実装 2026-05-03 19:27:22 +09:00
70c4f1930e feat: session-metrics実装 2026-05-03 15:10:43 +09:00
81ff4c6073 update: codexのキャッシュ利用が出来てなかった問題 2026-05-02 03:23:44 +09:00
573501e37c fix(llm-worker): openai_responsesのroleの最新の投影を反映 2026-05-01 23:55:26 +09:00
d7bc7ab3dd ファイル参照を与えた際に自動的に読ませる実装 2026-04-30 21:58:10 +09:00
f31c58dccd cargo fmt 2026-04-29 23:20:25 +09:00
3fc65e6f6b templatureがcodexエンドポイントで使えない件の修正 2026-04-29 23:20:16 +09:00
ce4c0930c3 max_tokensのスキーマ不整合に関する修正 2026-04-28 17:58:24 +09:00
cf4c454a03 TUIにThinkingを表示する実装 2026-04-28 16:10:48 +09:00
6fe19b84ce セッション関連の責務の分離 2026-04-28 15:43:34 +09:00
7a0ed7d744 cargo fmt 2026-04-27 22:51:07 +09:00
0435ec5cbd model-reasoning-control実装 2026-04-27 22:25:27 +09:00
ce59c5320e TUIに向けたprotocolの詳細調整 2026-04-21 20:50:59 +09:00
47da4a03cb モデル性能のハードコードを消し飛し、Codexのフォーマットの修正 2026-04-21 18:35:56 +09:00
6c6eb0dcb6 codexのOAuthを使う実装 2026-04-20 23:13:52 +09:00
74a45f86b9 openai-responses対応 2026-04-20 02:59:16 +09:00
5aea67ff5e llm-model-config完了 2026-04-20 00:57:27 +09:00
230936274b llm-model-configの実装 2026-04-19 23:32:14 +09:00
663ec91b45 Anthropicのキャッシュポイントを打つ実装 2026-04-19 11:57:55 +09:00
68885a03d8 引数なしでToolCallすると構造エラーになる問題の修正 2026-04-19 08:39:16 +09:00
faa8eb5793 warn/errorのTUIへの通知ルート 2026-04-15 12:58:31 +09:00
41120cf200 tool出力制限の修正 2026-04-15 04:23:07 +09:00
b6ffbe4255 tool出力の制限 2026-04-15 04:08:56 +09:00
66c6edec3e システムプロンプトの実装 2026-04-15 02:44:42 +09:00
3c58b5dde4 prune-savings-estimation完了 2026-04-14 03:42:04 +09:00
a0a9df11c0 cargo fmt 2026-04-14 03:13:36 +09:00
2e004161e4 pruneのトークン計算置き換え・Podに接続 2026-04-14 02:35:35 +09:00
5a995cf099 pruneで用いるトークン計算の改善 2026-04-14 00:15:09 +09:00
f607a52fbb token-counter実装 2026-04-13 20:21:26 +09:00
7fb2e4bc6c usage永続化のdoc修正 2026-04-13 07:13:49 +09:00
17d0430a4d usageデータの永続化実装 2026-04-13 07:09:05 +09:00
a05eec42d7 Compactの実装 2026-04-13 02:08:25 +09:00
bcc7faa0ba compactの実装 2026-04-12 07:09:48 +09:00
eb670bfba5 Pruneの実装 2026-04-12 06:02:46 +09:00
2c5a0edef3 Tool Outputの仕様簡素化 2026-04-12 05:19:00 +09:00
8e394005b2 ツールの動的削除の実装 2026-04-11 20:01:55 +09:00
02b266dce7 Workerのリファクタリング 2026-04-11 19:47:34 +09:00
9b78c51d0a Workerの自動キャッシュロック 2026-04-11 18:47:33 +09:00
fc8ff9362e HookのPod側への移動・Interceptorの実装 2026-04-11 17:19:20 +09:00
89481c2c82 llm-workerのAPI改善 2026-04-11 14:11:40 +09:00
0fe05e502e Max Turnの実装 2026-04-11 03:16:36 +09:00
ac5d352f31 Tool Resultのファイル分離・事後参照可能にする実装 2026-04-06 04:28:40 +09:00
00e3ae1932 persistence 2026-04-05 05:14:20 +09:00
ed1db41319 refactor llm_client 2026-04-05 01:02:31 +09:00
490ed0ca7c cargo init 2026-04-04 03:30:49 +09:00