From 311d74c25d5c620e622df22405842208f8a042eb Mon Sep 17 00:00:00 2001 From: Hare Date: Thu, 28 May 2026 07:45:49 +0900 Subject: [PATCH] sanitize: neutralize provider notes and remove claude knowledge --- .insomnia/knowledge/claude-code.md | 20 ------------------- docs/plan/llm_providers.md | 10 +++++----- docs/ref/llm-provider-landscape.md | 20 +++++++++---------- .../openai_responses_max_output_tokens.md | 6 +++--- 4 files changed, 18 insertions(+), 38 deletions(-) delete mode 100644 .insomnia/knowledge/claude-code.md diff --git a/.insomnia/knowledge/claude-code.md b/.insomnia/knowledge/claude-code.md deleted file mode 100644 index 51c60fd5..00000000 --- a/.insomnia/knowledge/claude-code.md +++ /dev/null @@ -1,20 +0,0 @@ ---- - created_at: 2026-05-11T22:10:00Z - updated_at: 2026-05-11T22:10:00Z - kind: policy - description: Claude Codeを用いてレビューやinsomniaだけではできないタスクを行う - model_invokation: false - user_invocable: true - last_sources: [] ---- - -Bashツールを用いて`claude`を呼び出す。 - -`claude -p ""`で非対話モードでのClaude Codeの利用が出来る。 - -また、`claude -p "" --continue`を用いることで、直前のセッションを再開する形で実行できる。 - - -insomniaではまだできないのでclaudeにやらせたいタスク -- WebSearch / WebFetch -- diff --git a/docs/plan/llm_providers.md b/docs/plan/llm_providers.md index 91ea96d1..bb056ec3 100644 --- a/docs/plan/llm_providers.md +++ b/docs/plan/llm_providers.md @@ -13,7 +13,7 @@ INSOMNIA が利用する LLM プロバイダとその認証方式を決める。 | プロバイダ | scheme | 認証 | 用途 | |---|---|---|---| | **Ollama** | scheme/anthropic 流用(v0.14+ `/v1/messages`) | なし(ダミー) | ローカル + `:cloud` サフィックスでクラウド中継。`localhost:11434` で統一 | -| **Codex OAuth 経路** | scheme/openai_responses | `~/.codex/auth.json` | ChatGPT の定額枠を利用 | +| **Codex OAuth** | scheme/openai_responses | `~/.codex/auth.json` | Codex CLI と同じ認証ストアを使う Responses 経路 | | **Anthropic API** | scheme/anthropic | API key | 従量課金経路のみ | Ollama は独自 scheme を作らず `scheme/anthropic` を base_url 差し替えで流用。`/v1/chat/completions` は stream+tools バグ (#9092) のため使わない。`cache_control` / `tool_choice` / `metadata` / `count_tokens` は Ollama 非対応のため送らない。 @@ -31,13 +31,13 @@ Ollama は独自 scheme を作らず `scheme/anthropic` を base_url 差し替 ### 非サポート -- **Claude Pro/Max OAuth 経路** — Anthropic が 2026-01-09 にサーバ側でブロック、2026-02-19 に ToS で第三者ツール経由を明文禁止。リスクが第一級機能に見合わない -- **`claude -p` CLI fork** — 同様に採用しない。実装しない +- **Claude Pro/Max OAuth 経路** — Anthropic が 2026-01-09 にサーバ側でブロック、2026-02-19 に第三者ツール経由の利用制限を明文化。第一級機能としては採用しない +- **`claude -p` CLI fork** — 専用 API integration ではないため実装しない ## 根拠 -- **Codex OAuth は Codex CLI 互換**: Codex CLI は Apache-2.0、openai/codex #8338 で OpenAI 社員が fork 自由と明言、service terms に名指し禁止なし -- **Anthropic API は従量だが代替なし**: Pro/Max OAuth 封鎖後、Claude 系を使うには API key 経路のみ +- **Codex OAuth は Codex CLI 互換の認証経路として扱う**: Codex CLI は Apache-2.0 で公開されており、同じ Responses 系 wire behavior に寄せる +- **Anthropic API は従量だが代替なし**: Pro/Max OAuth 経路の制限後、Claude 系を使うには API key 経路のみ - **Ollama は `:cloud` で透過**: `ollama signin` で Ed25519 鍵登録後、`localhost:11434` 経由でクラウドモデルが使える。ローカルデーモンが署名付き中継 - **OpenAI 互換は汎用アダプタ 1 本**: ルーター系は後追いで数を増やしやすい宣言型設計、実装コスト最小 diff --git a/docs/ref/llm-provider-landscape.md b/docs/ref/llm-provider-landscape.md index 2dcb13ed..33fe8fb3 100644 --- a/docs/ref/llm-provider-landscape.md +++ b/docs/ref/llm-provider-landscape.md @@ -1,6 +1,6 @@ # LLM プロバイダ統合の外部事例 -調査日: 2026-04-19。認証経路・`ollama launch` 等の時事的項目は陳腐化が早い。数値・URLは一次ソースで再確認すること。 +調査日: 2026-04-19。プロバイダ認証経路・`ollama launch` 等の時事的項目は陳腐化が早い。数値・URLは一次ソースで再確認すること。 ## 各ハーネスのプロバイダ対応方式 @@ -15,7 +15,7 @@ - Vercel AI SDK + Models.dev で 75+ プロバイダ - 認証は `~/.local/share/opencode/auth.json` に統一保存(OAuth / APIキー / その他の3種別) - **2026-03-19 に Anthropic OAuth 対応を削除**(PR #18186)。詳細は後述 -- ChatGPT のブラウザ OAuth (`/connect`) は存続 +- ChatGPT ブラウザ認証 (`/connect`) は存続 - https://opencode.ai/docs/providers/ ### OpenClaw @@ -38,13 +38,13 @@ - `packages/opencode/src/session/prompt/anthropic-20250930.txt`(Claude Code 風システムプロンプト) - `opencode-anthropic-auth@0.0.13` ビルトインプラグイン - `claude-code-20250219` beta ヘッダ -- 代替検討: `claude -p` (Claude Code の headless mode) を subprocess で呼ぶ方式。ACP ではなく素朴な CLI fork。Anthropic ToS 的には採用しない(明確な裁定なし) +- 代替検討: `claude -p` (Claude Code の headless mode) を subprocess で呼ぶ方式。ACP ではなく素朴な CLI fork であり、insomnia では採用しない - https://code.claude.com/docs/en/legal-and-compliance - https://github.com/sst/opencode/pull/18186 -### OpenAI (ChatGPT Plus / Pro via Codex CLI) ── 互換経路 -- Codex CLI は Apache-2.0。openai/codex Discussion #8338 で OpenAI 社員が fork・改変自由と明言 -- ChatGPT OAuth を他ツールから使う行為を service terms で名指し禁止する条項は未確認 +### OpenAI (Codex CLI / Responses) +- Codex CLI は Apache-2.0 で公開されている。insomnia の Codex OAuth 経路は、Codex CLI と同じ Responses 系 wire behavior に寄せる +- Codex CLI の認証ストアと conversation header / request compression / SSE behavior を参考にする - OpenCode の `/connect` で ChatGPT ブラウザ認証が通る - コミュニティ評価: 「Anthropic は walled garden、OpenAI はむしろ取り込みに来た」 - https://github.com/openai/codex/discussions/8338 @@ -54,7 +54,7 @@ - `claude --print` / `claude -p` は Claude Code の非対話(headless)モード。プロンプトを stdin/引数で受け stdout に返す - **ACP ではなく素朴な subprocess 呼び出し** - OpenClaw と OpenCode コミュニティフォーク (`griffinmartin/opencode-claude-auth`) が採用 -- OAuth 経路ではないため 2026-01-09 のブロックは回避できるが、Anthropic ToS の「第三者ツールでの資格情報経由」禁止条項に抵触する可能性(明確な裁定なし) +- insomnia では専用 API integration ではないため採用しない ## Ollama の統合機構 @@ -225,7 +225,7 @@ parallel tool calls 可否、tool_choice 対応度。DeepSeek reasoner のよう ### 第一級サポート(専用アダプタ) - **Ollama API** — ローカル + `:cloud` サフィックスで透過的にクラウド中継。エンドポイントは `localhost:11434` で統一 -- **Codex OAuth 経路** — `~/.codex/auth.json` を読み ChatGPT 枠を利用。Codex CLI 互換(Apache-2.0、社員が fork 自由と明言、ToS に名指し禁止なし) +- **Codex OAuth** — `~/.codex/auth.json` を読み、Codex CLI 互換の Responses 経路として扱う。conversation header / compression / SSE behavior は公開実装に合わせる - **Anthropic API** — 従量 API key 経路のみ ### 二次サポート(共通 OpenAI 互換枠) @@ -233,8 +233,8 @@ parallel tool calls 可否、tool_choice 対応度。DeepSeek reasoner のよう - ルーター系は後追いで追加しやすい宣言型設計 ### 非サポート -- **Claude Pro/Max OAuth 経路** — 2026-01-09 サーバ側ブロック、2026-02-19 ToS で明文禁止。リスクが第一級機能に見合わない -- `claude -p` CLI fork も同様に採用しないなので実装しない +- **Claude Pro/Max OAuth 経路** — 2026-01-09 サーバ側ブロック、2026-02-19 に第三者ツール経由の利用制限を明文化。第一級機能としては採用しない +- `claude -p` CLI fork も専用 API integration ではないため実装しない ### 実装原則 - 認証アダプタ(外部 CLI の認証ストアを読む類)は llm-worker 直下ではなく上位アダプタ層に配置。llm-worker は低レベル基盤に留める原則(project memory)と整合 diff --git a/docs/research/openai_responses_max_output_tokens.md b/docs/research/openai_responses_max_output_tokens.md index 135c2860..32feee9a 100644 --- a/docs/research/openai_responses_max_output_tokens.md +++ b/docs/research/openai_responses_max_output_tokens.md @@ -36,11 +36,11 @@ - コスト制御目的には `reasoning.effort` (`"low"` など) の使用が推奨される。`max_output_tokens` はあくまで暴走抑止のガードとして位置づける。 - o シリーズなど reasoning モデルでは `reasoning.max_tokens` (別パラメータ) で reasoning 専用の上限を設定できる場合もある。 -## 5. ChatGPT backend (`https://chatgpt.com/backend-api/codex/responses`) における取り扱い +## 5. Codex CLI 互換 Responses 経路における取り扱い -このエンドポイントは公式 Responses API のサブセットのみをサポートするCodex CLI 互換 backend であり、`max_output_tokens` を **サポートしないパラメータとして 400 エラーで拒否する**。 +この経路は公式 Responses API のパラメータをすべて受け付けるわけではなく、`max_output_tokens` を **サポートしないパラメータとして 400 エラーで拒否する**。 -LiteLLM の調査 (https://github.com/BerriAI/litellm/issues/21193) によれば、ChatGPT Codex backend が受け付けるパラメータは以下に限られる: +LiteLLM の調査 (https://github.com/BerriAI/litellm/issues/21193) によれば、この経路が受け付けるパラメータは以下に限られる: ``` model, input, instructions, stream, store, include,