Codex CLI vs Claude Code:機能・哲学・ユースケース徹底比較(2026 年 5 月版)
OpenAI Codex CLI と Anthropic Claude Code を 2026 年 5 月時点で徹底比較。アーキテクチャ・安全モデル・エージェント機能・MCP・CI/CD 連携・コスト・SWE ベンチマーク結果を多角的に整理しました。
この章の要点
Codex CLI と Claude Code は「ターミナルで動く AI コーディングエージェント」という意味では同じカテゴリですが、設計哲学とアーキテクチャが根本的に異なります。
- Codex CLI: 「自律的に動かして後でレビュー」。OS レベルのサンドボックスで安全を確保し、並列タスク・CI/CD 連携が得意。OSS(Apache 2.0)。
- Claude Code: 「逐次確認しながら一緒に作る」。コンテキスト理解の精度が高く、1M トークンの大規模コードベース処理が得意。クローズドソース。
どちらかが一方的に優れているわけではなく、タスクの性質とチームのワークスタイルで使い分けるのが現実的です。
基本情報の比較
| 項目 | Codex CLI | Claude Code |
|---|---|---|
| 開発元 | OpenAI | Anthropic |
| ライセンス | Apache 2.0(OSS) | クローズドソース |
| 実装言語 | Rust | Node.js / TypeScript |
| 主要モデル | GPT-5.5 / GPT-5.4 / GPT-5.3-Codex / GPT-5.3-Codex-Spark | Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5 |
| コンテキスト | モデル依存(GPT-5.5 / 5.4 系で長尺対応、5.3-Codex-Spark は 128k) | 最大 1M トークン(Sonnet/Opus 系) |
| インストール | npm i -g @openai/codex または brew install --cask codex | curl -fsSL claude.ai/install.sh または brew install --cask claude-code |
| 最新安定版(2026-05) | v0.129.0(2026-05-07) | Claude 4 系の継続リリース |
ベンチマーク比較
SWE-bench / Terminal-Bench(2026 年時点)
ベンチマーク条件(モデル・プロンプト・ツール構成)でスコアは大きく変わります。あくまで参考値です。
| モデル / システム | ベンチ | スコア |
|---|---|---|
| Claude Opus 4.7 | SWE-bench Verified | 87.6% |
| GPT-5.3-Codex | SWE-bench Pro(汚染耐性版・4 言語) | 56.8% |
| GPT-5.3-Codex | Terminal-Bench 2.0 | 77.3% |
注:SWE-bench Verified と SWE-bench Pro は別物です。Pro は汚染耐性のために問題セットが入れ替えられており、Verified より難易度・スコアが下がります。直接比較する際は同じベンチで揃えてください。
トークン効率
Codex CLI は Rust 実装と効率的なコンテキスト管理により、同等タスクのトークン消費が Claude Code より少ない傾向にあると複数の独立比較で報告されています。実プロジェクトでは差が縮まる場面もあるため、自プロジェクトでの実測をお勧めします。
設計哲学の違い
Codex CLI:自律実行モデル
タスク指示 → エージェントが自律的に実行 → 結果を後でレビュー
- 人の介在を最小化してスループットを最大化する設計
- OS サンドボックスが安全網になるため、承認なしで動かしやすい
- CI/CD での完全自動化を想定した設計
Claude Code:協調作業モデル
タスク指示 → Claude が確認・計画を提示 → 人が承認 → 実行
- 人と Claude が対話しながら進めることを前提とした設計
- Plan Mode で事前確認を促す
- 複雑な意思決定は人が担うフロー
安全モデルの比較
| 観点 | Codex CLI | Claude Code |
|---|---|---|
| サンドボックス | OS レベル(macOS Seatbelt / Linux bubblewrap / Windows は restricted token + ACL ベースの独自機構) | プロセス/Hook ベースのソフト制限 |
| ネットワーク制御 | OS 制限(既定無効・ドメイン allow リスト) | 既定有効、Hooks で制限可能 |
| ファイルアクセス制限 | OS パス制限で強制 | 設定とディレクトリ許可で制限 |
| 危険コマンドブロック | OS サンドボックス+execpolicy ルール | PreToolUse Hook で実装 |
| 承認モード | 4 種(on-request / never / untrusted / granular) | パーミッションモード+Hooks |
Codex CLI が有利な場面:OS レベルの強制力が必要な環境(信頼できないコードの実行、共有 CI 環境、コンプライアンス要求)
Claude Code が有利な場面:柔軟なカスタマイズが必要な環境(プロジェクト固有のブロックルール、複雑な権限管理)
エージェント機能の比較
サブエージェント
| 観点 | Codex CLI | Claude Code |
|---|---|---|
| 定義ファイル形式 | TOML | Markdown(YAML frontmatter) |
| 推論レベル設定 | model_reasoning_effort: low / medium / high | モデル選択で代替 |
| サンドボックス指定 | エージェント単位で sandbox_mode を指定 | isolation: worktree 等 |
| スレッド切り替え | /agent でセッション中に切り替え | サブエージェントは個別呼出し中心 |
マルチエージェント
| 観点 | Codex CLI | Claude Code |
|---|---|---|
| 並列実行 | [agents] の max_threads(既定 6)/ max_depth(既定 1) | サブエージェント並列+Agent Teams |
| 共有タスクリスト | あり | Agent Teams 系 |
| 安定性 | 安定版 | 機能により実験的なものを含む |
プロジェクト設定の比較
| 観点 | Codex CLI | Claude Code |
|---|---|---|
| 設定ファイル名 | AGENTS.md | CLAUDE.md |
| 設定形式 | プレーン Markdown | Markdown + frontmatter(path-scoped rules) |
| インポート | なし | @path/to/file でインポート可 |
| 上書き機能 | 同階層 AGENTS.override.md で代替 | 下位スコープが上位を上書き |
| 自動学習 | なし | Auto Memory(MEMORY.md)で自動蓄積 |
| 代替ファイル名 | project_doc_fallback_filenames で指定可 | 変更不可(CLAUDE.md 固定) |
CLAUDE.md が有利な点:@インポート による分割管理、path-scoped rules、Auto Memory による自動学習
AGENTS.md が有利な点:AGENTS.override.md による同階層差し替え、サブディレクトリ自動マージ、フォールバックファイル名指定
MCP / ツール連携の比較
| 観点 | Codex CLI | Claude Code |
|---|---|---|
| 設定ファイル | config.toml(TOML) | .mcp.json(JSON) |
| トランスポート | stdio・Streamable HTTP | stdio・HTTP・SSE |
| Tool Search(遅延ロード) | 未対応(全ツールロード) | 標準で遅延ロードに対応 |
| 公式レジストリ | 未提供(2026-05 時点) | あり(api.anthropic.com/mcp-registry/v0/servers) |
| MCP サーバとして公開 | codex mcp-server(stdio) | claude mcp serve |
| ツール絞り込み | enabled_tools / disabled_tools | 設定 UI / Hooks |
CI/CD 連携の比較
| 観点 | Codex CLI | Claude Code |
|---|---|---|
| 公式 GitHub Action | openai/codex-action@v1 | 公式アクションは未提供(SDK・自作スクリプト中心) |
| CI セットアップ難度 | Action 1 ステップで完結 | SDK スクリプトの実装が必要 |
| OS サンドボックス | あり(CI ランナー上で強制) | なし(Hooks ベース) |
| 完全自動実行 | safety-strategy: drop-sudo + sandbox: workspace-write | 自作のパーミッション設計が必要 |
Codex CLI が有利な場面:CI/CD での完全自動化、OS レベルのセキュリティが必要な環境
Claude Code が有利な場面:既存の TypeScript/Python スクリプトとの統合、細かいカスタマイズが必要な環境
コストの比較(2026 年 5 月時点)
モデル料金(1M トークンあたり、参考値)
最新値は公式 Pricing ページや Help Center のレートカードで確認できます。Codex の従量請求はトークン課金ベースに移行済みです。
| モデル | 入力(参考) | 出力(参考) |
|---|---|---|
| Claude Opus 4.7 | 概ね Sonnet の数倍 | 概ね Sonnet の数倍 |
| Claude Sonnet 4.6 | 中位 | 中位 |
| Claude Haiku 4.5 | 低価格帯 | 低価格帯 |
| GPT-5.5 | 中〜高位(フロンティア) | 中〜高位 |
| GPT-5.4 / 5.4-mini | 中位/低価格帯 | 中位/低価格帯 |
| GPT-5.3-Codex / 5.3-Codex-Spark | 用途特化(最新は公式 Pricing 参照) | 用途特化 |
価格は頻繁に変動します。実額は Anthropic / OpenAI 公式の Pricing ページで都度確認してください。
サブスクリプション
| プラン | Codex CLI | Claude Code |
|---|---|---|
| 無料 | なし(API 従量のみ) | なし |
| 標準 | ChatGPT Plus($20/月) | Claude Pro($20/月) |
| 高機能 | ChatGPT Pro / Pro 5x / 20x | Claude Max 5x / 20x |
| 企業向け | ChatGPT Enterprise | Claude Team / Enterprise |
ユースケース別推奨
Codex CLI が向いているケース
- 完全自動化パイプライン: CI/CD の承認なし実行、Issue→PR 自動生成
- 信頼できないコードの安全な実行: OS サンドボックスが必須の環境
- コスト最適化重視: GPT-5.4-mini +低推論で消費を最小化
- OpenAI エコシステム前提: Agents SDK・Realtime API を使うチーム
- GitHub Actions との統合: 公式 Action でセットアップを最短化
Claude Code が向いているケース
- 大規模コードベースの理解: 1M トークンで数万行を一括処理
- 精度重視の実装: SWE-bench Verified 上位スコアの恩恵を受けたい
- 対話型の協調作業: Plan Mode で計画を擦り合わせる進め方
- CLAUDE.md の高度な管理: path-scoped rules・
@インポート・Auto Memory - チームの知識蓄積: Auto Memory でプロジェクト知識を継続蓄積
ハイブリッド構成
実務では両者の使い分けが現実解です。
【日常的な開発作業】 Claude Code(対話型・精度重視)
【CI/CD での自動化】 Codex CLI(GitHub Action・OS サンドボックス)
【大規模コードベース調査】 Claude Code(1M コンテキスト)
【並列タスクの高速処理】 Codex CLI(max_threads・サブエージェント)
2026 年の進化トレンド
Codex CLI
- Rust 実装の高速化と Windows サンドボックスの強化(v0.129.0 で名前付きパイプ・ConPTY・PowerShell allow ルールが整理)
- GitHub Action・Agents SDK との統合継続
[mcp_servers.<name>]の OAuth 系(scopes/oauth_resource/mcp_oauth_*)の整備- Plugins の拡充
Claude Code
- サブエージェント・Agent Teams 系の継続改良
- Auto Memory・CLAUDE.md による知識蓄積の標準化
- Bedrock / Vertex AI 等への接続オプション
- IDE 拡張の機能強化
一次ソース
Codex CLI 公式:
Claude Code 公式:
比較記事(参考):