AI Tools 2026年4月15日 (更新: 2026年5月8日)

Codex CLI vs Claude Code:機能・哲学・ユースケース徹底比較(2026 年 5 月版)

OpenAI Codex CLI と Anthropic Claude Code を 2026 年 5 月時点で徹底比較。アーキテクチャ・安全モデル・エージェント機能・MCP・CI/CD 連携・コスト・SWE ベンチマーク結果を多角的に整理しました。

この章の要点

Codex CLI と Claude Code は「ターミナルで動く AI コーディングエージェント」という意味では同じカテゴリですが、設計哲学とアーキテクチャが根本的に異なります

  • Codex CLI: 「自律的に動かして後でレビュー」。OS レベルのサンドボックスで安全を確保し、並列タスク・CI/CD 連携が得意。OSS(Apache 2.0)。
  • Claude Code: 「逐次確認しながら一緒に作る」。コンテキスト理解の精度が高く、1M トークンの大規模コードベース処理が得意。クローズドソース。

どちらかが一方的に優れているわけではなく、タスクの性質とチームのワークスタイルで使い分けるのが現実的です。


基本情報の比較

項目Codex CLIClaude Code
開発元OpenAIAnthropic
ライセンスApache 2.0(OSS)クローズドソース
実装言語RustNode.js / TypeScript
主要モデルGPT-5.5 / GPT-5.4 / GPT-5.3-Codex / GPT-5.3-Codex-SparkClaude Opus 4.7 / Sonnet 4.6 / Haiku 4.5
コンテキストモデル依存(GPT-5.5 / 5.4 系で長尺対応、5.3-Codex-Spark は 128k)最大 1M トークン(Sonnet/Opus 系)
インストールnpm i -g @openai/codex または brew install --cask codexcurl -fsSL claude.ai/install.sh または brew install --cask claude-code
最新安定版(2026-05)v0.129.0(2026-05-07)Claude 4 系の継続リリース

ベンチマーク比較

SWE-bench / Terminal-Bench(2026 年時点)

ベンチマーク条件(モデル・プロンプト・ツール構成)でスコアは大きく変わります。あくまで参考値です。

モデル / システムベンチスコア
Claude Opus 4.7SWE-bench Verified87.6%
GPT-5.3-CodexSWE-bench Pro(汚染耐性版・4 言語)56.8%
GPT-5.3-CodexTerminal-Bench 2.077.3%

注:SWE-bench Verified と SWE-bench Pro は別物です。Pro は汚染耐性のために問題セットが入れ替えられており、Verified より難易度・スコアが下がります。直接比較する際は同じベンチで揃えてください。

トークン効率

Codex CLI は Rust 実装と効率的なコンテキスト管理により、同等タスクのトークン消費が Claude Code より少ない傾向にあると複数の独立比較で報告されています。実プロジェクトでは差が縮まる場面もあるため、自プロジェクトでの実測をお勧めします。


設計哲学の違い

Codex CLI:自律実行モデル

タスク指示 → エージェントが自律的に実行 → 結果を後でレビュー
  • 人の介在を最小化してスループットを最大化する設計
  • OS サンドボックスが安全網になるため、承認なしで動かしやすい
  • CI/CD での完全自動化を想定した設計

Claude Code:協調作業モデル

タスク指示 → Claude が確認・計画を提示 → 人が承認 → 実行
  • 人と Claude が対話しながら進めることを前提とした設計
  • Plan Mode で事前確認を促す
  • 複雑な意思決定は人が担うフロー

安全モデルの比較

観点Codex CLIClaude Code
サンドボックスOS レベル(macOS Seatbelt / Linux bubblewrap / Windows は restricted token + ACL ベースの独自機構)プロセス/Hook ベースのソフト制限
ネットワーク制御OS 制限(既定無効・ドメイン allow リスト)既定有効、Hooks で制限可能
ファイルアクセス制限OS パス制限で強制設定とディレクトリ許可で制限
危険コマンドブロックOS サンドボックス+execpolicy ルールPreToolUse Hook で実装
承認モード4 種(on-request / never / untrusted / granular)パーミッションモード+Hooks

Codex CLI が有利な場面:OS レベルの強制力が必要な環境(信頼できないコードの実行、共有 CI 環境、コンプライアンス要求)

Claude Code が有利な場面:柔軟なカスタマイズが必要な環境(プロジェクト固有のブロックルール、複雑な権限管理)


エージェント機能の比較

サブエージェント

観点Codex CLIClaude Code
定義ファイル形式TOMLMarkdown(YAML frontmatter)
推論レベル設定model_reasoning_effort: low / medium / highモデル選択で代替
サンドボックス指定エージェント単位で sandbox_mode を指定isolation: worktree
スレッド切り替え/agent でセッション中に切り替えサブエージェントは個別呼出し中心

マルチエージェント

観点Codex CLIClaude Code
並列実行[agents]max_threads(既定 6)/ max_depth(既定 1)サブエージェント並列+Agent Teams
共有タスクリストありAgent Teams 系
安定性安定版機能により実験的なものを含む

プロジェクト設定の比較

観点Codex CLIClaude Code
設定ファイル名AGENTS.mdCLAUDE.md
設定形式プレーン MarkdownMarkdown + frontmatter(path-scoped rules)
インポートなし@path/to/file でインポート可
上書き機能同階層 AGENTS.override.md で代替下位スコープが上位を上書き
自動学習なしAuto Memory(MEMORY.md)で自動蓄積
代替ファイル名project_doc_fallback_filenames で指定可変更不可(CLAUDE.md 固定)

CLAUDE.md が有利な点@インポート による分割管理、path-scoped rules、Auto Memory による自動学習

AGENTS.md が有利な点AGENTS.override.md による同階層差し替え、サブディレクトリ自動マージ、フォールバックファイル名指定


MCP / ツール連携の比較

観点Codex CLIClaude Code
設定ファイルconfig.toml(TOML).mcp.json(JSON)
トランスポートstdio・Streamable HTTPstdio・HTTP・SSE
Tool Search(遅延ロード)未対応(全ツールロード)標準で遅延ロードに対応
公式レジストリ未提供(2026-05 時点)あり(api.anthropic.com/mcp-registry/v0/servers
MCP サーバとして公開codex mcp-server(stdio)claude mcp serve
ツール絞り込みenabled_tools / disabled_tools設定 UI / Hooks

CI/CD 連携の比較

観点Codex CLIClaude Code
公式 GitHub Actionopenai/codex-action@v1公式アクションは未提供(SDK・自作スクリプト中心)
CI セットアップ難度Action 1 ステップで完結SDK スクリプトの実装が必要
OS サンドボックスあり(CI ランナー上で強制)なし(Hooks ベース)
完全自動実行safety-strategy: drop-sudosandbox: workspace-write自作のパーミッション設計が必要

Codex CLI が有利な場面:CI/CD での完全自動化、OS レベルのセキュリティが必要な環境

Claude Code が有利な場面:既存の TypeScript/Python スクリプトとの統合、細かいカスタマイズが必要な環境


コストの比較(2026 年 5 月時点)

モデル料金(1M トークンあたり、参考値)

最新値は公式 Pricing ページや Help Center のレートカードで確認できます。Codex の従量請求はトークン課金ベースに移行済みです。

モデル入力(参考)出力(参考)
Claude Opus 4.7概ね Sonnet の数倍概ね Sonnet の数倍
Claude Sonnet 4.6中位中位
Claude Haiku 4.5低価格帯低価格帯
GPT-5.5中〜高位(フロンティア)中〜高位
GPT-5.4 / 5.4-mini中位/低価格帯中位/低価格帯
GPT-5.3-Codex / 5.3-Codex-Spark用途特化(最新は公式 Pricing 参照)用途特化

価格は頻繁に変動します。実額は Anthropic / OpenAI 公式の Pricing ページで都度確認してください。

サブスクリプション

プランCodex CLIClaude Code
無料なし(API 従量のみ)なし
標準ChatGPT Plus($20/月)Claude Pro($20/月)
高機能ChatGPT Pro / Pro 5x / 20xClaude Max 5x / 20x
企業向けChatGPT EnterpriseClaude Team / Enterprise

ユースケース別推奨

Codex CLI が向いているケース

  • 完全自動化パイプライン: CI/CD の承認なし実行、Issue→PR 自動生成
  • 信頼できないコードの安全な実行: OS サンドボックスが必須の環境
  • コスト最適化重視: GPT-5.4-mini +低推論で消費を最小化
  • OpenAI エコシステム前提: Agents SDK・Realtime API を使うチーム
  • GitHub Actions との統合: 公式 Action でセットアップを最短化

Claude Code が向いているケース

  • 大規模コードベースの理解: 1M トークンで数万行を一括処理
  • 精度重視の実装: SWE-bench Verified 上位スコアの恩恵を受けたい
  • 対話型の協調作業: Plan Mode で計画を擦り合わせる進め方
  • CLAUDE.md の高度な管理: path-scoped rules・@インポート・Auto Memory
  • チームの知識蓄積: Auto Memory でプロジェクト知識を継続蓄積

ハイブリッド構成

実務では両者の使い分けが現実解です。

【日常的な開発作業】       Claude Code(対話型・精度重視)
【CI/CD での自動化】       Codex CLI(GitHub Action・OS サンドボックス)
【大規模コードベース調査】 Claude Code(1M コンテキスト)
【並列タスクの高速処理】   Codex CLI(max_threads・サブエージェント)

2026 年の進化トレンド

Codex CLI

  • Rust 実装の高速化と Windows サンドボックスの強化(v0.129.0 で名前付きパイプ・ConPTY・PowerShell allow ルールが整理)
  • GitHub Action・Agents SDK との統合継続
  • [mcp_servers.<name>] の OAuth 系(scopes / oauth_resource / mcp_oauth_*)の整備
  • Plugins の拡充

Claude Code

  • サブエージェント・Agent Teams 系の継続改良
  • Auto Memory・CLAUDE.md による知識蓄積の標準化
  • Bedrock / Vertex AI 等への接続オプション
  • IDE 拡張の機能強化

一次ソース

Codex CLI 公式:

Claude Code 公式:

比較記事(参考):