AI Tools 2026年4月15日 (更新: 2026年5月8日)

Codex CLI vs Claude Code：機能・哲学・ユースケース徹底比較（2026 年 5 月版）

OpenAI Codex CLI と Anthropic Claude Code を 2026 年 5 月時点で徹底比較。アーキテクチャ・安全モデル・エージェント機能・MCP・CI/CD 連携・コスト・SWE ベンチマーク結果を多角的に整理しました。

#Codex CLI #Claude Code #比較 #ツール選択 #SWE-bench #AIエージェント

この章の要点

Codex CLI と Claude Code は「ターミナルで動く AI コーディングエージェント」という意味では同じカテゴリですが、設計哲学とアーキテクチャが根本的に異なります。

Codex CLI: 「自律的に動かして後でレビュー」。OS レベルのサンドボックスで安全を確保し、並列タスク・CI/CD 連携が得意。OSS（Apache 2.0）。
Claude Code: 「逐次確認しながら一緒に作る」。コンテキスト理解の精度が高く、1M トークンの大規模コードベース処理が得意。クローズドソース。

どちらかが一方的に優れているわけではなく、タスクの性質とチームのワークスタイルで使い分けるのが現実的です。

基本情報の比較

項目	Codex CLI	Claude Code
開発元	OpenAI	Anthropic
ライセンス	Apache 2.0（OSS）	クローズドソース
実装言語	Rust	Node.js / TypeScript
主要モデル	GPT-5.5 / GPT-5.4 / GPT-5.3-Codex / GPT-5.3-Codex-Spark	Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5
コンテキスト	モデル依存（GPT-5.5 / 5.4 系で長尺対応、5.3-Codex-Spark は 128k）	最大 1M トークン（Sonnet/Opus 系）
インストール	`npm i -g @openai/codex` または `brew install --cask codex`	`curl -fsSL claude.ai/install.sh` または `brew install --cask claude-code`
最新安定版（2026-05）	v0.129.0（2026-05-07）	Claude 4 系の継続リリース

ベンチマーク比較

SWE-bench / Terminal-Bench（2026 年時点）

ベンチマーク条件（モデル・プロンプト・ツール構成）でスコアは大きく変わります。あくまで参考値です。

モデル / システム	ベンチ	スコア
Claude Opus 4.7	SWE-bench Verified	87.6%
GPT-5.3-Codex	SWE-bench Pro（汚染耐性版・4 言語）	56.8%
GPT-5.3-Codex	Terminal-Bench 2.0	77.3%

注：SWE-bench Verified と SWE-bench Pro は別物です。Pro は汚染耐性のために問題セットが入れ替えられており、Verified より難易度・スコアが下がります。直接比較する際は同じベンチで揃えてください。

トークン効率

Codex CLI は Rust 実装と効率的なコンテキスト管理により、同等タスクのトークン消費が Claude Code より少ない傾向にあると複数の独立比較で報告されています。実プロジェクトでは差が縮まる場面もあるため、自プロジェクトでの実測をお勧めします。

設計哲学の違い

Codex CLI：自律実行モデル

タスク指示 → エージェントが自律的に実行 → 結果を後でレビュー

人の介在を最小化してスループットを最大化する設計
OS サンドボックスが安全網になるため、承認なしで動かしやすい
CI/CD での完全自動化を想定した設計

Claude Code：協調作業モデル

タスク指示 → Claude が確認・計画を提示 → 人が承認 → 実行

人と Claude が対話しながら進めることを前提とした設計
Plan Mode で事前確認を促す
複雑な意思決定は人が担うフロー

安全モデルの比較

観点	Codex CLI	Claude Code
サンドボックス	OS レベル（macOS Seatbelt / Linux bubblewrap / Windows は restricted token + ACL ベースの独自機構）	プロセス／Hook ベースのソフト制限
ネットワーク制御	OS 制限（既定無効・ドメイン allow リスト）	既定有効、Hooks で制限可能
ファイルアクセス制限	OS パス制限で強制	設定とディレクトリ許可で制限
危険コマンドブロック	OS サンドボックス＋execpolicy ルール	PreToolUse Hook で実装
承認モード	4 種（on-request / never / untrusted / granular）	パーミッションモード＋Hooks

Codex CLI が有利な場面：OS レベルの強制力が必要な環境（信頼できないコードの実行、共有 CI 環境、コンプライアンス要求）

Claude Code が有利な場面：柔軟なカスタマイズが必要な環境（プロジェクト固有のブロックルール、複雑な権限管理）

エージェント機能の比較

サブエージェント

観点	Codex CLI	Claude Code
定義ファイル形式	TOML	Markdown（YAML frontmatter）
推論レベル設定	`model_reasoning_effort: low / medium / high`	モデル選択で代替
サンドボックス指定	エージェント単位で `sandbox_mode` を指定	`isolation: worktree` 等
スレッド切り替え	`/agent` でセッション中に切り替え	サブエージェントは個別呼出し中心

マルチエージェント

観点	Codex CLI	Claude Code
並列実行	`[agents]` の `max_threads`（既定 6）／ `max_depth`（既定 1）	サブエージェント並列＋Agent Teams
共有タスクリスト	あり	Agent Teams 系
安定性	安定版	機能により実験的なものを含む

プロジェクト設定の比較

観点	Codex CLI	Claude Code
設定ファイル名	`AGENTS.md`	`CLAUDE.md`
設定形式	プレーン Markdown	Markdown + frontmatter（path-scoped rules）
インポート	なし	`@path/to/file` でインポート可
上書き機能	同階層 `AGENTS.override.md` で代替	下位スコープが上位を上書き
自動学習	なし	Auto Memory（`MEMORY.md`）で自動蓄積
代替ファイル名	`project_doc_fallback_filenames` で指定可	変更不可（`CLAUDE.md` 固定）

CLAUDE.md が有利な点：@インポート による分割管理、path-scoped rules、Auto Memory による自動学習

AGENTS.md が有利な点：AGENTS.override.md による同階層差し替え、サブディレクトリ自動マージ、フォールバックファイル名指定

MCP / ツール連携の比較

観点	Codex CLI	Claude Code
設定ファイル	`config.toml`（TOML）	`.mcp.json`（JSON）
トランスポート	stdio・Streamable HTTP	stdio・HTTP・SSE
Tool Search（遅延ロード）	未対応（全ツールロード）	標準で遅延ロードに対応
公式レジストリ	未提供（2026-05 時点）	あり（`api.anthropic.com/mcp-registry/v0/servers`）
MCP サーバとして公開	`codex mcp-server`（stdio）	`claude mcp serve`
ツール絞り込み	`enabled_tools` / `disabled_tools`	設定 UI / Hooks

CI/CD 連携の比較

観点	Codex CLI	Claude Code
公式 GitHub Action	`openai/codex-action@v1`	公式アクションは未提供（SDK・自作スクリプト中心）
CI セットアップ難度	Action 1 ステップで完結	SDK スクリプトの実装が必要
OS サンドボックス	あり（CI ランナー上で強制）	なし（Hooks ベース）
完全自動実行	`safety-strategy: drop-sudo` ＋ `sandbox: workspace-write`	自作のパーミッション設計が必要

Codex CLI が有利な場面：CI/CD での完全自動化、OS レベルのセキュリティが必要な環境

Claude Code が有利な場面：既存の TypeScript/Python スクリプトとの統合、細かいカスタマイズが必要な環境

コストの比較（2026 年 5 月時点）

モデル料金（1M トークンあたり、参考値）

最新値は公式 Pricing ページや Help Center のレートカードで確認できます。Codex の従量請求はトークン課金ベースに移行済みです。

モデル	入力（参考）	出力（参考）
Claude Opus 4.7	概ね Sonnet の数倍	概ね Sonnet の数倍
Claude Sonnet 4.6	中位	中位
Claude Haiku 4.5	低価格帯	低価格帯
GPT-5.5	中〜高位（フロンティア）	中〜高位
GPT-5.4 / 5.4-mini	中位／低価格帯	中位／低価格帯
GPT-5.3-Codex / 5.3-Codex-Spark	用途特化（最新は公式 Pricing 参照）	用途特化

価格は頻繁に変動します。実額は Anthropic / OpenAI 公式の Pricing ページで都度確認してください。

サブスクリプション

プラン	Codex CLI	Claude Code
無料	なし（API 従量のみ）	なし
標準	ChatGPT Plus（$20/月）	Claude Pro（$20/月）
高機能	ChatGPT Pro / Pro 5x / 20x	Claude Max 5x / 20x
企業向け	ChatGPT Enterprise	Claude Team / Enterprise

ユースケース別推奨

Codex CLI が向いているケース

完全自動化パイプライン: CI/CD の承認なし実行、Issue→PR 自動生成
信頼できないコードの安全な実行: OS サンドボックスが必須の環境
コスト最適化重視: GPT-5.4-mini ＋低推論で消費を最小化
OpenAI エコシステム前提: Agents SDK・Realtime API を使うチーム
GitHub Actions との統合: 公式 Action でセットアップを最短化

Claude Code が向いているケース

大規模コードベースの理解: 1M トークンで数万行を一括処理
精度重視の実装: SWE-bench Verified 上位スコアの恩恵を受けたい
対話型の協調作業: Plan Mode で計画を擦り合わせる進め方
CLAUDE.md の高度な管理: path-scoped rules・@インポート・Auto Memory
チームの知識蓄積: Auto Memory でプロジェクト知識を継続蓄積

ハイブリッド構成

実務では両者の使い分けが現実解です。

【日常的な開発作業】       Claude Code（対話型・精度重視）
【CI/CD での自動化】       Codex CLI（GitHub Action・OS サンドボックス）
【大規模コードベース調査】 Claude Code（1M コンテキスト）
【並列タスクの高速処理】   Codex CLI（max_threads・サブエージェント）

2026 年の進化トレンド

Codex CLI

Rust 実装の高速化と Windows サンドボックスの強化（v0.129.0 で名前付きパイプ・ConPTY・PowerShell allow ルールが整理）
GitHub Action・Agents SDK との統合継続
[mcp_servers.<name>] の OAuth 系（scopes / oauth_resource / mcp_oauth_*）の整備
Plugins の拡充

Claude Code

サブエージェント・Agent Teams 系の継続改良
Auto Memory・CLAUDE.md による知識蓄積の標準化
Bedrock / Vertex AI 等への接続オプション
IDE 拡張の機能強化

一次ソース

Codex CLI 公式：

Claude Code 公式：

比較記事（参考）：