AI Tools 2026年4月18日

Claude Code Auto Mode解説：2層防御で承認ダイアログを93%削減

Claude Code Auto modeの仕組みを解説。入力層のプロンプトインジェクション検査と出力層のSonnet分類器による2層防御アーキテクチャ、Max向け提供状況、承認率93%の意味を詳しくカバー。

#Claude Code #Auto mode #セキュリティ #承認モード #Max

TL;DR

Maxプラン加入者向けの自動承認モード（v2.1.111〜）
承認リクエストの 93%を自動認可 し、過剰な確認ダイアログを大幅削減
セキュリティは 2層防御 で担保（インジェクション検査 + Sonnet分類器）

概要

Claude Code Auto mode は、通常ならユーザーに確認を求める操作を Anthropic のセキュリティ評価に基づいて自動認可する機能です。v2.1.111 から Max サブスクライバーを対象に提供開始されました。

「安全かどうかをいちいち確認するコスト」と「確認なしで実行するリスク」のバランスを取り、信頼できる操作を自動化しながら危険な操作は止める 設計です。

2層防御アーキテクチャ

第1層：入力層（プロンプトインジェクション検査）

エージェントへの入力を評価します。

Webページ・ファイル・ツール出力に悪意あるインジェクションが含まれていないか検査
外部コンテンツがエージェントの行動を乗っ取ろうとするパターンを検出
インジェクションを検出した場合は自動実行を停止してユーザーに通知

第2層：出力層（Sonnet 分類器）

エージェントが提案するアクションを評価します。

Claude Sonnet 4.x が各アクション（ファイル書き込み・コマンド実行・API呼び出し等）を評価
想定されるリスクレベルを分類（low / medium / high）
low・medium は自動承認、high はユーザーへエスカレーション

承認率93%の意味

通常の開発作業では承認リクエストの 93% が「low / medium」に分類され自動認可されます。

自動認可される代表的な操作：

ファイルの読み取り・書き込み（プロジェクト内）
npm install / pip install などのパッケージ管理
テスト実行・ビルドコマンド
Git操作（add / commit / diff）

ユーザー確認が必要な操作（自動認可しない）：

rm -rf などの破壊的削除
外部ネットワークへのリクエスト（不審なもの）
環境変数・シークレットの変更
システムレベルの設定変更

有効化方法

# Max プランで自動的に利用可能
# 旧フラグは不要（v2.1.111以降）
claude

# 明示的に指定する場合
claude --auto-mode

# Auto modeの状態確認
/status

グローバルシステムプロンプトキャッシング

Auto mode では グローバルシステムプロンプトキャッシング も有効化されます。Anthropic が管理するシステムプロンプト（Sonnet 分類器の評価基準等）がキャッシュされ、各リクエストのレイテンシとコストを削減します。

Hooks との組み合わせ

Auto mode が自動承認しない操作は PreToolUse フックで追加制御できます。

{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "command",
            "command": "bash /path/to/security-check.sh"
          }
        ]
      }
    ]
  }
}

Hooks が終了コード 2 を返すとツール実行を中断できます。Auto mode + Hooks で「自動化しつつ独自ルールを適用する」構成が組めます。