AI Tools 2026年4月18日

Claude Code Auto Mode解説:2層防御で承認ダイアログを93%削減

Claude Code Auto modeの仕組みを解説。入力層のプロンプトインジェクション検査と出力層のSonnet分類器による2層防御アーキテクチャ、Max向け提供状況、承認率93%の意味を詳しくカバー。

TL;DR

  • Maxプラン加入者向けの自動承認モード(v2.1.111〜)
  • 承認リクエストの 93%を自動認可 し、過剰な確認ダイアログを大幅削減
  • セキュリティは 2層防御 で担保(インジェクション検査 + Sonnet分類器)

概要

Claude Code Auto mode は、通常ならユーザーに確認を求める操作を Anthropic のセキュリティ評価に基づいて自動認可する機能です。v2.1.111 から Max サブスクライバーを対象に提供開始されました。

「安全かどうかをいちいち確認するコスト」と「確認なしで実行するリスク」のバランスを取り、信頼できる操作を自動化しながら危険な操作は止める 設計です。


2層防御アーキテクチャ

第1層:入力層(プロンプトインジェクション検査)

エージェントへの入力を評価します。

  • Webページ・ファイル・ツール出力に悪意あるインジェクションが含まれていないか検査
  • 外部コンテンツがエージェントの行動を乗っ取ろうとするパターンを検出
  • インジェクションを検出した場合は自動実行を停止してユーザーに通知

第2層:出力層(Sonnet 分類器)

エージェントが提案するアクションを評価します。

  • Claude Sonnet 4.x が各アクション(ファイル書き込み・コマンド実行・API呼び出し等)を評価
  • 想定されるリスクレベルを分類(low / medium / high)
  • low・medium は自動承認、high はユーザーへエスカレーション

承認率93%の意味

通常の開発作業では承認リクエストの 93% が「low / medium」に分類され自動認可されます。

自動認可される代表的な操作:

  • ファイルの読み取り・書き込み(プロジェクト内)
  • npm install / pip install などのパッケージ管理
  • テスト実行・ビルドコマンド
  • Git操作(add / commit / diff)

ユーザー確認が必要な操作(自動認可しない):

  • rm -rf などの破壊的削除
  • 外部ネットワークへのリクエスト(不審なもの)
  • 環境変数・シークレットの変更
  • システムレベルの設定変更

有効化方法

# Max プランで自動的に利用可能
# 旧フラグは不要(v2.1.111以降)
claude

# 明示的に指定する場合
claude --auto-mode

# Auto modeの状態確認
/status

グローバルシステムプロンプトキャッシング

Auto mode では グローバルシステムプロンプトキャッシング も有効化されます。Anthropic が管理するシステムプロンプト(Sonnet 分類器の評価基準等)がキャッシュされ、各リクエストのレイテンシとコストを削減します。


Hooks との組み合わせ

Auto mode が自動承認しない操作は PreToolUse フックで追加制御できます。

{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "command",
            "command": "bash /path/to/security-check.sh"
          }
        ]
      }
    ]
  }
}

Hooks が終了コード 2 を返すとツール実行を中断できます。Auto mode + Hooks で「自動化しつつ独自ルールを適用する」構成が組めます。


参考リンク