
AI エージェントに任せていいタスク、任せてはいけないタスク
自動化できる仕事と、人間が承認すべき仕事を分ける。
この記事の結論
- AI エージェントは万能ではありません。低リスク・検証可能・手戻り可能なタスクから 任せて、権限や承認が必要な領域はガードレールを設けます。
- タスクは 3 段階に分類: 低リスク (任せる) / 中リスク (補助) / 高リスク (人間主導)。
- 任せていいタスクは「調査・要約・テスト案・下書き・ログ分析」、注意が必要なのは「顧客送信・課金・削除・権限変更・法的判断」。
- 権限設計は、「最小権限の原則」+「重要操作は人間承認」 が基本。
- 失敗が起きたら ルール (CLAUDE.md / AGENTS.md / ガイドライン) に反映 することで、再発を防ぎます。
「AI エージェントに、どの業務まで任せていいですか?」
CTO や DX 担当者からよく届く相談です。AI エージェントの能力は急速に上がっていますが、「できる」と「任せていい」は別 です。任せ方を誤ると、顧客への誤送信、データ破損、賠償リスクにつながります。
OpenAI のワークスペースエージェントの設計でも、エージェントは 「組織が定めた権限の範囲内で動作する」 前提が組み込まれています (Introducing workspace agents in ChatGPT / OpenAI)。任せる範囲を権限で縛ることが、安全な運用の前提です。
この記事では、AI エージェントに任せていいタスクと、任せてはいけないタスクの判断基準を整理します。
AI エージェントに期待できること
AI エージェントが現状で対応可能なタスク:
- 情報の収集と要約 (調査、ニュース整理、過去事例)
- データの分類と整理 (問い合わせ分類、顧客セグメンテーション)
- 下書きの生成 (メール、レポート、議事録)
- テストケースの提案
- ログから異常を検知
- 定型的な業務の実行
これらは 検証可能で、間違えても致命的ではない タスクです。
任せていいタスクの条件
3 つの条件が揃ったタスクは、AI に任せやすい:
1. リスクが低い
間違えても、
- 修正が可能
- 影響範囲が限定的
- 賠償・法的リスクが小さい
2. 検証可能
AI の出力を、
- 人間が短時間でレビュー可能
- 数値で評価できる
- ルール違反を自動検出できる
3. 手戻り可能
間違いに気づいた時、
- すぐ修正できる
- ロールバック可能
- 取り返しがつく
任せてはいけないタスクの条件
逆に、AI に任せにくいタスク:
1. リスクが高い
- 顧客への直接送信 (誤情報の影響大)
- 課金処理 (金銭の事故)
- データ削除 (取り返しがつかない)
- 権限変更 (セキュリティ事故)
2. 検証が困難
- 主観的な判断 (デザイン、文章の質)
- 長期的な影響 (戦略決定)
- 法的・倫理的判断
3. 影響範囲が大きい
- 全顧客に影響する変更
- 業務プロセス全体の変更
- セキュリティポリシーの変更
3 段階の分類表
| 段階 | 例 | 運用 |
|---|---|---|
| 低リスク (任せる) | 調査、要約、テスト案、下書き、ログ分析 | AI が実行、人間は事後確認 |
| 中リスク (補助) | 新機能の実装、レビュー支援、顧客対応のドラフト | AI が候補を出し、人間が承認 |
| 高リスク (人間主導) | 顧客送信、課金、削除、権限変更、法的判断 | 人間が主導、AI は補助のみ |
Anthropic の Managed Agents の解説でも、エージェントの outcomes (成功基準) を明示し、graders で独立評価する 設計が紹介されています (New in Claude Managed Agents / Anthropic)。AI に任せるとき、「何をもって成功か」「誰がどう評価するか」を決めておくのが、品質を保つコツです。
ここまでで「自社の AI エージェント導入を整理したい」と感じたら、設計から相談するのが現実的です。
承認フローと権限設計
AI エージェントに任せるときの承認フロー:
パターン 1: 完全自動
- AI が実行、結果を Slack 通知
- 低リスクタスク向け
- 例: 議事録要約、調査レポート
パターン 2: 事後承認
- AI が実行、人間が事後確認
- ロールバック可能なタスク向け
- 例: 内部メモ生成、データ整理
パターン 3: 事前承認
- AI が提案、人間が承認してから実行
- 中リスクタスク向け
- 例: 顧客向けメールドラフト、機能実装案
パターン 4: 人間主導
- 人間が決定、AI は補助のみ
- 高リスクタスク向け
- 例: 課金処理、削除操作
OpenAI の Codex Agent Loop の解説でも、エージェントは ループの各ターンでツール呼び出しと結果を扱う 設計とされています (Unrolling the Codex agent loop / OpenAI)。承認フローも、ループの中に組み込む形が現実的です。
失敗時のルール反映
AI エージェントが失敗したら、プロンプトの工夫ではなく、ルールに反映 します。
- CLAUDE.md / AGENTS.md に追記
- 業務マニュアルに追記
- 承認フローを見直し
詳しくは CLAUDE.md / AGENTS.md に何を書くべきか で展開しています。
導入チェックリスト
AI エージェント導入時の確認項目:
| 項目 | 確認すること |
|---|---|
| タスク分類 | 低・中・高リスクで仕分け |
| 権限設計 | 必要最小権限の原則 |
| 承認フロー | リスク別の承認ステップ |
| ログ | エージェントの行動履歴 |
| 監査 | 第三者による定期レビュー |
| 失敗対応 | ロールバック手順 |
| ルール更新 | 失敗時の反映プロセス |
min's の AI エージェント導入支援
min's では、AI エージェント導入の設計、権限設計、承認フロー構築を支援しています。
- 設計フェーズ: 30〜80 万円
- 実装フェーズ: 100〜400 万円
- 継続改善: 月 30〜80 万円
AI エージェント導入設計を相談したい方へ
min's では、AI エージェントの導入設計、権限・承認フロー構築、改善並走を支援しています。
次に読む記事
参考
- Introducing workspace agents in ChatGPT / OpenAI — 組織が定めた権限範囲で動作するエージェント
- New in Claude Managed Agents / Anthropic — outcomes と graders による品質基準
- Unrolling the Codex agent loop / OpenAI — エージェントループとツール利用