AI エージェントに任せていいタスク、任せてはいけないタスク

自動化できる仕事と、人間が承認すべき仕事を分ける。

この記事の結論

AI エージェントは万能ではありません。低リスク・検証可能・手戻り可能なタスクから 任せて、権限や承認が必要な領域はガードレールを設けます。
タスクは 3 段階に分類: 低リスク (任せる) / 中リスク (補助) / 高リスク (人間主導)。
任せていいタスクは「調査・要約・テスト案・下書き・ログ分析」、注意が必要なのは「顧客送信・課金・削除・権限変更・法的判断」。
権限設計は、「最小権限の原則」+「重要操作は人間承認」 が基本。
失敗が起きたら ルール (CLAUDE.md / AGENTS.md / ガイドライン) に反映 することで、再発を防ぎます。

「AI エージェントに、どの業務まで任せていいですか?」

CTO や DX 担当者からよく届く相談です。AI エージェントの能力は急速に上がっていますが、「できる」と「任せていい」は別 です。任せ方を誤ると、顧客への誤送信、データ破損、賠償リスクにつながります。

OpenAI のワークスペースエージェントの設計でも、エージェントは 「組織が定めた権限の範囲内で動作する」 前提が組み込まれています (Introducing workspace agents in ChatGPT / OpenAI)。任せる範囲を権限で縛ることが、安全な運用の前提です。

この記事では、AI エージェントに任せていいタスクと、任せてはいけないタスクの判断基準を整理します。

AI エージェントに期待できること

AI エージェントが現状で対応可能なタスク:

情報の収集と要約 (調査、ニュース整理、過去事例)
データの分類と整理 (問い合わせ分類、顧客セグメンテーション)
下書きの生成 (メール、レポート、議事録)
テストケースの提案
ログから異常を検知
定型的な業務の実行

これらは 検証可能で、間違えても致命的ではない タスクです。

任せていいタスクの条件

3 つの条件が揃ったタスクは、AI に任せやすい:

1. リスクが低い

間違えても、

修正が可能
影響範囲が限定的
賠償・法的リスクが小さい

2. 検証可能

AI の出力を、

人間が短時間でレビュー可能
数値で評価できる
ルール違反を自動検出できる

3. 手戻り可能

間違いに気づいた時、

すぐ修正できる
ロールバック可能
取り返しがつく

任せてはいけないタスクの条件

逆に、AI に任せにくいタスク:

1. リスクが高い

顧客への直接送信 (誤情報の影響大)
課金処理 (金銭の事故)
データ削除 (取り返しがつかない)
権限変更 (セキュリティ事故)

2. 検証が困難

主観的な判断 (デザイン、文章の質)
長期的な影響 (戦略決定)
法的・倫理的判断

3. 影響範囲が大きい

全顧客に影響する変更
業務プロセス全体の変更
セキュリティポリシーの変更

3 段階の分類表

段階	例	運用
低リスク (任せる)	調査、要約、テスト案、下書き、ログ分析	AI が実行、人間は事後確認
中リスク (補助)	新機能の実装、レビュー支援、顧客対応のドラフト	AI が候補を出し、人間が承認
高リスク (人間主導)	顧客送信、課金、削除、権限変更、法的判断	人間が主導、AI は補助のみ

Anthropic の Managed Agents の解説でも、エージェントの outcomes (成功基準) を明示し、graders で独立評価する 設計が紹介されています (New in Claude Managed Agents / Anthropic)。AI に任せるとき、「何をもって成功か」「誰がどう評価するか」を決めておくのが、品質を保つコツです。

ここまでで「自社の AI エージェント導入を整理したい」と感じたら、設計から相談するのが現実的です。

AI エージェント導入設計を相談する →

承認フローと権限設計

AI エージェントに任せるときの承認フロー:

パターン 1: 完全自動

AI が実行、結果を Slack 通知
低リスクタスク向け
例: 議事録要約、調査レポート

パターン 2: 事後承認

AI が実行、人間が事後確認
ロールバック可能なタスク向け
例: 内部メモ生成、データ整理

パターン 3: 事前承認

AI が提案、人間が承認してから実行
中リスクタスク向け
例: 顧客向けメールドラフト、機能実装案

パターン 4: 人間主導

人間が決定、AI は補助のみ
高リスクタスク向け
例: 課金処理、削除操作

OpenAI の Codex Agent Loop の解説でも、エージェントは ループの各ターンでツール呼び出しと結果を扱う 設計とされています (Unrolling the Codex agent loop / OpenAI)。承認フローも、ループの中に組み込む形が現実的です。

失敗時のルール反映

AI エージェントが失敗したら、プロンプトの工夫ではなく、ルールに反映 します。

CLAUDE.md / AGENTS.md に追記
業務マニュアルに追記
承認フローを見直し

詳しくは CLAUDE.md / AGENTS.md に何を書くべきかで展開しています。

導入チェックリスト

AI エージェント導入時の確認項目:

項目	確認すること
タスク分類	低・中・高リスクで仕分け
権限設計	必要最小権限の原則
承認フロー	リスク別の承認ステップ
ログ	エージェントの行動履歴
監査	第三者による定期レビュー
失敗対応	ロールバック手順
ルール更新	失敗時の反映プロセス

min's の AI エージェント導入支援

min's では、AI エージェント導入の設計、権限設計、承認フロー構築を支援しています。

設計フェーズ: 30〜80 万円
実装フェーズ: 100〜400 万円
継続改善: 月 30〜80 万円

AI エージェント導入設計を相談したい方へ

min's では、AI エージェントの導入設計、権限・承認フロー構築、改善並走を支援しています。

次に読む記事

参考

Introducing workspace agents in ChatGPT / OpenAI — 組織が定めた権限範囲で動作するエージェント
New in Claude Managed Agents / Anthropic — outcomes と graders による品質基準
Unrolling the Codex agent loop / OpenAI — エージェントループとツール利用