Agentic AI 学習ロードマップ — 「フルスタックインテリジェンス」を9ヶ月で習得する体系的な道筋

@ingliguori 氏(Giuliano Liguori)のポストが、Agentic AI を学ぶためのロードマップを共有しています。

Roadmap to learn Agentic AI: AI fundamentals → Python + frameworks → LLMs → Agents architecture → Memory + RAG → Planning & decision-making → RL & self-improvement → Deployment → Real-world automation Agentic AI = full-stack intelligence.

「Agentic AI = フルスタックインテリジェンス」というフレーズが示すように、AI エージェントの開発には基礎数学からデプロイまで、フルスタックの知識が求められます。本記事では、このロードマップを複数の学習リソースと照合しながら、各段階で何を学び、どのツールを使い、どこまでを目指すのかを体系的に解説します。

ロードマップの全体像

Liguori 氏が示した9ステップを、Scaler の9ヶ月ロードマップroadmap.sh の AI Agents ロードマップを参考に、時系列で整理します。

月0-1  AI Fundamentals       ← 数学 + ML 基礎
月1-2  Python + Frameworks   ← API + ライブラリ
月2-3  LLMs                  ← Transformer + プロンプト
月3-4  Agents Architecture   ← ReAct + ツール使用
月4-5  Memory + RAG          ← ベクトル DB + 検索拡張
月5-6  Planning & Decision   ← 計画 + マルチエージェント
月6-7  RL & Self-improvement ← フィードバック + 自律性
月7-8  Deployment            ← MLOps + 監視
月8-9  Real-world Automation ← ポートフォリオ + 実案件

Step 1: AI Fundamentals(月0-1)

学ぶこと

分野具体的な内容
線形代数ベクトル、行列演算、固有値分解、SVD
微積分勾配、偏微分、最適化
確率・統計ベイズの定理、分布、仮説検定
ML 基礎教師あり/なし学習、評価指標

推奨リソース

  • Khan Academy — 数学基礎
  • “Mathematics for Machine Learning”(書籍)
  • StatQuest — 統計の直感的理解

この段階のゴール

「なぜニューラルネットワークが動くのか」を数学的に説明できること。数式を書ける必要はないが、勾配降下法やベイズ推論の直感を持つことが重要です。

Step 2: Python + Frameworks(月1-2)

学ぶこと

分野具体的な内容
Python 基礎データ構造、関数、クラス、例外処理
データ処理Pandas、NumPy、Matplotlib
APIREST API の呼び出し、JSON 処理
開発環境Jupyter Notebook、Google Colab、Git

この段階のゴール

「API を呼んでデータを加工し、結果を可視化する」一連のフローを Python で書けること。

Step 3: LLMs(月2-3)

学ぶこと

分野具体的な内容
Transformerアテンション機構、エンコーダ/デコーダ
トークン化BPE、コンテキストウィンドウ、トークン課金
プロンプトエンジニアリングZero-shot、Few-shot、Chain of Thought
生成制御temperature、top-p、frequency penalty
API 利用OpenAI API、Anthropic API、ストリーミング応答

推奨ツール

この段階のゴール

「適切なプロンプトを設計し、LLM API を使ったアプリケーションを構築する」こと。temperature や top-p の効果を体感的に理解していること。

Step 4: Agents Architecture(月3-4)

学ぶこと

ここからが Agentic AI の本質です。

分野具体的な内容
エージェントループ知覚 → 推論 → 実行 → 観察/反省
ReAct パターン推論(Reasoning)と行動(Acting)の交互実行
ツール使用関数呼び出し、Web 検索、コード実行、DB クエリ
MCPModel Context Protocol によるツール連携

エージェントループの構造

ユーザーの指示
  │
  ├── 知覚(Perception): 入力を理解する
  │
  ├── 推論(Reasoning): 次に何をすべきか考える
  │
  ├── 実行(Action): ツールを呼び出す / コードを実行する
  │
  └── 観察(Observation): 結果を評価し、次のステップを決める
        │
        └── 完了するまでループ

主要なアーキテクチャパターン

パターン特徴適用場面
ReAct推論と行動を交互に実行汎用的なタスク
Chain of Thoughtステップバイステップで思考複雑な推論
Planner-Executor計画と実行を分離多段階タスク
DAG Agent有向非巡回グラフで依存関係を管理並列処理可能なタスク
Tree of Thought複数の思考経路を探索創造的問題解決

推奨フレームワーク

フレームワーク特徴用途
LangChain最も広く使われるエージェントフレームワーク汎用
LlamaIndexデータ接続に強いRAG 中心
CrewAIマルチエージェントの役割分担チーム型
AutoGenMicrosoft 製、会話型マルチエージェント研究・実験

この段階のゴール

「単一のエージェントが複数のツールを使って多段階のタスクを完了する」アプリケーションを構築できること。

Step 5: Memory + RAG(月4-5)

学ぶこと

分野具体的な内容
ベクトル埋め込みテキストをベクトルに変換
チャンキング文書を適切な単位に分割
ベクトル DBChromaDB、Pinecone、Weaviate
RAG検索拡張生成の設計と実装
メモリの種類短期 / 長期、エピソード / セマンティック

メモリアーキテクチャ

エージェントのメモリ構造:

  短期メモリ(ワーキングメモリ)
    └── 現在の会話コンテキスト(プロンプト内保持)

  長期メモリ
    ├── セマンティックメモリ → ベクトル DB に保存
    ├── エピソードメモリ → 過去の行動履歴
    └── ユーザープロファイル → 個人化情報

  外部知識(RAG)
    └── ドキュメント → チャンキング → 埋め込み → 検索 → 回答生成

Agentic RAG への発展

従来の RAG は「質問 → 検索 → 回答」の固定パイプラインでした。Agentic RAG では、エージェントが自律的に判断します。

項目従来の RAGAgentic RAG
検索のタイミング毎回固定で検索エージェントが必要性を判断
ソースの選択単一のベクトル DB複数のソースから動的に選択
品質評価なし検索結果の品質をエージェントが評価
再検索なし不十分なら別クエリで再検索

この段階のゴール

「自社のドキュメントに基づいて質問に答え、過去の会話を記憶するエージェント」を構築できること。

Step 6: Planning & Decision-making(月5-6)

学ぶこと

分野具体的な内容
タスク分解複雑なタスクをサブタスクに分割
マルチエージェント複数エージェントの協調・通信
役割設計エージェントへの役割と権限の付与
意思決定不確実な状況での判断戦略

マルチエージェントの設計パターン

パターン1: 階層型
  リーダー → サブエージェント A, B, C

パターン2: ピアツーピア型
  エージェント A ↔ エージェント B ↔ エージェント C

パターン3: 競合型
  エージェント A, B, C が独立に調査 → 結果を比較

2026年の学習標準では、単一モデルの利用から複数の役割(エージェント)を協調させるオーケストレーションへと重心が移っています。

この段階のゴール

「複数のエージェントが異なる役割で協調し、タスクリストを共有しながら目標を達成する」システムを設計できること。

Step 7: RL & Self-improvement(月6-7)

学ぶこと

分野具体的な内容
フィードバックループ結果からの学習と改善
RLHF人間のフィードバックによる強化学習
自律タスク実行長期間のワークフローを独立で遂行
コンテキスト管理セッション間での文脈維持

この段階のゴール

「過去の行動の成功・失敗から学習し、次の行動を改善するエージェント」を構築できること。

Step 8: Deployment(月7-8)

学ぶこと

分野具体的な内容
MLOpsモデルのバージョン管理、CI/CD
監視構造化ロギング、トレーシング
スケーリング負荷分散、コスト管理
セキュリティプロンプトインジェクション対策、サンドボックス

セキュリティの重要項目

roadmap.sh が挙げるセキュリティ項目は以下の通りです。

項目対策
プロンプトインジェクション入力の検証、ガードレール
ツールサンドボックス権限の最小化、実行環境の隔離
データプライバシーPII のマスキング、データの暗号化
バイアス・毒性ガードレールの設定、レッドチームテスト

推奨ツール

ツール用途
LangSmithエージェントのトレーシング・デバッグ
RagasRAG の品質評価
DeepEvalLLM 出力の自動評価

この段階のゴール

「本番環境で安定して動作し、監視・アラートが設定されたエージェントシステム」をデプロイできること。

Step 9: Real-world Automation(月8-9)

学ぶこと

ポートフォリオプロジェクトを通じて実践力を証明します。

プロジェクト例使用技術
ドキュメント Q&A ボットRAG + ベクトル DB + メモリ
コードレビューエージェントツール使用 + 静的解析 API
マルチエージェント調査チームCrewAI/AutoGen + Web 検索
業務自動化エージェントAPI 連携 + ワークフロー設計

この段階のゴール

「実世界の問題を解決するエージェントシステムを設計・構築・運用した実績」を持つこと。

日本語で学ぶためのリソース

日本語環境でも学習リソースは充実しています。

リソース内容
Google Cloud Agentic AI BootcampFirebase ベースのエージェント開発、RAG 実装
roadmap.sh AI Agentsコミュニティ主導の体系的ロードマップ
LangChain 日本語ドキュメントフレームワークの公式ガイド
Qiita / Zenn の AI エージェント記事日本語の実践記事

2026年のAgentic AI で求められるスキルの変化

2026年の学習標準は、2024年までの「プロンプトエンジニアリング中心」から大きく変わっています。

項目2024年まで2026年
中心スキルプロンプト設計オーケストレーション設計
対象単一モデル複数エージェントの協調
ツール連携API 呼び出しMCP + ツールスキーマ
評価人間による確認自動評価フレームワーク
セキュリティガードレールサンドボックス + レッドチーム

「AI を使う」から「AI エージェントを設計する」へ。プロンプトの書き方よりも、エージェントにどんな権限と目的を与えるかを設計する力が求められています。

まとめ

  • Agentic AI = フルスタックインテリジェンス: 数学基礎からデプロイまで、9段階の体系的な学習が必要
  • 9ヶ月のロードマップ: 基礎(月0-2)→ LLM + エージェント(月2-5)→ 高度な設計(月5-7)→ 実践(月7-9)
  • ReAct パターンが基本: 推論と行動を交互に実行するエージェントループが全ての基盤
  • RAG からAgentic RAG へ: 固定パイプラインから、エージェントが検索の必要性・ソース・品質を自律判断する設計へ
  • マルチエージェント設計が2026年の標準: 単一モデルの利用から、複数エージェントのオーケストレーションへ重心が移動
  • セキュリティは後付けではない: プロンプトインジェクション対策、サンドボックス、レッドチームテストが必須スキル
  • roadmap.sh が体系的: コミュニティ280万人のAI Agents ロードマップが全体像を把握するのに最適

参考