Anthropic

Prompt Engineering から Harness Engineering へ: AI エンジニアリングの進化と「仕組みの設計力」の時代

AI エンジニアリングの中心概念が急速に変化している。2022年の「Prompt Engineering」から2025年の「Context Engineering」を経て、2026年は「Harness Engineering」の年になった。Anthropic、OpenAI、そして Martin Fowler まで、業界のキープレイヤーが揃ってこの概念を公式に取り上げている。 3つの時代: プロンプトからハーネスへ Prompt Engineering（2022〜） ChatGPT の登場とともに広まった最初のパラダイム。LLM に対してどんな言葉で指示するかが品質を左右する、という考え方だ。Few-shot、Chain-of-Thought、Role Prompting といったテクニックが次々と開発された。焦点は「1回のリクエストにおける入力テキストの最適化」にあった。 Context Engineering（2025〜） 2025年中盤、Shopify CEO の Tobi Lutke が X への投稿をきっかけに「Context Engineering」という用語が急速に広まった。LangChain や Anthropic も相次いで解説記事を公開し、業界標準の概念として定着した。 Prompt Engineering が「何を言うか」に注目していたのに対し、Context Engineering は**「LLM に何を見せるか」を動的に制御するシステム**を設計する。RAG（Retrieval-Augmented Generation）、ツール呼び出し、メモリ管理など、LLM の入力コンテキスト全体をエンジニアリングの対象とする発想だ。 Harness Engineering（2026〜） 2026年に入り、AI エージェントの実用化が本格化するなかで、Context Engineering をさらに拡張した「Harness Engineering」が登場した。 Context Engineering が「LLM に何を見せるか」を扱うのに対し、Harness Engineering はエージェントの実行環境全体 —— 役割分担、フィードバックループ、品質検証、セッション管理まで含めた制御構造を設計する。「ハーネス（harness）」は馬具の意味で、強力な馬（= AI モデル）を制御し、安定した成果を引き出すための仕組み全体を指す。業界キープレイヤーの動き OpenAI: Codex チームの実践（2026年2月） OpenAI は2026年2月、公式ブログで「Harness engineering: leveraging Codex in an agent-first world」を公開した。 ...

Claude Code の Auto Mode から見える AGI への道筋

AGI（Artificial General Intelligence、汎用人工知能）とは、特定のタスクに限定されず、人間のように幅広い知的作業をこなせる AI を指す概念だ。現在の AI は特定領域で高い能力を発揮するが、未知の領域への汎用的な対応力では人間に及ばないとされている。 Claude Code に auto mode が導入された。パーミッションの承認を Claude 自身が判断するこの機能について、「次に来るのは Claude 実行自体の auto mode、つまり AGI だ」という指摘が注目を集めている。開発ツールの自律性の進化と、その先にある可能性を考える。 Auto Mode の本質 2026年3月、Anthropic は Claude Code に auto mode を導入した。公式 X アカウントの発表によると: New in Claude Code: auto mode. Instead of approving every file write and bash command, or skipping permissions entirely, auto mode lets Claude make permission decisions on your behalf. Safeguards check each action before it runs. ...

Dexter: 約200行で動く自律型金融リサーチエージェント

オープンソースの自律エージェント Dexter が注目を集めている。X では「Claude Code の金融版」と紹介され話題になった。約200行のコードで、銘柄スクリーニングから財務分析、投資根拠のレポート作成までを自動で行うツールだ。 Dexter とは Dexter は、virattt 氏が開発したオープンソースの自律型金融リサーチエージェント。2026年3月時点で GitHub スター数は 18,000 を超える。複雑な金融の質問を受けて、自分でリサーチ計画を立て、データを収集し、結果を検証してレポートにまとめる。主な機能: 割安な銘柄の自動スクリーニング財務データの詳細分析投資根拠のレポート化作業内容の自己検証（セルフバリデーション）アーキテクチャ: 4つのエージェント構成 Dexter は ReAct（Reasoning + Acting）パターンに基づくマルチエージェントアーキテクチャで構成されている。ReAct とは、LLM が「考える（Reasoning）」と「行動する（Acting）」を交互に繰り返すことで、複雑なタスクを段階的に解決するパターンだ。エージェント役割 Planning 金融クエリを分析し、リサーチ計画をステップに分解 Action 計画に基づいてツールを呼び出し、リアルタイムデータを取得 Validation 各ステップの完了を検証し、データの十分性をチェック Answer 収集した情報を統合してレポートを生成この Validation エージェントが Dexter の特徴的な部分だ。金融分野では精度が重要なため、自分自身の出力を検証するレイヤーを設けている。ループ検出やステップ数制限などの安全機構も備えている。技術スタックランタイム: Bun（高速な JavaScript ランタイム）言語: TypeScript UI: React + Ink（React コンポーネントでターミナル UI を構築するライブラリ） LLM オーケストレーション: LangChain.js LLM プロバイダ: OpenAI、Anthropic、Google、ローカル Ollama に対応データソース: Financial Datasets API（リアルタイム市場データ）始め方リポジトリをクローンして依存関係をインストールする。 ...

Claude Code: dangerously-skip-permissions をやめて auto mode に移行する

Claude Code で長時間タスクを実行する際、許可プロンプトを回避するために --dangerously-skip-permissions を使っていた開発者は少なくないだろう。しかし、auto mode の登場により、安全性を保ちながら同様の利便性を得られるようになった。この記事では、両者の違いと auto mode への移行方法を解説する。 dangerously-skip-permissions の問題 claude --dangerously-skip-permissions は、すべての権限チェックを無効化するフラグだ。ファイルの書き込み、シェルコマンドの実行、外部通信など、あらゆる操作が無条件で許可される。このフラグには以下のリスクがある: プロンプトインジェクション: 悪意あるファイルを読み込んだ場合、任意のコマンドが無条件で実行される意図しない破壊操作: rm -rf のような危険なコマンドもチェックなしで実行される認証情報の漏洩: .env ファイルの内容を外部に送信するような操作も通過する Anthropic の開発者も不使用: 社内でも使用が推奨されていない鹿野壮氏（@tonkotsuboy_com、Ubie）は当時の状況をこう振り返っている: 「男は黙って claude –dangerously-skip-permissions」。そうやって生きてきたけど、Anthropicの開発者が使ってなかったり、プロジェクトでは禁止されたりで、肩身の狭い日々でした auto mode とは auto mode は、dangerously-skip-permissions に代わる安全な選択肢だ。ツールの実行を自動承認しつつ、バックグラウンドで安全性チェックを行う。両者の比較 dangerously-skip-permissions auto mode 権限チェック完全無効バックグラウンドで実行安全性なしセーフガード付きプロンプトインジェクション耐性なしあり危険なコマンドの実行無条件で実行検出してブロック公式ステータス推奨されていないリサーチプレビュー（2026年3月時点） auto mode の設定方法起動時に指定する 1 claude --permission-mode auto settings.json でデフォルトにする settings.json の permissions に "defaultMode": "auto" を指定すれば、毎回のフラグ指定が不要になる: ...

Claude Codeで「専門家チーム」を構築する：カスタムエージェントとCoworkの活用法

前回の記事では、NotebookLM を使って「20人の専門家チーム」を構築する方法を紹介しました。この記事では、同じ考え方を Claude Code や Cowork で実現する方法を解説します。 NotebookLM と Claude Code の発想の違い NotebookLM は「入れた資料だけを根拠に回答する」ことが強みです。テーマごとにノートブックを分けることで、各ノートブックが「専門家」として機能します。 Claude Code でも同じアプローチが取れます。さらに、コード実行・ファイル編集・外部ツール連携ができるため、「相談する」だけでなく「調査して、コードを書いて、PR を作成する」ところまで一気通貫で任せられます。観点 NotebookLM Claude Code 専門家の定義ノートブック + ソース .claude/agents/ + ナレッジ知識の投入 PDF / Web / Fast Research MCP / ローカルファイル / WebSearch 同時相談手動で切替 Cowork / Agent Teams で並行実行引用元表示自動リンクファイルパス・行番号強み非技術者でも簡単コード実行・ファイル編集が可能方法1: カスタムエージェント（.claude/agents/）最もシンプルで NotebookLM の「専門家ノート」に直接対応する方法です。カスタムエージェントの仕組み .claude/agents/ ディレクトリに Markdown ファイルを置くだけで、専門エージェントが定義できます。各ファイルにはそのドメインの専門知識・指示・参照先を書きます。 1 2 3 4 5 .claude/agents/ ├── marketing-expert.md # マーケティング専門家 ├── legal-advisor.md # 法務アドバイザー ├── seo-advisor.md # SEO アドバイザー └── fact-checker.md # ファクトチェッカーエージェント定義ファイルの書き方 Markdown ファイルの先頭に YAML フロントマターでメタ情報を定義し、本文にシステムプロンプトを書きます。詳細は公式ドキュメントを参照してください。 ...

Claude Code Agent Teams: セッション間でメッセージをやり取りできるマルチエージェント機能

Claude Code に「Agent Teams」機能が追加されました。複数のセッションがメッセージをやり取りしながら協調作業できる機能です。従来のサブエージェントは親セッションに結果を返すだけでしたが、Agent Teams ではエージェント同士が直接コミュニケーションを取りながらタスクを進められます。 Agent Teams とは Agent Teams は Claude Code v2.1.32 以降で利用できる実験的機能です。1つのセッションがチームリーダーとなり、複数のチームメイト（それぞれ独立した Claude Code インスタンス）を起動して並列に作業を進めます。各チームメイトは独自のコンテキストウィンドウを持ち、共有タスクリストを通じて自律的に連携します。サブエージェントとの違い比較項目サブエージェント Agent Teams コンテキスト独自のコンテキスト、結果を呼び出し元に返却独自のコンテキスト、完全に独立コミュニケーション親エージェントへの一方向のみチームメイト同士で直接メッセージ送受信調整方法親エージェントが全体を管理共有タスクリストで自己調整適した用途結果だけが必要な集中タスク議論・協調が必要な複雑な作業トークンコスト低い（結果が親コンテキストに要約される）高い（各チームメイトが個別の Claude インスタンス） SendMessage によるエージェント間通信 Agent Teams の中核となるのが SendMessage ツールです。2つの通信方式が用意されています。 directed message: 特定のチームメイトにメッセージを送信 broadcast: 全チームメイトにメッセージを一斉送信メッセージは各チームメイトの受信ボックスに JSON として追記されます。受信ボックスのパスは ~/.claude/teams/<project>/inboxes/<name>.json です。メッセージは次のターンで読み取られ、会話履歴に新しいユーザーターンとして注入されます。有効化と使い方 Agent Teams はデフォルトで無効です。~/.claude/settings.json で環境変数を設定して有効化します。 1 2 3 4 5 { "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" } } 有効化後は、自然言語でチーム構成を指示するだけで起動できます。 ...

Claude Codeを使うなら最低限やっておきたい「7つのセキュリティ設定」

Claude Code が勝手に git push --force しかけた——そんな冷や汗体験から真剣にセキュリティ設定を見直したという実践的なまとめです。Anthropic の公式ドキュメントにも「セキュリティは自分で設定しろ」と明記されており、AIエージェントに人間と同じ権限を与えるリスクを理解した上で対策を講じる必要があります。 1. サンドボックスを有効にする（そして脱出口を塞ぐ）サンドボックスは Claude Code が実行する Bash コマンドを OS レベルで隔離する機能です。macOS では Seatbelt（macOS 標準のサンドボックス機構）、Linux では Bubble Wrap（軽量コンテナ隔離ツール）が使われます。現在の状態は /sandbox コマンドで確認できます。設定ファイルで明示的に有効化するには: 1 2 3 4 5 6 { "sandbox": { "enabled": true, "allowUnsandboxedCommands": false } } ポイントは allowUnsandboxedCommands: false です。デフォルトでは allowUnsandboxedCommands: true になっており、サンドボックス制限でコマンドが失敗した場合、Claude がユーザーの許可を得た上で dangerouslyDisableSandbox パラメータ付きでリトライできる仕組みになっています。allowUnsandboxedCommands: false を設定して初めて、この脱出口が完全に塞がります。 ...

Claude Cowork 完全ガイド — 機能解説・料金・活用事例20選まとめ

Anthropic が 2026年1月にリリースした「Claude Cowork」は、従来の AI チャットとは根本的に異なる「AI に仕事を丸投げできる仕組み」です。本記事では、Cowork の全機能・料金プラン・セットアップ手順・活用事例20選・セキュリティ対策までを網羅的にまとめます。 Claude Cowork とは — 「AI チャット」ではなく「AI の同僚」通常の AI チャット（ブラウザ版 Claude）は「アドバイスをくれる相談相手」です。構成案は提案してくれますが、実際にファイルを作るのは自分です。一方 Cowork は、フォルダの中身を読み書きし、計画を立て、成果物を納品してくれる「隣の席の同僚」です。 5つのコア能力ファイル直接操作 — PC 上のファイルを直接読み書き。手動アップロード不要タスクの自動分解 — 複雑な作業をサブタスクに分解して並行実行プロフェッショナル品質の出力 — 数式入り Excel、見栄えの良い PowerPoint を生成長時間処理 — 通常チャットのタイムアウト制限なしマルチタスク — 複数タスクをキューに入れて同時処理料金プラン（2026年3月時点）プラン月額特徴 Pro $20（約3,000円）個人利用の標準プラン。週数回の利用なら十分 Max 5x $100（約15,000円） Pro の5倍の利用枠。毎日使うユーザー向け Max 20x $200（約30,000円） Pro の20倍。1日中フル稼働させたいヘビーユーザー向け Team $25〜/人 5名以上のチーム向け。管理機能付き Enterprise 個別見積もり SSO、監査ログ等の企業向け機能注意: 2026年4月1日から日本の消費税10%が加算されます（Pro なら約3,300円/月）。利用枠は「5時間のローリングウィンドウ」でリセット。Cowork は通常チャットよりはるかに多く消費するため、簡単な質問はチャットで、ファイル操作や自動化が必要なタスクだけ Cowork で、という使い分けが重要です。 ...

Anthropic Dispatch：スマホからPCのClaudeに仕事を投げる新機能

Anthropic が 2026年3月17日、Claude Cowork の新機能「Dispatch」のリサーチプレビューを開始した。スマホから指示を出すだけで、PC 上の Claude がタスクを自律的に実行してくれるという機能だ。 Dispatch とは Dispatch は、モバイル端末から PC 上で動作する Claude に対してタスクを割り当てられる機能。Claude Cowork のデスクトップアプリと iOS/Android のモバイルアプリを連携させ、外出中にスマホから指示を送り、帰宅したら作業が完了している、という使い方ができる。主な特徴モバイル・デスクトップ連携スマホの Claude アプリからデスクトップ PC 上の Claude Cowork にタスクを送信する。PC 側では Computer Use（Claude がデスクトップの画面を認識して操作する機能）と組み合わせて、アプリの起動、ブラウザ操作、スプレッドシートへのデータ入力などを自律的に実行する。永続的な会話スレッドモバイルとデスクトップの間で単一の会話スレッドが維持される。従来の Claude との会話ではセッションごとにコンテキストがリセットされていたが、Dispatch では前回のやり取りを記憶した状態でタスクを継続できる。ローカル処理によるデータガバナンスタスク実行時のデータ処理はユーザーの PC 上で行われる。これにより、データガバナンスとコンプライアンスの面で優位性がある。サンドボックス環境ファイル操作などの重要なアクションは、実行前にユーザーの事前承認が必要。安全性を確保しつつ自律的な動作を実現している。利用可能なプラン 2026年3月時点での対応状況: プラン対応状況 Max 20x / Max 5x 利用可能 Pro 数日以内に対応予定 Free 2026年後半に対応予定対応 OS は macOS のみ（リサーチプレビュー時点）。 OpenClaw との比較 Dispatch は、中国発のデスクトップ操作自動化オープンソースフレームワーク OpenClaw への Anthropic の回答とも位置づけられている。OpenClaw が深圳で大きな話題を呼んだのに対し、Dispatch はエンタープライズ向けの管理性・安全性を重視した設計になっている。 ...

Anthropic が Claude 専用の認定資格試験を公開 — AI アーキテクト認定でスキルを証明する時代へ

Anthropic が Claude 専用の認定資格試験を公開した。AWS の SAA（Solutions Architect Associate）や GCP の Professional Cloud Architect に相当する位置づけで、「AI アーキテクト」としてのスキルを公式に証明できる資格だ。試験の概要この認定試験は、単なるチャットの使い方を問うものではなく、本番環境で Claude を使ったシステムを設計・構築できるかを評価する本格的な内容となっている。試験で問われる主なトピックは次のとおり: エージェントアーキテクチャ設計 — マルチエージェント構成や状態管理の設計力 Claude Code 設定 & ワークフロー — 開発環境への組み込みと自動化フロープロンプトエンジニアリング — 精度・信頼性を高めるプロンプト設計ツール設計 & MCP 統合 — Model Context Protocol を活用した外部ツール連携コンテキスト管理 & 信頼性 — 長いコンテキストの扱い方や出力の安定性確保試験形式は 60 問・120 分のオンライン監視試験。無料の準備コース Anthropic Academy では 13 本以上の準備コースが公開されており、すべて無料で受講できる。認定取得のための学習コストは基本的にかからない。なぜ今、この資格が重要なのか「Claude が使えます」は今誰でも言える。「Certified Architect です」は証明になる。生成 AI ツールの普及が進む中、「AI が使える」というスキルの差別化が難しくなってきている。Anthropic の認定資格は、その差別化を公式に示す手段となる。採用・案件獲得の場面で、早い段階で認定を持っているかどうかが差になる時代が来ると予想されている。まとめ項目内容認定名 Claude AI Certification（AI アーキテクト）形式 60 問・120 分・オンライン監視試験準備コース Anthropic Academy（13 本以上、無料）試験範囲エージェント設計、Claude Code、プロンプト、MCP、コンテキスト管理 Claude を業務や開発で活用しているエンジニアにとって、スキルを公式に証明できる貴重な機会だ。Anthropic Academy のコースを活用して早めに準備を進めておきたい。 ...