Claude Code から Nano Banana 2 を呼ぶ — クロスモデル Skills 活用術
鹿野 壮さん(@tonkotsuboy_com)が、Claude Code から Gemini の画像生成モデル「Nano Banana 2」を直接呼び出せるスキルを紹介しています。
Nano banana 2をClaude Codeから呼び出せるスキルを見つけた、すごくいい Nano bananaのためだけに毎回Geminiアプリを立ち上げる手間が省ける。画像参照とか複雑な命令をしたり、複数枚同時に作れるの便利すぎるブヒィ
投稿にはいいね 232、ブックマーク 301 と反響が大きく、「AI コーディングツールから別の AI モデルを呼ぶ」というクロスモデル連携への関心の高さがうかがえます。
Nano Banana 2 とは何か
Nano Banana 2 は、Google DeepMind が 2026 年 2 月 26 日に発表した画像生成モデルです。正式な技術名称は Gemini 3.1 Flash Image で、「Nano Banana」は Gemini のネイティブ画像生成機能のブランド名として使われています。
Nano Banana ファミリーには 3 つのモデルがあります。
| モデル | 技術名 | 特徴 |
|---|---|---|
| Nano Banana 2 | Gemini 3.1 Flash Image | 高速・高コスパ。Flash ベースで大量生成向き |
| Nano Banana Pro | Gemini 3 Pro Image | 最高品質。プロフェッショナル制作向け |
| Nano Banana | Gemini 2.5 Flash Image | 初代。低遅延タスク向け |
Nano Banana 2 の主な機能は以下の通りです。
- 解像度: 512px から 4K まで対応
- テキスト描画: マーケティング素材やインフォグラフィックに使える正確な文字レンダリング
- Google Search グラウンディング: リアルタイムデータに基づく画像生成(天気、株価チャートなど)
- 参照画像: 最大 14 枚の参照画像を組み合わせた生成・編集
- キャラクター一貫性: 最大 5 キャラクターの同一性を維持
- SynthID 透かし: 全生成画像に AI 生成マークを自動付与
kingbootoshi/nano-banana-2-skill の仕組み
鹿野さんが紹介しているのは、kingbootoshi/nano-banana-2-skill というオープンソースの Claude Code スキルです。
アーキテクチャ
このスキルは「CLI ラッパー + Claude Code プラグイン」という二層構造になっています。
graph TB
subgraph "Claude Code"
A[ユーザーの指示] --> B[Claude が SKILL.md を読む]
B --> C[適切なコマンドを構築]
end
subgraph "nano-banana CLI"
C --> D[nano-banana コマンド実行]
D --> E[Gemini API 呼び出し]
E --> F[画像ファイル出力]
end
subgraph "後処理(オプション)"
F --> G[FFmpeg 緑画面除去]
G --> H[ImageMagick トリミング]
H --> I[透過 PNG 出力]
end
ポイントは、Claude Code 自体は画像を「生成」していないことです。Claude はユーザーの自然言語の指示を解釈して、nano-banana CLI コマンドを組み立て、Bash で実行します。実際の画像生成は Gemini API が行います。
セットアップ手順(ステップバイステップ)
以下の 4 ステップで、Claude Code から Nano Banana 2 を呼べるようになります。
Step 1: 前提ツールのインストール
まず Bun(JavaScript ランタイム)が必要です。未インストールの場合は以下を実行します。
| |
透過画像の生成(-t オプション)を使う場合は、FFmpeg と ImageMagick も必要です。
| |
Step 2: nano-banana CLI のインストール
リポジトリをクローンし、依存関係をインストールして、コマンドをグローバルに登録します。
| |
bun link が失敗する場合は、手動でシンボリックリンクを作成します。
| |
動作確認として、バージョンが表示されれば OK です。
| |
Step 3: Gemini API キーの取得と設定
- Google AI Studio にアクセスします
- Google アカウントでログインします
- 「Create API Key」をクリックしてキーを生成します(無料)
- 生成されたキーをコピーします
キーの設定先は ~/.nano-banana/.env です。
| |
注意: API キーは秘密情報です。
.envファイルを Git にコミットしないでください。
API キーの解決順序は以下の通りです(上が優先)。
| 優先度 | 設定場所 | 用途 |
|---|---|---|
| 1 | --api-key フラグ | 一時的に別キーを使う場合 |
| 2 | GEMINI_API_KEY 環境変数 | CI/CD 環境など |
| 3 | カレントディレクトリの .env | プロジェクト固有の設定 |
| 4 | リポジトリルートの .env | 開発環境共通 |
| 5 | ~/.nano-banana/.env | 個人のデフォルト設定(推奨) |
Step 4: Claude Code スキルとして認識させる
nano-banana-2-skill リポジトリには、plugins/nano-banana/skills/nano-banana/SKILL.md が含まれています。Claude Code にスキルとして認識させるには、以下のいずれかの方法を使います。
方法 A: /init コマンド(推奨)
Claude Code を起動し、以下のように入力します。
/init
スキルが自動的にセットアップされます。
方法 B: 手動でスキルディレクトリにコピー
グローバルスキルとして全プロジェクトで使いたい場合は以下の通りです。
| |
特定プロジェクトだけで使いたい場合は以下の通りです。
| |
方法 C: シンボリックリンク(更新に追従したい場合)
| |
動作確認
Claude Code を起動して、以下のように話しかけます。
「テスト用に猫の画像を 512px で生成して」
Claude が以下のようなコマンドを組み立てて実行すれば成功です。
| |
生成された画像はカレントディレクトリに保存されます。
セットアップ全体の流れ
graph TB
A[Step 1: Bun インストール] --> B[Step 2: nano-banana CLI インストール]
B --> C[Step 3: Gemini API キー取得・設定]
C --> D[Step 4: Claude Code スキル登録]
D --> E[動作確認: 画像生成テスト]
B2[オプション: FFmpeg + ImageMagick] -.-> B
D2[方法A: /init] -.-> D
D3[方法B: 手動コピー] -.-> D
D4[方法C: シンボリックリンク] -.-> D
コマンドリファレンス
スキルが動作するようになったら、Claude Code に自然言語で依頼するだけですが、内部で組み立てられるコマンドの全オプションを把握しておくと便利です。
| オプション | デフォルト | 説明 |
|---|---|---|
-o, --output | nano-gen-{timestamp} | 出力ファイル名(拡張子なし) |
-s, --size | 1K | 解像度: 512, 1K, 2K, 4K |
-a, --aspect | モデルデフォルト | アスペクト比: 1:1, 16:9, 9:16, 4:3 等 |
-m, --model | flash | モデル: flash/nb2(Nano Banana 2)、pro/nb-pro |
-r, --ref | なし | 参照画像(複数指定可) |
-t, --transparent | 無効 | グリーンスクリーン生成 + 背景除去 |
-d, --dir | カレントディレクトリ | 出力先ディレクトリ |
--costs | - | コスト集計を表示 |
使い方
スキルが導入されると、Claude Code に「画像を生成して」と依頼するだけで動作します。
# 基本的な画像生成
「猫が宇宙を飛んでいるイラストを生成して」
# 高解像度指定
「16:9 の 4K で、夕焼けの東京タワーの写真を作って」
# 参照画像を使った編集
「この画像の背景を海に変えて」
# 透過 PNG 生成
「ゲーム用のドラゴンのスプライトを透過で作って」
Claude が内部的に以下のようなコマンドを組み立てて実行します。
| |
料金
Gemini API の従量課金で、解像度によってコストが変わります。
| サイズ | 解像度 | Flash(Nano Banana 2) | Pro |
|---|---|---|---|
| 512px | 約 512x512 | $0.045 | N/A |
| 1K | 約 1024x1024 | $0.067 | $0.134 |
| 2K | 約 2048x2048 | $0.101 | $0.201 |
| 4K | 約 4096x4096 | $0.151 | $0.302 |
Flash モデル(Nano Banana 2)なら 1 枚 $0.05〜$0.15 程度で生成できます。
クロスモデル連携という新しいパターン
このスキルが示しているのは、Claude Code を「オーケストレーター」として、他社の AI モデルを自在に呼び出すというパターンです。
なぜ Claude Code が Hub になるのか
Claude Code が他モデルの呼び出し Hub として機能する理由は、次のような構造的な特徴にあります。
graph LR
subgraph "Claude Code の役割"
A[自然言語理解] --> B[タスク分解]
B --> C[ツール選択]
C --> D[結果統合]
end
subgraph "外部モデル"
C --> E[Gemini - 画像生成]
C --> F[Codex - 深い推論]
C --> G[Whisper - 音声認識]
C --> H[その他の特化モデル]
end
- コンテキスト管理: Claude Code はプロジェクト全体のコンテキストを保持しているため、「このアプリのアイコンを作って」という曖昧な指示を、具体的なプロンプトに変換できます
- 反復改善: 生成された画像を Claude が分析し、問題があれば自動で修正プロンプトを作り直せます
- バッチ処理: 「100 種類のアプリアイコンを作って」のような大量処理を、ループで自動実行できます
実際の活用事例
mkdev.me の記事では、100 枚以上の iOS アプリアイコンを Claude Code + Nano Banana Pro で生成し、コスト $45 で完成させた事例が紹介されています。Claude Code の文脈管理能力により、Gemini の Web UI よりも安定した繰り返し作業が可能とのことです。
類似のスキル・ツール
Nano Banana 系の Claude Code スキルは複数公開されています。
| リポジトリ | 特徴 |
|---|---|
| kingbootoshi/nano-banana-2-skill | Nano Banana 2 対応。透過・参照画像に対応した全部入り |
| kkoppenhaver/cc-nano-banana | 軽量版。シンプルな画像生成に特化 |
| feedtailor/ccskill-nanobanana | Nano Banana Pro 対応 |
| devonjones/skill-nano-banana | Gemini 3 Pro Image 対応 |
| kousen/nano-banana-prompt-skill | プロンプト最適化に特化 |
MCP との違い
外部モデルを呼ぶ方法としては MCP(Model Context Protocol)サーバー経由もあります。
| 項目 | Skills | MCP |
|---|---|---|
| セットアップ | SKILL.md + CLI ツール | MCP サーバー起動 |
| 呼び出し方式 | Bash コマンド経由 | プロトコル経由 |
| 柔軟性 | 自然言語でパラメータ調整可能 | 事前定義されたツール呼び出し |
| 適用範囲 | 画像生成、データ処理など幅広い | 外部サービス連携全般 |
| 導入の手軽さ | git clone + 数行の設定 | サーバー設定 + 接続設定 |
Skills は「Claude に新しい CLI ツールの使い方を教える」というアプローチで、MCP は「標準プロトコルで外部サービスと接続する」アプローチです。どちらが優れているということではなく、用途によって使い分けます。
Claude Code Skills の基本構造
このスキルを理解するために、Claude Code Skills の仕組みを確認しておきます。
SKILL.md の構造
すべてのスキルは SKILL.md ファイルを持つディレクトリです。
my-skill/
├── SKILL.md # スキルの定義(必須)
├── references/ # 補足ドキュメント(任意)
│ └── guide.md
└── scripts/ # 実行スクリプト(任意)
└── generate.py
SKILL.md の基本形式は次の通りです。
| |
スキルの配置場所
| 場所 | 適用範囲 |
|---|---|
~/.claude/skills/{name}/ | グローバル(全プロジェクト) |
.claude/skills/{name}/ | プロジェクトローカル |
自動トリガーと手動呼び出し
- 自動トリガー:
descriptionにマッチするフレーズ(「generate an image」など)で自動起動 - 手動呼び出し:
/skill-nameでスラッシュコマンドとして実行
「モデル間コンシェルジュ」としての Claude Code
この Nano Banana スキルの事例は、Claude Code の使い方に新しい視点を提供しています。
従来は「Claude Code = コーディング支援ツール」という認識が主流でしたが、Skills や MCP を活用すると、他の AI モデルの能力を統合する「コンシェルジュ」 として機能します。
graph TB
subgraph "従来の使い方"
A1[ユーザー] --> B1[Claude Code]
B1 --> C1[コード生成・編集]
end
subgraph "クロスモデル活用"
A2[ユーザー] --> B2[Claude Code]
B2 --> C2[コード生成・編集]
B2 --> D2[画像生成 via Gemini]
B2 --> E2[音声処理 via Whisper]
B2 --> F2[深い推論 via Codex]
B2 --> G2[検索 via Perplexity]
end
この「コンシェルジュ」モデルには、いくつかの利点があります。
- ワークフローの統合: ターミナルを離れずに、コーディング中に画像素材を生成できます
- コンテキストの共有: プロジェクトの文脈を理解した上で、適切なモデルに適切な指示を出せます
- 反復の自動化: 「生成 → 確認 → 修正」のサイクルを Claude Code が自律的に回せます
ただし注意点もあります。
- API キー管理: 複数の AI サービスのキーを管理する必要があります。
.envファイルの取り扱いには十分注意してください - コスト意識: 各 API の料金体系を理解しておかないと、思わぬ出費になります
- 出力品質の確認: Claude Code が「良い」と判断しても、人間の目で最終確認は必要です
まとめ
- Nano Banana 2 は Google DeepMind が 2026 年 2 月に発表した画像生成モデルで、Gemini 3.1 Flash Image がベース
- kingbootoshi/nano-banana-2-skill により、Claude Code から自然言語で Nano Banana 2 を呼び出せる
- スキルの仕組みは、Claude が SKILL.md の指示に従い、CLI コマンドを組み立てて Bash 実行するというシンプルな構造
- クロスモデル連携により、Claude Code が「コーディングツール」から「AI モデルのオーケストレーター」に進化している
- Skills と MCP は外部連携の二大手段で、用途に応じた使い分けが重要
- 実践面では、API キー管理、コスト管理、出力品質の確認が運用のポイント
- Nano Banana 系スキルは複数公開されており、ニーズに合ったものを選べるエコシステムが成長中
参考
- 鹿野 壮さんのツイート
- kingbootoshi/nano-banana-2-skill (GitHub)
- Nano Banana image generation - Gemini API
- Nano Banana 2: Google’s latest AI image generation model (Google Blog)
- Build with Nano Banana 2 (Google Developers Blog)
- Unlimited Image Generation: Nano Banana Pro & Claude Skill (mkdev.me)
- Extend Claude with skills - Claude Code Docs
- awesome-claude-skills (GitHub)
- Claude Code / Codex / Gemini CLI — Skills 機能比較まとめ (Zenn)