Claude Code から Nano Banana 2 を呼ぶ — クロスモデル Skills 活用術

鹿野 壮さん(@tonkotsuboy_com)が、Claude Code から Gemini の画像生成モデル「Nano Banana 2」を直接呼び出せるスキルを紹介しています。

Nano banana 2をClaude Codeから呼び出せるスキルを見つけた、すごくいい Nano bananaのためだけに毎回Geminiアプリを立ち上げる手間が省ける。画像参照とか複雑な命令をしたり、複数枚同時に作れるの便利すぎるブヒィ

鹿野 壮 (@tonkotsuboy_com)

投稿にはいいね 232、ブックマーク 301 と反響が大きく、「AI コーディングツールから別の AI モデルを呼ぶ」というクロスモデル連携への関心の高さがうかがえます。

Nano Banana 2 とは何か

Nano Banana 2 は、Google DeepMind が 2026 年 2 月 26 日に発表した画像生成モデルです。正式な技術名称は Gemini 3.1 Flash Image で、「Nano Banana」は Gemini のネイティブ画像生成機能のブランド名として使われています。

Nano Banana ファミリーには 3 つのモデルがあります。

モデル技術名特徴
Nano Banana 2Gemini 3.1 Flash Image高速・高コスパ。Flash ベースで大量生成向き
Nano Banana ProGemini 3 Pro Image最高品質。プロフェッショナル制作向け
Nano BananaGemini 2.5 Flash Image初代。低遅延タスク向け

Nano Banana 2 の主な機能は以下の通りです。

  • 解像度: 512px から 4K まで対応
  • テキスト描画: マーケティング素材やインフォグラフィックに使える正確な文字レンダリング
  • Google Search グラウンディング: リアルタイムデータに基づく画像生成(天気、株価チャートなど)
  • 参照画像: 最大 14 枚の参照画像を組み合わせた生成・編集
  • キャラクター一貫性: 最大 5 キャラクターの同一性を維持
  • SynthID 透かし: 全生成画像に AI 生成マークを自動付与

kingbootoshi/nano-banana-2-skill の仕組み

鹿野さんが紹介しているのは、kingbootoshi/nano-banana-2-skill というオープンソースの Claude Code スキルです。

アーキテクチャ

このスキルは「CLI ラッパー + Claude Code プラグイン」という二層構造になっています。

graph TB
    subgraph "Claude Code"
        A[ユーザーの指示] --> B[Claude が SKILL.md を読む]
        B --> C[適切なコマンドを構築]
    end

    subgraph "nano-banana CLI"
        C --> D[nano-banana コマンド実行]
        D --> E[Gemini API 呼び出し]
        E --> F[画像ファイル出力]
    end

    subgraph "後処理(オプション)"
        F --> G[FFmpeg 緑画面除去]
        G --> H[ImageMagick トリミング]
        H --> I[透過 PNG 出力]
    end

ポイントは、Claude Code 自体は画像を「生成」していないことです。Claude はユーザーの自然言語の指示を解釈して、nano-banana CLI コマンドを組み立て、Bash で実行します。実際の画像生成は Gemini API が行います。

セットアップ手順(ステップバイステップ)

以下の 4 ステップで、Claude Code から Nano Banana 2 を呼べるようになります。

Step 1: 前提ツールのインストール

まず Bun(JavaScript ランタイム)が必要です。未インストールの場合は以下を実行します。

1
2
3
4
5
# Bun のインストール
curl -fsSL https://bun.sh/install | bash

# 確認
bun --version

透過画像の生成(-t オプション)を使う場合は、FFmpeg と ImageMagick も必要です。

1
2
3
4
5
# macOS の場合
brew install ffmpeg imagemagick

# Ubuntu/Debian の場合
sudo apt install ffmpeg imagemagick

Step 2: nano-banana CLI のインストール

リポジトリをクローンし、依存関係をインストールして、コマンドをグローバルに登録します。

1
2
3
4
5
6
7
8
9
# リポジトリをクローン
git clone https://github.com/kingbootoshi/nano-banana-2-skill.git ~/tools/nano-banana-2

# 依存関係をインストール
cd ~/tools/nano-banana-2
bun install

# グローバルコマンドとして登録(sudo 不要)
bun link

bun link が失敗する場合は、手動でシンボリックリンクを作成します。

1
2
3
4
mkdir -p ~/.local/bin
ln -sf ~/tools/nano-banana-2/src/cli.ts ~/.local/bin/nano-banana
echo 'export PATH="$HOME/.local/bin:$PATH"' >> ~/.zshrc
source ~/.zshrc

動作確認として、バージョンが表示されれば OK です。

1
nano-banana --help

Step 3: Gemini API キーの取得と設定

  1. Google AI Studio にアクセスします
  2. Google アカウントでログインします
  3. 「Create API Key」をクリックしてキーを生成します(無料)
  4. 生成されたキーをコピーします

キーの設定先は ~/.nano-banana/.env です。

1
2
mkdir -p ~/.nano-banana
echo "GEMINI_API_KEY=AIzaSy..." > ~/.nano-banana/.env

注意: API キーは秘密情報です。.env ファイルを Git にコミットしないでください。

API キーの解決順序は以下の通りです(上が優先)。

優先度設定場所用途
1--api-key フラグ一時的に別キーを使う場合
2GEMINI_API_KEY 環境変数CI/CD 環境など
3カレントディレクトリの .envプロジェクト固有の設定
4リポジトリルートの .env開発環境共通
5~/.nano-banana/.env個人のデフォルト設定(推奨)

Step 4: Claude Code スキルとして認識させる

nano-banana-2-skill リポジトリには、plugins/nano-banana/skills/nano-banana/SKILL.md が含まれています。Claude Code にスキルとして認識させるには、以下のいずれかの方法を使います。

方法 A: /init コマンド(推奨)

Claude Code を起動し、以下のように入力します。

/init

スキルが自動的にセットアップされます。

方法 B: 手動でスキルディレクトリにコピー

グローバルスキルとして全プロジェクトで使いたい場合は以下の通りです。

1
2
3
4
# グローバルスキルとして配置
mkdir -p ~/.claude/skills/nano-banana
cp ~/tools/nano-banana-2/plugins/nano-banana/skills/nano-banana/SKILL.md \
   ~/.claude/skills/nano-banana/SKILL.md

特定プロジェクトだけで使いたい場合は以下の通りです。

1
2
3
4
# プロジェクトローカルに配置
mkdir -p .claude/skills/nano-banana
cp ~/tools/nano-banana-2/plugins/nano-banana/skills/nano-banana/SKILL.md \
   .claude/skills/nano-banana/SKILL.md

方法 C: シンボリックリンク(更新に追従したい場合)

1
2
3
mkdir -p ~/.claude/skills
ln -sf ~/tools/nano-banana-2/plugins/nano-banana/skills/nano-banana \
   ~/.claude/skills/nano-banana

動作確認

Claude Code を起動して、以下のように話しかけます。

「テスト用に猫の画像を 512px で生成して」

Claude が以下のようなコマンドを組み立てて実行すれば成功です。

1
nano-banana "a cute cat, simple illustration" -s 512 -o test-cat

生成された画像はカレントディレクトリに保存されます。

セットアップ全体の流れ

graph TB
    A[Step 1: Bun インストール] --> B[Step 2: nano-banana CLI インストール]
    B --> C[Step 3: Gemini API キー取得・設定]
    C --> D[Step 4: Claude Code スキル登録]
    D --> E[動作確認: 画像生成テスト]

    B2[オプション: FFmpeg + ImageMagick] -.-> B
    D2[方法A: /init] -.-> D
    D3[方法B: 手動コピー] -.-> D
    D4[方法C: シンボリックリンク] -.-> D

コマンドリファレンス

スキルが動作するようになったら、Claude Code に自然言語で依頼するだけですが、内部で組み立てられるコマンドの全オプションを把握しておくと便利です。

オプションデフォルト説明
-o, --outputnano-gen-{timestamp}出力ファイル名(拡張子なし)
-s, --size1K解像度: 512, 1K, 2K, 4K
-a, --aspectモデルデフォルトアスペクト比: 1:1, 16:9, 9:16, 4:3
-m, --modelflashモデル: flash/nb2(Nano Banana 2)、pro/nb-pro
-r, --refなし参照画像(複数指定可)
-t, --transparent無効グリーンスクリーン生成 + 背景除去
-d, --dirカレントディレクトリ出力先ディレクトリ
--costs-コスト集計を表示

使い方

スキルが導入されると、Claude Code に「画像を生成して」と依頼するだけで動作します。

# 基本的な画像生成
「猫が宇宙を飛んでいるイラストを生成して」

# 高解像度指定
「16:9 の 4K で、夕焼けの東京タワーの写真を作って」

# 参照画像を使った編集
「この画像の背景を海に変えて」

# 透過 PNG 生成
「ゲーム用のドラゴンのスプライトを透過で作って」

Claude が内部的に以下のようなコマンドを組み立てて実行します。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
# 基本
nano-banana "a cat flying through space, illustration style"

# 高解像度 + アスペクト比
nano-banana "Tokyo Tower at sunset, photorealistic" -s 4K -a 16:9

# 透過背景
nano-banana "dragon sprite for game" -t -o dragon_sprite

# 参照画像を使った編集
nano-banana "change background to ocean" -r original.png

料金

Gemini API の従量課金で、解像度によってコストが変わります。

サイズ解像度Flash(Nano Banana 2)Pro
512px約 512x512$0.045N/A
1K約 1024x1024$0.067$0.134
2K約 2048x2048$0.101$0.201
4K約 4096x4096$0.151$0.302

Flash モデル(Nano Banana 2)なら 1 枚 $0.05〜$0.15 程度で生成できます。

クロスモデル連携という新しいパターン

このスキルが示しているのは、Claude Code を「オーケストレーター」として、他社の AI モデルを自在に呼び出すというパターンです。

なぜ Claude Code が Hub になるのか

Claude Code が他モデルの呼び出し Hub として機能する理由は、次のような構造的な特徴にあります。

graph LR
    subgraph "Claude Code の役割"
        A[自然言語理解] --> B[タスク分解]
        B --> C[ツール選択]
        C --> D[結果統合]
    end

    subgraph "外部モデル"
        C --> E[Gemini - 画像生成]
        C --> F[Codex - 深い推論]
        C --> G[Whisper - 音声認識]
        C --> H[その他の特化モデル]
    end
  • コンテキスト管理: Claude Code はプロジェクト全体のコンテキストを保持しているため、「このアプリのアイコンを作って」という曖昧な指示を、具体的なプロンプトに変換できます
  • 反復改善: 生成された画像を Claude が分析し、問題があれば自動で修正プロンプトを作り直せます
  • バッチ処理: 「100 種類のアプリアイコンを作って」のような大量処理を、ループで自動実行できます

実際の活用事例

mkdev.me の記事では、100 枚以上の iOS アプリアイコンを Claude Code + Nano Banana Pro で生成し、コスト $45 で完成させた事例が紹介されています。Claude Code の文脈管理能力により、Gemini の Web UI よりも安定した繰り返し作業が可能とのことです。

類似のスキル・ツール

Nano Banana 系の Claude Code スキルは複数公開されています。

リポジトリ特徴
kingbootoshi/nano-banana-2-skillNano Banana 2 対応。透過・参照画像に対応した全部入り
kkoppenhaver/cc-nano-banana軽量版。シンプルな画像生成に特化
feedtailor/ccskill-nanobananaNano Banana Pro 対応
devonjones/skill-nano-bananaGemini 3 Pro Image 対応
kousen/nano-banana-prompt-skillプロンプト最適化に特化

MCP との違い

外部モデルを呼ぶ方法としては MCP(Model Context Protocol)サーバー経由もあります。

項目SkillsMCP
セットアップSKILL.md + CLI ツールMCP サーバー起動
呼び出し方式Bash コマンド経由プロトコル経由
柔軟性自然言語でパラメータ調整可能事前定義されたツール呼び出し
適用範囲画像生成、データ処理など幅広い外部サービス連携全般
導入の手軽さgit clone + 数行の設定サーバー設定 + 接続設定

Skills は「Claude に新しい CLI ツールの使い方を教える」というアプローチで、MCP は「標準プロトコルで外部サービスと接続する」アプローチです。どちらが優れているということではなく、用途によって使い分けます。

Claude Code Skills の基本構造

このスキルを理解するために、Claude Code Skills の仕組みを確認しておきます。

SKILL.md の構造

すべてのスキルは SKILL.md ファイルを持つディレクトリです。

my-skill/
├── SKILL.md          # スキルの定義(必須)
├── references/       # 補足ドキュメント(任意)
│   └── guide.md
└── scripts/          # 実行スクリプト(任意)
    └── generate.py

SKILL.md の基本形式は次の通りです。

1
2
3
4
5
6
7
---
name: my-skill
description: スキルの説明。Claude が自動トリガーの判断に使う。
argument-hint: <引数の説明>
---

スキルが呼び出されたときに Claude が従う指示をここに書く。

スキルの配置場所

場所適用範囲
~/.claude/skills/{name}/グローバル(全プロジェクト)
.claude/skills/{name}/プロジェクトローカル

自動トリガーと手動呼び出し

  • 自動トリガー: description にマッチするフレーズ(「generate an image」など)で自動起動
  • 手動呼び出し: /skill-name でスラッシュコマンドとして実行

「モデル間コンシェルジュ」としての Claude Code

この Nano Banana スキルの事例は、Claude Code の使い方に新しい視点を提供しています。

従来は「Claude Code = コーディング支援ツール」という認識が主流でしたが、Skills や MCP を活用すると、他の AI モデルの能力を統合する「コンシェルジュ」 として機能します。

graph TB
    subgraph "従来の使い方"
        A1[ユーザー] --> B1[Claude Code]
        B1 --> C1[コード生成・編集]
    end

    subgraph "クロスモデル活用"
        A2[ユーザー] --> B2[Claude Code]
        B2 --> C2[コード生成・編集]
        B2 --> D2[画像生成 via Gemini]
        B2 --> E2[音声処理 via Whisper]
        B2 --> F2[深い推論 via Codex]
        B2 --> G2[検索 via Perplexity]
    end

この「コンシェルジュ」モデルには、いくつかの利点があります。

  • ワークフローの統合: ターミナルを離れずに、コーディング中に画像素材を生成できます
  • コンテキストの共有: プロジェクトの文脈を理解した上で、適切なモデルに適切な指示を出せます
  • 反復の自動化: 「生成 → 確認 → 修正」のサイクルを Claude Code が自律的に回せます

ただし注意点もあります。

  • API キー管理: 複数の AI サービスのキーを管理する必要があります。.env ファイルの取り扱いには十分注意してください
  • コスト意識: 各 API の料金体系を理解しておかないと、思わぬ出費になります
  • 出力品質の確認: Claude Code が「良い」と判断しても、人間の目で最終確認は必要です

まとめ

  • Nano Banana 2 は Google DeepMind が 2026 年 2 月に発表した画像生成モデルで、Gemini 3.1 Flash Image がベース
  • kingbootoshi/nano-banana-2-skill により、Claude Code から自然言語で Nano Banana 2 を呼び出せる
  • スキルの仕組みは、Claude が SKILL.md の指示に従い、CLI コマンドを組み立てて Bash 実行するというシンプルな構造
  • クロスモデル連携により、Claude Code が「コーディングツール」から「AI モデルのオーケストレーター」に進化している
  • Skills と MCP は外部連携の二大手段で、用途に応じた使い分けが重要
  • 実践面では、API キー管理、コスト管理、出力品質の確認が運用のポイント
  • Nano Banana 系スキルは複数公開されており、ニーズに合ったものを選べるエコシステムが成長中

参考