概要
2026年5月20日、スペイン語圏のテックメディア @CopyRebeldia が衝撃的なポストを投稿した。
「今日、業界ひとつまるごと意味を失った。Meta が SAM3 を GitHub で公開した。『白いユニフォームの選手』と言うだけで、NBA の混戦の中からその選手だけを追跡し、戦術図まで重ね描いてくれる。手動スカウティングはもう趣味になった。」
このデモ動画を投稿したのは Roboflow のオープンソースリード Piotr Skalski(@skalskip92)。わずか 19 秒の映像が、コンピュータビジョン界隈に大きな波紋を呼んだ。
本記事では Meta SAM3 の仕組みと、スポーツ分析をはじめとする実用分野への影響を解説する。
SAM3 とは
SAM3(Segment Anything Model 3) は Meta AI Research が開発したモデルだ。画像・動画を対象に、物体の検出・セグメンテーション・追跡を一つのモデルに統合している。
- 公開日: 2025年11月19日(SAM 3.1 は 2026年3月27日)
- GitHub: facebookresearch/sam3
- 論文: SAM 3: Segment Anything with Concepts
前世代の SAM2 と比べた最大の変化は「テキストプロンプトで物体を指定できる」点だ。
SAM2 との違い
| SAM2 | SAM3 | |
|---|---|---|
| プロンプト形式 | 点・ボックス・マスク(空間的) | テキスト・サンプル画像・空間的 |
| セマンティック理解 | なし | あり(オープン語彙) |
| 複数物体追跡 | 品質低下あり | Object Multiplex で並列追跡(3.1〜) |
| 言語エンコーダ | なし | 大規模テキストエンコーダ統合 |
| カモフラージュ物体 | 検出困難 | 検出可能 |
SAM2 は「この座標にある物体を追え」という指示しかできなかった。SAM3 は「白いユニフォームを着た選手」「ボールを持っている人」という意味的な概念で物体を特定できる。
NBA 追跡デモが示すもの
@skalskip92 が公開したデモでは以下が行われている:
- NBA の試合映像(複数選手が入り乱れる混戦シーン)を用意
- テキストで「白いユニフォームの選手」と指定
- SAM3 がそれだけを自動追跡し、戦術オーバーレイを重ねて描画
以前この処理を行おうとすると、以下の手順が必要だった:
- 専用データセットを収集する(数日)
- カスタム物体検出モデルを学習する(数日〜数週間)
- トラッカーでモーションを推定する
- ようやく追跡可能
SAM3 では テキスト指示 → 即時追跡 まで数秒で完結する。
SAM 3.1: Object Multiplex による多物体追跡
2026年3月にリリースされた SAM 3.1 では、複数物体を同時追跡する Object Multiplex 機能が追加された。
- 従来: 物体ごとに独立処理するため計算コストが物体数に対して線形増加
- SAM 3.1: オブジェクトを固定容量バケットにグループ化して共同処理することで、精度を維持したまま高速化(128 物体で約 7 倍)
スポーツ分析においては「コート上の全選手を同時に追跡しながら、特定の選手だけにフォーカスする」といった用途に直結する。
スポーツ業界への影響
スカウティングとは「試合映像を見て選手の動き・戦術を分析する」作業だ。従来は専門のアナリストが何時間もかけて手動でタグ付けし、データベース化していた。
SAM3 によって変わること:
- 動画の自動タグ付け: 「3番の選手がボールを持った瞬間」を全試合から抽出
- 戦術可視化の自動生成: テキスト指示だけで戦術図のオーバーレイ映像を生成
- ゼロショット適用: 事前学習不要で新しいスポーツ・チームにも即対応
Piotr Skalski は別の投稿でこう述べている:
「以前: データ収集 → カスタム検出器の学習 → トラッカーでモーション推定 → 数日かかる。今: テキストプロンプトで追跡 → 数秒」
ライセンスと利用条件
SAM3 は MIT ライセンスや Apache ライセンスではなく、カスタム SAM License で公開されている。商用利用・改変は可能だが、ソースコードの再公開義務はない(コピーレフトではない)。
実際に使う場合は GitHub リポジトリの LICENSE ファイルで最新条件を確認してほしい。
まとめ
Meta SAM3 は「テキストで物体を指定して動画内で追跡する」という、これまで専門的なパイプライン構築が必要だった処理を誰でも数秒で実行できるようにした。
@CopyRebeldia が「業界ひとつまるごと意味を失った」と表現したのは誇張ではない。スポーツスカウティング、医療映像解析、監視カメラ分析など、「動画内の特定の何かを追う」あらゆる分野でパラダイムシフトが起きつつある。
コードと事前学習済みモデルは GitHub で公開されており、すぐに試せる状態だ。
- GitHub: https://github.com/facebookresearch/sam3
- Meta AI ブログ (SAM 3.1): https://ai.meta.com/blog/segment-anything-model-3/