「機械学習でなんとかなりませんか?」にまず落ち着いて現象を理解する — AI時代に最も必要なスキルは問題設定力

Kohta Ishikawa(@_kohta)氏のポストが多くのデータサイエンティストやエンジニアの共感を集めています。

「これ"機械学習"でなんとかなりませんか??」という相談に対して「まずは落ち着いて現象を理解するところからやっていきましょう」と言う仕事をすることが多いです — Kohta Ishikawa(@_kohta)

791いいね、131ブックマークという反響は、この「あるある」が広く共有された証拠でしょう。元になったノムオ(@nomu_chem)氏のポストはさらに大きな反響(995いいね、337,435表示)を呼んでいます。

メーカーでデータサイエンス(機械学習)をやり始めて最初に感じた違和感が、データサイエンスやってたら、「機械学習を使って、この課題解決できないですか?」と皆から提案されるものとばかり思っていたが、そんなことは殆ど起こらないということ。 — ノムオ(@nomu_chem)

生成AIが爆発的に普及した2026年、この「まず現象を理解する」という当たり前のことが、かつてないほど重要になっています。

「AIで解決できませんか?」が失敗する理由

「機械学習でなんとかなりませんか?」という相談の多くには、共通する構造的な問題があります。

手段が目的化している

虎の穴ラボの技術ブログは、機械学習プロジェクトが「迷子」になる最大の原因を端的に指摘しています。

最も陥りやすい罠は、「AI・機械学習を使うこと」自体が目的化してしまうこと

SaaS で十分な場合にも過剰な工数をかけたり、ルールベースで解ける課題に無理に機械学習を適用したりするケースが後を絶ちません。

課題が定式化されていない

「サービスの質を上げたい」「売上を伸ばしたい」のような抽象的な問題は、そのままでは機械学習で解けません。CodeZine の解説記事では、課題の定式化の重要性を次のように説明しています。

「解約数を減少させることでサービスの有料会員数を伸ばしたい」まで課題を定式化できれば、ある程度機械学習で解決可能な領域まで持っていくことができます

つまり、「機械学習で解ける問題」に変換するプロセスこそがデータサイエンティストの本質的な仕事です。

現象が理解されていない

Google の Machine Learning Problem Framing ガイドは、問題定義(Problem Framing)が機械学習パイプライン全体の土台であると位置づけています。データ収集、前処理、モデル訓練、評価、デプロイの全てが、最初の問題定義に依存します。

チームが「データの分析に飛びつく前に、解くべき問題について合意しない」ことが、プロジェクト失敗の根本原因であるとされています。データサイエンスの失敗率が80%を超えるという推計も、この問題定義の欠如に起因する部分が大きいのです。

日本企業のAI導入が「PoC倒れ」に陥る構図

この「まず現象を理解する」ステップの欠如は、日本企業のAI導入の現場で大規模に再現されています。

PoC地獄の現状

ガートナーは「2025年末までに全生成AIプロジェクトの30%がPoC段階後に放棄される」と予測しました。日本企業はこの傾向がさらに顕著で、「PoC貧乏」「PoC地獄」と呼ばれる状態が広がっています。

段階問題
企画「AIで何かやりたい」という動機だけでスタート
PoC技術実験にとどまり、業務フローに統合されない
評価明確なKPIやROI指標が設定されていない
展開費用対効果を証明できず、本導入に至らない

PwCの2025年5カ国比較調査によると、日本はAI導入率こそ平均的ですが、効果創出の水準は他国と比較して低くとどまっています。期待を上回る効果を実感している企業は限られています。

失敗の根本原因

これらの失敗に共通するのは、技術検証の前に「何を解くのか」を明確にしていないことです。

  • ビジネス課題が抽象的なまま技術選定に入る
  • 「AIを使う」が稟議を通すための手段になっている
  • 現場の実際のペインポイントではなく、経営層の期待で要件が定義される

ノムオ氏が語る「立ち話の20%」の意味

ノムオ氏のポストで最も示唆深いのは、データサイエンティストの仕事の本質に関する部分です。

「情報は自分で取りに行くもの」誰も自ら課題なんて語ってくれない。だから「自分で情報を取りにいく」という姿勢が非常に大切になってくる。

立ち話の中で、「〇〇の件、どうなったんですか?」って聞きつつ、抱えてる課題を推論していかないといけない。個人的には、立ち話が仕事の20%くらいでも良いと思う。

この「立ち話の20%」は、データサイエンスの仕事がコンサルティングに近いという本質を表しています。コードを書くスキルやモデルを構築する能力は必要条件に過ぎず、現場の課題を発見し、機械学習で解ける問題に翻訳する能力が十分条件です。

BrainPad の解説でも、データサイエンティストに求められるスキルの3本柱として「ビジネス力」「データサイエンス力」「データエンジニアリング力」を挙げ、特にビジネス力を「課題背景を理解した上でビジネス課題を整理し解決する力」と定義しています。

生成AI時代に「問題設定力」がさらに重要になる理由

生成AIの登場により、「解く」部分の自動化は急速に進んでいます。しかし、「何を解くか」を決める部分は依然として人間の仕事です。

AIが代替するもの・しないもの

AIが代替しやすい人間に残る
データの前処理・クレンジング課題の発見と定式化
傾向分析・パターン認識ドメイン知識に基づく仮説構築
モデルの構築・チューニング結果の批判的評価と意思決定
コードの自動生成ステークホルダーとの対話

経済産業省の「生成AI時代のDX推進に必要な人材・スキルの考え方2024」は、生成AI時代のDX人材に求められるスキルとして「問いを立てる力」「仮説を立て検証する力」「評価し選択する力」を挙げています。技術スキルは生成AIで補填される一方、創造性やリーダーシップ、批判的思考の重要性が高まっているのです。

@_kohta氏の「落ち着いて」の含意

@_kohta氏の「まずは落ち着いて現象を理解するところからやっていきましょう」というフレーズには、技術者としての重要な姿勢が凝縮されています。

  1. 「落ち着いて」 — 流行の技術に飛びつかない。手段ありきで考えない
  2. 「現象を理解する」 — データを見る前に、何が起きているのかを把握する
  3. 「やっていきましょう」 — 相談者と一緒に取り組む。一方的に解を押し付けない

これは生成AI時代においても変わらない、エンジニアリングの基本原則です。ChatGPTやClaude Codeがどれだけ高性能になっても、解くべき問題を正しく設定するのは人間の仕事であり続けます。

「現象を理解する」ための実践ステップ

「機械学習でなんとかなりませんか?」と相談されたときの実践的なアプローチを整理します。

ステップ1: 何が起きているかを聞く

「どんな問題を解きたいですか?」ではなく、「今、何が困っていますか?」から始めます。問題はまだ定義されていないかもしれません。現場で起きている「現象」をまず把握します。

ステップ2: なぜそれが問題なのかを掘り下げる

「それは誰にとって、なぜ問題なのか」を明らかにします。根本原因分析(RCA)や5 Whys の手法が有効です。表面的な症状ではなく、構造的な原因を特定します。

ステップ3: 機械学習が適切か判断する

全ての問題に機械学習が必要なわけではありません。以下の判断基準が有効です。

機械学習が有効機械学習以外が適切
パターンが複雑で人間が言語化しにくいルールが明確に定義できる
大量のデータが利用可能データが少量または存在しない
予測・分類・最適化が求められる検索・集計・フィルタリングで済む
正解が一意ではない正解が一意に決まる

ステップ4: 成功指標を先に定義する

モデルの精度ではなく、ビジネス上の成功指標を先に定義します。「解約率を10%下げる」「不良品検出の見逃しを50%減らす」など、具体的な数値目標を関係者と合意しておきます。

まとめ

  • 「機械学習でなんとかなりませんか?」は危険信号: 手段が目的化しており、解くべき問題が定義されていない可能性が高い
  • 現象の理解が全ての出発点: データを見る前に、現場で何が起きているかを把握するプロセスが不可欠
  • データサイエンスの本質はコンサルティング: コードを書く以上に、課題を発見し定式化する能力が求められる
  • 日本企業のPoC倒れは課題設定の欠如が原因: 技術検証の前に「何を解くか」を明確にしないまま進むことが失敗の根本原因
  • 「立ち話の20%」は投資: 現場との対話から課題を発見するプロセスは、データサイエンスの仕事の本質的な一部
  • 生成AI時代に「問題設定力」の価値は上がる: AIが「解く」部分を自動化するほど、「何を解くか」を決める人間の能力が差別化要因になる
  • 「落ち着いて」は技術者の基本姿勢: 流行に飛びつかず、現象を理解し、相談者と一緒に取り組む姿勢が最も重要

参考