企業の財務データや株主構成から「1年以内に他社株TOB(公開買い付け)の対象となる確率」を機械学習で予測し、その確率を使ったポートフォリオが TOPIX を上回るリターンを出せる——そんな研究結果が発表されました。

久保正裕・梶並俊彦・鈴木智也(2026)による論文「機械学習による他社株TOBの予測可能性」(人工知能学会第二種研究会資料・金融情報学研究会、FIN-036 巻 41 号、p.257-263)の内容を紹介します。

論文DOI: 10.11517/jsaisigtwo.2026.FIN-036_257

研究の概要

TOBが発生すると対象企業の株価にはプレミアムが上乗せされるため、投資家にとって非常に魅力的なイベントです。この研究では、東京証券取引所の上場全銘柄(データ取得期間:2011年1月〜2025年5月)を対象に、財務指標だけでなく「株主構成」に関する特徴量を加えて予測モデルを構築しました。

分析1: 不均衡データへの徹底した前処理

TOBは上場企業全体から見ると年間数十件程度と非常にレアなイベントです。そのまま学習すると多数派(TOB非発生)のデータに過剰適合してしまいます。この問題を解決するため、複数ステップの前処理を実施しています。

  1. 時系列分割: 予測対象年から過去5年間を学習データとして分割し、TOB発生メカニズムの時変性に対応
  2. Random UnderSampling: 多数派を減らしてクラス比を調整
  3. Tomek Links: クラス境界付近のノイズとなる多数派データを削除
  4. SMOTENC: 少数派(TOB発生銘柄)の疑似データを生成し、機械学習による分類が容易な学習環境を整備

分析2: 予測精度と決定要因(SHAP分析)

再学習した Random Forest モデルは ROC-AUC で 0.60〜0.75 を達成しました(ランダム予測の AUC=0.50 を大きく上回り、十分な予測能力があることが確認されています)。

SHAP 分析によって TOB 予測に寄与する要因も明らかになっています。

特徴量解釈
筆頭株主の保有割合(最重要)親会社が子会社を完全子会社化する「親子上場の解消」などのケースを示唆
個人保有比率(低いほどTOB対象になりやすい)個人投資家が多いと売却を促すためのプレミアムが高くなり、買収コストが嵩む
時価総額(LnMV)・PBR・配当性向(低い企業)必要なコストが少ない点や非効率な投資への懸念(フリーキャッシュフロー仮説)から狙われやすい

分析3: ポートフォリオ運用シミュレーション

この予測モデルの出力を実際の株式運用に応用した結果が特に注目されます。

  • 機械学習が算出した予測確率の**上位5%・15%・25%**の銘柄で等ウェイトのロングポートフォリオを構築し、年1回リバランスするシミュレーションを実施
  • いずれのポートフォリオも TOPIX を上回るリターンを獲得
  • 上位5% > 上位15% > 上位25% の順でリターンが段階的に高くなる傾向を示し、予測確率の有用性が示された

最も有益な発見: TOBが発生しなかった銘柄の動き

この研究の最も重要な発見は「実際にはTOBが発生しなかった銘柄」の動きです。

  • TOBが発生しなくても、予測確率が高い銘柄群は統計的に有意にプラスのリターンを生み出していました
  • これは、市場の先行指標である株価が、TOBの発生可能性を先読みして価格上昇している可能性を示唆しています

つまり、TOBが発生する・しないにかかわらず、「TOB予測確率」という指標自体がポートフォリオの銘柄選択において非常に有用であるという、実務的応用価値の高い性質を示す結論となっています。

まとめ

項目内容
手法Random Forest + 不均衡データ対策(RUS / Tomek Links / SMOTENC)
データ東証上場全銘柄(2011年1月〜2025年5月)、財務指標+株主構成
予測精度ROC-AUC 0.60〜0.75
最重要特徴量筆頭株主の保有割合
運用結果上位5%・15%・25%いずれのポートフォリオも TOPIX をアウトパフォーム
重要示唆TOB未発生銘柄でも予測確率が高い銘柄群は統計的に有意なプラスリターン

財務データと株主構成データを組み合わせたこのアプローチは、個人投資家にとっても参考になる視点を提供しています。「TOB予測確率」を独自に計算することは難しいですが、筆頭株主の保有割合や個人保有比率、PBR、時価総額といった公開情報を活用した銘柄スクリーニングは、誰でも実践できる投資戦略のヒントになりそうです。