「マーチ・マッドネス(3月の狂乱)」とも呼ばれる全米大学体育協会主催の男子バスケットボール・トーナメントは、米国でとても人気のあるスポーツ・イベントだ。どのチームがトーナメントを勝ち上がっていくか、各地で開催される賭けのおかげともいえる。米国のカジノ業界団体である米国ゲーミング協会(AGA:American Gaming Association)によると、2018年は1040万ドル近い賭け金が使われ、4000万人以上の米国人が独自のプレーオフ・ブラケット(組み合わせ表)予想を立てて参加している。完璧なブラケットを予想できる可能性はよくて1280億分の1、人によっては9.2兆分の1と計算しており、いまだかつて誰も予想があたったことがない。
そして今、機械学習が挑戦する。
2017年、グーグルの親会社アルファベットは、予測モデリングとデータ分析を競技化するオンライン・プラットホームを運営しているカグル(Kaggle)を買収した。そのカグルがNCAAバスケットボールの男子と女子の決勝戦の勝者を予想する競技会を開催する。カグルは、以下のデータ・セットを提供する。
すべての情報を合わせると4000万データ・ポイントに達する。
競技会の参加者はブラケット予想の賭けには参加しない代わりに、あるチームがそれぞれの試合で勝つ確率はどのくらいあるかを予想するモデルを作成して使う。作成されたモデルは試合の結果と、モデルが出した予測の両方で判断される。たとえば、あるモデルが99%の確率であるチームが勝利すると予想し、その通りの結果になった場合、95%の確率で勝利を予想したモデルよりも多くのポイントを獲得する。モデルが高い勝率を予測し、間違っていた場合には反対により多くのポイントを失う。これは、まぐれや偶然での勝利を排除するためだ。男子、女子それぞれのトーナメントで上位3チームのブラケットを予想したモデルが10万ドルの賞金を分け合う。エントリーの締め切りは3月15日で、500チームがすでに参加を表明している。
だが機 …