サッカーくじ totoの予想をしてみる。-閾値設定について-

閾値設定について

前回までの記事でレーティング計算のパラメータKは16もしくは32がよさそうだということでした。
そして、初期値は1490(K=16の場合)、1480(K=32の場合)がよさそうでした。
実際の対戦データを用いて、レーティング計算の条件としてどれが適しているのか、検討してみます。

得られたレーティング値から勝率に換算し、以下のルールに従って、購入パターンを決定します。
  • ホームチームから見て勝率が0.5+閾値(W)を上回った場合には「1(ホームチームの90分勝ち)」を購入する。
  • ホームチームから見て勝率が0.5-閾値(W)を下回った場合には「2(ホームチームの90分負け)」を購入する。
  • ホームチームから見て勝率が0.5+閾値(D)を下回った場合かつ0.5-閾値(D)を上回った場合には「0(その他)」を購入する。

合わせて、レーティング計算の条件ごとに最適な閾値の探索を実施します。
mini-totoを購入することを考え、平均正答率(P)とその時の購入組み合わせ数(C)を求めます。
mini-totoの当選金額の理論値は約10,000円とのことなので、次の式で期待収益金額(R)を求めます。



Rが最大値をとるようなWとDを実験的に求めてみます。
ちなみにmini-totoは5試合に対して「勝ち」、「負け」、「その他」を選ぶので、組み合わせは243通りです。

(1)初期値1500、K=16の場合

Wを-0.3~0.15まで0.05刻みで、Dを0.075~0.3まで0.025刻みで求めた結果です。

5試合当たりの平均正解数
correct_1500_16.png

購入組み合わせ数
combination_1500_16.png

期待収益金額
return_1500_16.png

グラフでは読み取りづらいですが、W=-0.05、D=0.075の時に102.5円が最大値でした。

(2)初期値を前年最終節時点のレート(昇格チームは1500)、K=16の場合

Wを-0.3~0.15まで0.05刻みで、Dを0.075~0.3まで0.025刻みで求めた結果です。

5試合当たりの平均正解数
correct_prev_16.png

購入組み合わせ数
combination_prev_16.png

期待収益金額
return_prev_16.png

グラフでは読み取りづらいですが、W=0、D=0.075の時に475.4円が最大値でした。

(3)初期値を前年最終節時点のレート(昇格チームは1500)、K=32の場合

Wを-0.4~0.5まで0.1刻みで、Dを-0.05~0.4まで0.05刻みで求めた結果です。
変動幅を変えているのはKが大きい方がレーティング差が大きくなりやすくなるためです。
いずれにしても荒く調べたあとで、最大値付近の刻み幅を小さくして探索するのがよいでしょう。

5試合当たりの平均正解数
correct_prev_32.png

購入組み合わせ数
combination_prev_32.png

期待収益金額
return_prev_32.png

グラフでは読み取りづらいですが、W=0、D=0.1の時に512.8円が最大値でした。
前年のデータを使った方が結果が良好のようです。

さらに調べてみる

まずはK=16とした場合にWを-0.05~0.05まで0.01刻みで、Dを0.05から0.1まで0.005刻みで動かした結果です。
return_prev_16_detail.png

次にK=32とした場合にWを-0.1~0.1まで0.02刻みで、Dを0.05から0.15まで0.01刻みで動かした結果です。
return_prev_32_detail.png

スケール合わせた方がよかったなと思いつつ、見比べるとK=16の方が結果は良好そうです。
ということで、ここで求めたレーティング計算条件と閾値でmini-totoを購入して1年かけて実験してみたいと思います。