## どんなものか
競艇(ボートレース )を予想する人工知能「みずはのめ」です。
はじめは、一方的にみずはのめの予想を公開するだけでした。
現在は、ユーザーが自由にレースの予想を投稿や閲覧することができる
プラットフォームになっています。
## なぜ競艇か
大学で専門だった統計モデリングをの実戦の場として、競艇を選びました。
競艇は競馬と比較し、
・開催レース数が多く、1選手の出走数も多い
・1レースの出走選手数が固定
・有名な人工知能が少なくブルーオーシャン
と、統計モデリングに向いていると感じたからです。
## 苦労した点
【データの取得と整形】
競艇の公式サイトが提供されているデータはテキストデータで、
データとして扱えるようにするための処理が苦労しました。
はじめは、文字列を処理しデータ整形を行っていましたが、
おそらく人が手入力しているようで例外が多く見受けられました。
そこで、公式サイトからスクレイピングすることで、
より安定して綺麗なデータを取得することができるようになりました。
【予測精度の向上】
はじめは、Bradley-Terryモデルを用いて予測を行っていました。
しかし、このモデルはシンプルなモデルで簡単にある程度の精度は出るものの、
より細かいモデル化をすることはできず精度を上げることに苦労していました。
そこで、勉強会で発表することで参加者から意見を得ることにしました。
その結果、新しいモデルの着想を得ることができ、
階層ベイズモデルとしてモデリングすることができました。
そして、より細かいモデル化に成功し精度を上げることができました。
【ユーザビリティを上げること】
ユーザビリティを上げるためには、
まずどういった点が使いやすいか使いにくいかを把握する必要がありました。
そこで、
・ユーザーにアンケートを取る
・知り合いの競艇ファンに使ってもらい、感想を聞く
の2つを行い、意見を集計しました。
その後、影響度や実装難度等を考慮し優先度を決め、反映させていきました。
ただ、相反する意見も存在し主観的に決め打ちしている箇所もあります。
そのため今後は、しっかりとKPIを設定しABテストを行うなどして、
改善していく予定です。