データサイエンスを”楽しく学ぶ”

長尾浩志様

THEME :Boat Race Winner Prediction& Web service launch

データサイエンティスト育成講座
2019年12月期

データサイエンティスト育成コース本講座卒業(プラントエンジニア/設計業務担当)

この発表のポイント・見どころ

ランダムフォレストやLightGBMなどの機械学習アルゴリズムを用いてボートレースの結果を予測するサービスを開発しました。分析プロセスだけではなく、実際に作成したサービスや分析結果をサービスに組み込むプロセスについても紹介があるので、実際にWebサービスに組み込む工程に興味がある方にとっては特に興味深い内容になっているかと思います。

現職に囚われず、データサイエンスを楽しく学びたい

会社の先輩で機械学習を業務に適用している方がおり、その方の行動や姿勢から機械学習の持つ可能性を感じ、習得しようと決心しました。

データミックスの卒業発表のテーマには、現職とはまったく関係のないボートレースの3連単予測に取り組みました。

もともと自分の意思でデータサイエンティスト育成コースに参加したため、テーマには現職に囚われず面白そうなこと、需要が見込めそうなことに取り組もうと考えていました。ボートレースの3連単予測は純粋に面白そう(精度が良ければ儲けられそう)だったのに加え、テレビCMで流れるようなクリーン・ライトなイメージとは裏腹に、多くの競艇予測サイトには一種の“素人お断り”の印象を受けました。素人でも使いやすい予想サイトの提供は、現在のボートレース業界の取り組みにもマッチするなと感じ、課題に取り組むことにしました。

予測精度だけではなく、”実際に誰でも使えるもの”を

予測精度にも一定のこだわりを持って取り組みましたが、それ以上に“実際に皆さんが使える”ものに仕上げることにこだわって取り組みました。そのため身に付けるべき周辺技術が多く(スクレイピング、データ加工、Webアプリ開発~デプロイ、など)大変な目にもあいましたが、多くのスキルを習得することができました。

古典的な機械学習からディープラーニングまで、多くの手法を使えるようになりました。欲しいデータを欲しい形に作り上げるスキルは、講座内と自主学習内とでしっかりと手を動かし続けた結果、非常に成長できたと感じています。

——

本発表で紹介しているボートレース予想サイト「きょう、ていの良い予想は当たるだろうか?」は現在も運営を続けており、半年以上が経過しました。(当たりやすい競艇場、というのも見えてきました。(笑))今後、予測モデルの更なるアップデートなど検討しているので、ぜひご覧になってください。
https://youhaveniceboat.pythonanywhere.com/

資料ダウンロードとお問い合わせ