ブログ

Blog

2018.01.15

~データサイエンティスト育成コース~第2期生卒業発表会

昨年12月23日、データサイエンティスト育成コース第2期生の卒業発表&打ち上げパーティーが開催されました。場所も普段の教室とは違い、福岡銀行さんが運営するダイアゴナルランというコワーキングスペースを借りて行いました。すでに卒業した1期生や新しくプログラムに参加した4期生、さらにはデータサイエンスネットワーク企業の皆さん、総勢約50名を前に、6ヶ月にわたる受講の成果を発表していただきました!

発表内容はバラエティ豊か!

6ヶ月におよぶコース受講の集大成として、発表生は各自、業務に直接関係するものから自身の趣味に関するものまでなどをテーマにプロジェクトを発表していきます。どのようにこの日を迎えたかというと、直前5ヶ月間は統計学や機械学習を勉強し、最後の1ヶ月間は受講生各自でテーマを決め、データ収集から加工、分析、プレゼンテーションまでを自力で行います。その期間、講師は週1回のメンタリングセッションで、アドバイスを行いながらサポートしていきます。そして迎えた最終発表!

そのテーマはトレイルランニング~地獄のレース~だったり。。横浜ベイスターズのリリーフ陣だったり。多様なテーマで参加した皆さんを多いに盛り上げていました。

  1. クラスタリングとレコメンデーション
  2. Azure Machine Learning 異常検知
  3. Deep Learningの金融時系列データ予測への活用
  4. Deep Learningを用いた自動キャプション生成と金融業界への応用
  5. 旅行会社のログデータを活用した顧客クラスタリング
  6. 自然言語処理の活用 「 トレンド型商品訴求の自動化 」
  7. ベイスターズのピッチャー・リリーフ陣の分析

6ヶ月前はプログラミングや統計学もはじめてだったのに!

それぞれの発表のハイライトを書いていきます!

クラスタリングとレコメンデーション

  • 「山レコ」という自身のトレイルランニングの記録を保存するサイトから1分ごとの緯度・経度・標高データを収集し、コースの自動分類やおすすめコースのレコメンデーションを作りました。受講前はプログラミングやデータ分析はほぼ初心者でしたが、最後の1ヶ月間はスクレピングや正規表現などを使ったテキストデータの整形から始まり、主成分分析やクラスタリング、協調フィルタリングを使ってプロジェクトを進めていました!本当にお疲れ様でした!

Azure Machine Learning 異常検知

  • お仕事と関係するということで、Azure MLを使って実際のデータを使ってOne-Class SVMやPCA、ランダムフォレストを使った異常検知の比較を行いました。異常検知アルゴリズムの全体像からはじまり、実際に試したアルゴリズムのわかりやすい説明、その性能評価を説明していただきました。Azure MLはクラスでは教えていないので、在校生はもちろん、発表していた卒業生も興味津々でした!

Deep Learningの金融時系列データ予測への活用

  • こちらの発表も、業種が金融系ということで、LSTMという時系列データを得意とするDeep Learningを使ってマーケットデータの分析を行いました。AWS上にGPUサーバーを立てて、モデルの学習から評価を行いました。金融ということで専門的な話になるかと思いきや、誰にでもわかりやすいプレゼンテーションとなっており、オーディエンスを盛り上げていただきました。質問セッションでも「どのくらい儲かるんですか?」といった話から、「Deep Learningの難しさは?」といった話まで幅広い質問で盛り上がりました!

Deep Learningを用いた自動キャプション生成と金融業界への応用

  • 発表タイトルだけ見ると「金融の話か?」と思われるかもしれませんが、実は「画像に自動的にキャプションをつける」というCNNとLSTMというDeep Laarningの手法を組み合わせた実装のお話でした。最後には卒業生有志から集めた画像にキャプションをつけたデモまで披露しており、会場を湧かせていました。発表された方は、実は授業でDeep Learningを学んでおらず、1ヶ月間で独力で学習し、フレームワークを使って実装していました。直前5ヶ月間で学んだことを活かして、新しい手法を学習できるということを証明してくれました!

旅行会社のログデータを活用した顧客クラスタリング

  • こちらも業務と関連するということで、旅行会社のホテルの検索ログデータを使って顧客の特徴理解を行いました。発表した方は、ドメイン知識とデータサイエンス力を駆使し、ユーザーのタイプ分けを丁寧に行い、ビジネス上の打ち手、ABテストの設計まで発表していました。「ドメイン知識があるとここまでデータの理解が深まるのか!」という点で、素晴らしい内容で、在校生のモチベーションを多いにあげてくれました!

自然言語処理の活用 「トレンド型商品訴求の自動化 」

  • ECサイトの仕事をされており、業務に活用できるものをということで、ニュースでよく取り上げられている商品を自動的に検知する仕組みを作り、成果をあげたビジネス事例を発表しました。ビジネス上の課題からはじまり、データサイエンスの技術で改善するアプローチ、自然言語処理を使ったアルゴリズムの実装方法を詳細に説明していました。実際に卒業プロジェクトを業務に組み込み、さらに利益をあげているという点で、まさにビジネス課題を解決するデータサイエンティストの第1歩を踏み出した、感慨深いプレゼンテーションでした!

ベイスターズのピッチャー・リリーフ陣の分析

  • 普段はアドバイザリーの仕事をしている発表者の方でしたが、今日は自身の大好きなベイスターズの投手陣の分析をしてくれました。最後のプレゼンテーションということもあり、オーディエンスも少し疲れ気味の中、それまでのプレゼンテーションとは一味違う、ベイスターズ愛を全面に押し出したプレゼンテーションで、オーディエンスの疲れを吹き飛ばしてくれました!

 

発表会のあとは

さて、発表会終了後には打上げパーティーを催しました。


ケータリングはご覧のようにとてもとても素敵でした。味も素晴らしかったです😍

可愛い!そして美味しい!

インスタ映えっ

卒業生、在校生、データサイエンスネットワーク企業の方々、そして弊社スタッフが一緒になって盛り上がった、とても素敵な1日でした!