ブログ

Blog

2018.07.09

データサイエンティスト育成コース第4期 卒業発表会を開催!

今回は、6ヶ月コースの卒業生に加えて、初めて3ヶ月のフルタイムコースの卒業生も混ざっての開催でした。

データミックスの卒業発表は、時間の都合で「神ファイブ」と称した選抜した5名のみがプレゼンテーションを行うスタイルです。残りの卒業生はポスターセッションでの発表としています。プレゼンテーションはもちろん、ポスターセッションも力作ばかりで、多いに盛り上がりました。オーディエンスは、卒業生や在校生だけでなく、人材を募集する企業の方なども参加してくださり、総勢80名となりました。

 

気象、オークション、競馬、不動産など幅広いテーマの発表

日々の仕事がありながら、1ヶ月という短期間で分析プロジェクトを進めてきましたが、主催者側の期待値を大きく上回る完成度で、正直驚きました。そして、毎回、講師陣もどのプロジェクトを発表してもらうかは散々悩むのですが、今回も例に漏れずかなり悩みました。悩んだ結果、選んだ「神ファイブ」プロジェクトは以下の5つです。

 

杉並区掘り出し物件サーチ

不動産賃貸のウェブページをスクレイピングしてデータ収集し、杉並区の割安物件を探すアプリケーションの発表でした。特に、PCA + SVMで画像認識を行い特徴量に組み込むという凝った分析やアクティブ・ラーニングという手法を使ったアノテーション手法を説明してくれました。人間が手で入力したデータは表記ゆれへの対応に苦戦したという苦労話も披露してくれて、分析系の仕事をしている卒業生も大いにうなづいていました。最後に、作成したウェブアプリケーションを披露して会場を盛り上げてくれました!

 

アウトドア用品売買サービス販売方法の解析&企業報告回想

続いての発表者の方は、いわゆるビジネス・アナリティクスです。以前勤務されていた企業のデータを使って、どのような打ち手を実施すれば、利益が改善するのかというビジネス課題から出発したプロジェクトの成果を発表してくれました。特にビジネスサイドの人にどのように分析を説明すれば腹落ちしてくれるのか、どのように分析課題を明確にするかについて説明してくれました。さらに、「Garbage in, Garbage out」だということを痛感したということで、データの整備が企業の課題であると指摘し、参加された企業の方も共感する内容でした。

 

A.I. Sommelier(お薦めワイン レコメンデーション機能)

続いては、普段はエンジニアをされているワイン好きな卒業生の方の発表です。好きなワインのテイストを文字入力すると、お勧めワインをレコメンデーションしてくれるアプリケーションを作り、その仕組みを発表しました。レコメンデーションの部分は、doc2vecという自然言語処理の技術を使っており、類似ワード検索のデモでも会場を盛り上げてくれました。さらに、アプリケーションの中身に留まらず、ビジネス上のインパクトや今後の展開まで発表していただきました。

 

AI霧予測チャレンジ

気象予報士でもある卒業生が発表したプロジェクトで、気象のドメイン知識と機械学習を使って成田空港の霧の発生を予測するというものです。使用したアルゴリズムは回帰分析にはじまり、ランダムフォレスト、XgBoost、LSTMなど数多くのアルゴリズムでチャレンジして、気象庁の予測を上回れるかに挑戦しました。また、苦労話として、不均衡データへの対処で苦戦したことを語ってくれました。「霧の発生」というテーマは成田空港に離発着する飛行機にとっては非常に重要なものだということで、会場の皆さんも興味津々でした。

 

人間の予想を裏切るレースを機械学習で予測する

最後の1枠は、おもしろネタを発表する枠で、今回は競馬の予測をして、実際に儲かるかを、自腹を切って検証してくれました。日曜日ということで、当日の馬券を買って、プレゼン中にその結果をみんなで確認しました。結果は・・・惜しい!!!ということで、多いに盛り上げてくれました。

 

 

ポスターセッションも力作揃い!

卒業発表会では、プレゼンテーションの合間に2回のポスターセッションの時間を設けています。その時間を使って、オーディエンスの皆さんは各ポスターセッションのブースに行って発表を聞くことができます。以下の4つのプロジェクトが今回のポスターセッションとなったプロジェクトです。

  • Kaggle: Avito Demand Prediction Challenge
  • レンタル自転車の需要予測
  • 社長メッセージに経営の真実は宿るか
  • 日本卸電力取引所(JEPX)スポット市場の 市場価格予測アルゴリズムの構築

Kaggleでのチャレンジやレンタル自転車の需要予測など、いわゆるモデリングに注力したプロジェクトから、自然言語処理を使った分析、さらにはドメイン知識を活かした市場価格予測アルゴリズムの開発と幅広く、各ブースに人だかりができていました。

ポスターセッション中は、ネットワーキングも兼ねており、卒業生や在校生どうしで近況報告し合ったり、今後の勉強方法について在校生が卒業生に質問したりする姿が印象的でした。

最後は打ち上げ!

多いに盛り上がった1次会、そして2次会でした!

1次会の様子

日曜9時からスタートした宴

皆さんお疲れさまでした!卒業生の皆さん、6ヶ月間または3ヶ月間お疲れ様でした!今後は卒業生として参加してくださいね!