データサイエンティストになるためには? 必要なスキルや学習方法を解説
データサイエンティストとは、データを分析してビジネスに役…
データサイエンスが学べる
日本屈指のビジネススクール「datamix」
データサイエンス
2019.08.08
2019年7月21日、データサイエンティスト育成コース2019年1月入学(第8期生)の卒業発表&打ち上げパーティーを開催しました。
データミックスの教室では90名を超える皆さんを収容できないため、教室近くのベルサール神保町で開催しました。
発表形式ですが、選ばれた卒業生5名は写真のようなプレゼンテーション形式、卒業生13名はポスターセッション形式で成果発表を行いました。
気になる発表テーマは、人事系(HR-Tech)、Legal-Tech、レコメンデーションエンジンの開発、Deep Learningを使った画像認識など多種多様で、それぞれの分析の着眼点に参加した卒業生はもちろん、現役受講生も新しい学びがあったと思います。
発表後の質疑応答の時間では、卒業生や現役受講生などから、分析に関する技術的な質問から、「分析で大事なことはなんですか?」という哲学的な質問まで活発な質疑応答が行われました。
この発表会は、6ヶ月のデータサイエンティスト育成コースの集大成として、受講生が最後の1ヶ月間で取り組んだプロジェクトを発表する場です。
受講生は、この1ヶ月間、仕事の合間やプライベートの時間を削りながら、技術を磨き、データと向き合い、そしてビジネス上の成果は何かという問いに向き合ってきました。
そして、その多くの苦労を乗り越え、晴れて最終発表の日を迎えました!
そして今回の全体発表は、【個人課題部門】 【OpenPoC部門】 【データミックス提供課題部門】 の3つの部門に分かれて、卒業生に発表してもらいました。
数々のプロジェクトの中から、全体プレゼンに選抜されたテーマをご紹介します!
1.メンタルを病む”やばい”職場とは?【データミックス提供課題】
職場での精神疾患の因子を分析しました。企業に勤める社員のアンケート情報を元に、ロジスティック回帰、決定木を用いてモデリングを行いました。因果関係の特定が難しいタスクでしたが、どのように仮説立てたかという点は、見どころでした。
2.ロジスティック回帰による退職者予測分析【個人課題部門】
Excelのロジスティック回帰を使用し、人事データから3年後までの退職者を予測することに挑戦しました。Excelで苦労した点についても言及してくれました。
3.社内SNSツールを使ったネットワーク分析に基づく退職者予測【個人課題部門】
ランダムフォレストを使用し、SNSツールから取得できる満足度等のデータから退職者を予測しました。またネットワーク分析を使用し、人事データから情報経路という観点でキーマンを見つけることに挑戦しました。
4.ニューヨークにおけるタクシー運賃の予測【個人課題部門】
サポートベクター回帰とAutoMLを使用し、利用者より得た乗降位置データより、タクシー運賃を予測することに挑戦しました。最新のAutoMLの活用可能性について、参加者からも質問が集中しました。
5.外食チェーンのPOSデータ分析からレコメンドエンジン作成まで【OpenPoC部門】
企業が持つ課題・データを開示してもらい、それらをもとにプロジェクトに取り組む「Open PoC」という枠組みでプロジェクトに挑戦しました。顧客単価向上のために、商品組合せのアソシエーション分析を行い、特に「夏」にメイン商材とセットでオススメするべき商品を企画できるLineを使ったレコメンドエンジンを開発してくれました。
ポスターセッション形式のプレゼンは、4部に分かれて、下記のテーマで行われました。みなさんいろいろな挑戦をされており、プレゼンも上手で、会場は大盛りあがりでした。
【第1部】
①Twitterのフォロワーから自社のファンを特定するための分析に挑戦しました。ライバル社との比較もされており、興味深い発表でした。
②テック系企業における従業員が精神疾患に陥る要因分析・メンタルヘルス向上に向けた施策提案のための分析に挑戦しました。人事部やマネージャークラスの方への打ち手の提言もあり勉強になりました。
③映画系SNSを用いて「今日何観る?」を教えてくれるレコメンデーション開発に挑戦しました。このレコメンデーションエンジンは、やたら「釣りバカ日誌」を勧めてくるという話、面白かったです。
④ある企業の営業部門について、契約本数を増やすために担当エリアの最適化の分析に挑戦しました。
⑤テック系の職場における精神的健康に対する意識調査に挑戦しました。打ち手をしっかりと意識した分析は大変興味深かったです。
⑥買い時の株銘柄を自動的に見つけるプロジェクトに取り組みました。王道の時系列分析ではなく、レコメンデーションアルゴリズムを応用したアプローチは秀逸でした。
⑦血液塗抹標本細胞のマラリア感染予測モデルの作成に挑戦しました。多くのオーディエンスから「ぜひ実用化すべき!」という意見が出ていました。次のステップとして、ぜひとも世界の患者さんのために、実際の画像から細胞を認識して、個々の細胞の判別するモデルを作成していただきたいです。
⑧ドキュメントレコメンデーション機能の構築に挑戦しました。社内に眠る類似のドキュメントを効率よく探して、業務時間を圧縮したい方にとって興味深い発表でした。
【第3部】
⑨ポルトガルワインの成分データと評価データの分析に挑戦しました。ワインの製造過程まで調べて得たドメイン知識を踏まえたプレゼンは興味深かったです。
⑩ECサイトデータによる商品レコメンデーションに挑戦しました。協調フィルタリングとコンテンツマッチを比較しながら、わかりやすくプレゼンをされていたのが印象的でした。
⑪ネット広告キャンペーンの利益改善に取り組みました。バナーサイズと配信面が利益に大きな影響を与えている結果は興味深かったです。
【第4部】
⑫外食チェーンのメニュー共起度解析と組み合わせメニューのレコメンドシステムに挑戦しました。メニューをグループ分けして分析しており、きめ細やかな分析がなされていました。
⑬判例データの分析による判決に与える重要因子特定に挑戦しました。多くのオーディエンスは、分析そのものはもちろん、扱っている事件の中身も興味津津で聞いていました。
発表会後は、出席された皆さんと打ち上げパーティーを行いました!
卒業生・在校生が入り混じり、楽しそうにお話されている光景があちらこちらで見られ、講師・スタッフ一同、心から嬉しく感じました。
皆さまのコミュニケーションの輪が広がる時間になっていたのならば幸いです。
そして、今回卒業を迎えた皆さま、6ヶ月間本当にお疲れ様でした!
これからも一緒にデータサイエンス業界を盛り上げていきましょう!!
関連記事
ランキングRANKING
WEEKLY週間
MONTHLY月間