Loading

データサイエンティスト育成講座|2024年3月期卒業発表会

スクール・講座

データミックススクール|2024年3月期卒業発表会

2024年3月期『データサイエンティスト育成講座』『気象データアナリスト養成講座』『HRアナリスト養成講座』の卒業生による卒業発表会が開催されました。卒業発表会は、受講生一人ひとりが自ら研究テーマを決め、約7ヶ月(※)にわたり学んだ成果を発表する場です。研究テーマは、受講生一人ひとりが自ら決めています。
※カリキュラム改訂により現在は約9ヶ月

2024年3月期発表会では、所属先企業のビジネス課題、社会的に注目度の高い課題など各自の興味・関心を起点とし、直面している課題をテーマに研究に取り組みました。この日は、バリュエーション豊かな各講座から特に優秀と評価された発表者が選出され、6名の卒業生に発表していただきました。以下で6つの発表についてご紹介します。

1. 自然言語処理の手法を用いた住所データの突合~共有IDのない顧客データの名寄せに向けて~

自社の新サービス開発にあたり、協業先と自社の膨大な顧客データの突合を課題として設定した分析プロジェクトです。大字(おおあざ)、小字(こあざ)といった複雑な住所表記、あるいは番地数字の半角、全角などの表記のゆれを極力きれいにするアルゴリズムを考案して辞書化するツールを自ら開発し、形態素解析を実行。抽出された文字列27万語をベクトル化し、65万件の既存顧客データとの類似度を計算することで、手作業だと1件当たり1分かかる突合作業を、1分あたり700件のペースで実行するという非常にビジネスインパクトの高い成果物としてアウトプットしました。最新のものから既存のものまで幅広い分析手法を組み合わせることで、運用コストを下げながら課題解決の実現に取り組まれたことが非常に高く評価され、今回最優秀発表となりました。

2. 東京都内一戸建て「お買い得」要件の導出

近年、低金利や都市部回帰の影響を受けて高騰している不動産価格に着目し、東京都内で一戸建て住宅の購入を検討している人々が真に「お買い得」な物件と出会う機会を創出することを目的とした分析プロジェクトです。分析には、国土交通省が公表している「レインズ・マーケット・インフォメーション(RMI)」の一戸建て不動産取引価格データを使用。分析の成果として①一戸建ての取引価格を予測するモデルを構築したほか、②「築年数」や「駅からの距離」以外の探索軸を提示しました。これにより、購入検討者がより精度高く「お買い得」物件と出会う機会を創出する可能性が高まったほか、購入の意思決定をサポートするツールを生み出しました。プロジェクト全体はシンプルな機械学習(ML)のアプローチで進められ、そのノスタルジックさが逆に新鮮であると講師から講評がありました。「都内で一戸建てを買うなんて難しい…」と思っている方も、こういったデータ分析の力を借りることで、効率よく理想の物件に出会えるかもしれませんね。

3. 従業員満足度調査の結果分析

所属先企業の従業員満足度調査データで「たいへん満足している」という回答が少なかったことに疑問を持ち、満足度向上につながる施策を検討した分析プロジェクトです。給与が高いにもかかわらず満足度が下がるという分析結果や、難易度が低い仕事で満足度が下がる一方で、難易度が高い仕事でも満足度への影響が限定的であるという分析結果など意外な結果を得たうえで、しっかりとその背景まで分析を重ねて具体的な施策の提案まで実施したことを高く評価されました。部署ごと、あるいは各階層マネジャーのマネジメント能力といった変数をも含めた分析など、人事部に所属しているという機会を活かして将来的にも継続実施をしていくことが期待されるような分析プロジェクトでした。

4. 限界に挑め!!!電気使用量の時系列予測

電気という作り置きができない資源について、発電量と実際の電気使用量の需要インバランスを最小化するための予測精度の高いモデル構築を課題とした分析プロジェクトです。分析には、電気使用量データと気象データ、供給地点データを使用。過去の傾向を機械学習させ、時系列分析に特化したProphet を使用して2日後の電気使用量を予測するモデルを構築しました。モデルの精度向上や予測精度の評価を持続的に実施する手法を組み込んだほか、現場の業務に直結するよう、予測モデルの結果を反映した業務プロセスへの組み込みにも挑戦しました。現場の声を反映しながら実運用の課題を解決する形で取り組まれている点が、データサイエンスをビジネスの課題に翻訳して活用する「ビジネストランスレーター」の役割を体現しており、講師からも非常に高く評価されました。電力業界特有の課題を解決するための実践的なデータ分析の取り組みは、他業界でも参考になる事例ですね。とても興味深い発表でした!

5. 家賃保証業務での機械学習による審査効率化検証

家賃債務保証業務の審査が属人化して工数がかかっている課題を解決するため、機械学習モデルで審査結果(承認 / 否決)を自動判断する仕組みを構築することに取り組まれた分析プロジェクトです。今回は、実業務データでの検証の前段階として概念検証を実施するステップをターゲットとして設定。オープンデータの中から実業務に近しいデータを選定したうえで目的に沿った欠損値処理や特徴量エンジニアリングを実施、機械学習モデルを構築し、ウェブアプリケーションでデモ画面を作成しました。今後、今回構築したモデルが実業務に耐えうるものかを検証し、実装によって業務削減効果をもたらすための手がかりを掴んだプロジェクトとなりました。講師からは、従事している業務に基づいたテーマ選定と適切なオープンデータの活用、さらにデモ画面の実装が実践的である点が評価されました。

6. スマートメダルで顧客にお得な利用分散とビジネスシステムのアップデート

利用者数が天候に左右されがちなビジネスモデルであるコインランドリー事業において、いかにして利用者数を平準化するか、という課題に取り組んだ分析プロジェクトです。データミックススクールでは、全国でコインランドリーを運営している株式会社wash-plus様提供のデータを使用しています。これにより、実際の店舗の利用者データや周辺の住宅環境、気候データを分析することが可能です。本プロジェクトではデータ分析による知見に加え、経営視点からのPEST分析・SWOT分析を実施し、ある地域に在住する20~30代共働きの主婦をターゲットとした施策の提案に取り組みました。具体的には、利用者に付与されるスマートメダルの獲得倍率を、コインランドリーの繁閑時間に応じてダイナミックに変動させることで、利用者の来店時間の分散化と利用促進を図るという施策を提案。広報活動や公的な経営支援制度を活用した実行計画まで、しっかりと検討されました。講師からは、中小企業の経営支援を行っておられるご本人ならではの、課題を「自分ごと化」した分析ならびに施策検討を高く評価されました。

皆様、7ヶ月間の学びの成果を存分に発揮いただいた発表でした。
惜しくも発表者に選出されなかった方も含め、卒業生皆様のご活躍をデータミックス一同、引き続き応援してまいります。

関連記事

まずはオンラインで体験&相談

体験講座やワークショップ、キャリアの相談、卒業生との交流など、さまざまな無料オンラインイベントを開催しています。