データサイエンティスト育成講座|2023年9月期卒業発表会
2023年9月期『データサイエンティスト育成講座』の卒業生たちによる、卒業発表会が開催されました。
卒業発表会は、受講生一人ひとりが自ら研究テーマを決め、約7ヶ月にわたり学んだ成果を発表する場として、所属先企業のビジネス課題や日本が抱える社会問題、そして日々の暮らしや趣味・関心ごとなど、多種多様なテーマの発表が行われます。
その中でも、特に優秀と評価された5名の発表テーマを紹介いたします。
①グルメ探索の新展開:あなたの好みに応えるレストランリコメンド”の提案
普段は人事職に従事されており、テキストデータを活用できるようになりたいと考えて、飲食店の口コミを主な分析対象にされた卒業プロジェクト。毎週、土曜日の講義に参加される際にカレー店巡りをされており、その際に口コミや評価を確認して吟味しなくても、自動で自分好みのカレー店をレコメンドしてくれる仕組みを開発されました。
講師からは、人の介在が少なく、意思決定の大部分を自動化できている点を評価されていました。テキストデータの分析には『自然言語処理』と呼ばれる手法を用います。この手法については、データサイエンティスト育成講座のアドバンスステップで講義を行います。
②樹脂部品生産工程&金型品質熟成効率化アプローチの検討
樹脂部品の生産に従事されており、日頃の業務を楽にしたいという動機から、射出成形の際の欠陥品を減らし、確認にかかる作業負担を減らすことに挑んだ卒業プロジェクト。
出来上がった製品が、良品か不良品か、不良品の場合はどのような特徴があるのかを統計手法を用いて可視化したり、不良品の発生を予測するモデルを作成するなどし、省人化に役立てたいとのことでした。
講師からは、ビジネスインパクトに非常に期待が持てる点を評価されていました。
今後は、さらなる精度向上に挑んだり、射出成形に使用する金型のデータも対象に分析してみたいとのことでした。
③新薬開発をOn-timeで完遂させたい〜抗がん剤臨床試験の遅延防止に向けた時系列分析モデル〜
製薬業界での課題に切り込んだ卒業プロジェクト。
新薬開発の場面においては、計画の遅延が慢性的な課題になっており、その原因の約半数が、治験の際の患者登録数に起因することが判明しています。
そこで、治験を実施する施設を検討する際、意思決定をスムーズにするために、疾患の種類ごとに、地域、施設ごとの対象患者数を予測し、可視化と共有可能なダッシュボードの作成に挑んだ内容でした。
実際の治験では、疾患の種類に加えて他の細かい条件も加わるため、処理の対象になるデータが膨大になるなどの実用に向けての課題もありますが、こちらの発表も、講師からはビジネスインパクトが非常に期待できるという点を評価されていました。
④マニュアル改革(翻訳改善と提供方法改善:Phase1)
所属先企業では産業用ロボットの製品の拡大に取り組まれており、新たな製品が登場する度にマニュアルの制作と多言語化の業務が発生するものの、これらの業務は手動で行われており、より効率的な作業方法が求められているとのことでした。
そこで、機械翻訳しやすい日本語の追求と、翻訳した際の精度をスコア化し、それをもとにLLM(大規模言語モデル/生成AIの一種で、テキストデータの学習を得意とするもの)の制作に挑んだ内容でした。
「この問題の解決に、データサイエンスを活かせるはずだ!」という確信のもと受講のお申込みをいただき、受講開始直後の段階からオフィスアワーを活用して、どのようにこの問題に挑むのかを、積極的にご相談いただいていました。
講評では、人と機械学習の作業役割が秀逸で、深いドメイン知識が裏打ちされているという評価をいただいていました。
⑤スーパーチェーンの売上改善
友人のスーパーマーケットの売り上げ改善余地を探す内容でした。
店舗別、月別、時間帯別など、会員カードとPOSに蓄積されたデータから、様々な角度で現状の可視化に取り組まれていました。
その中からある1店舗に絞り、顧客のセグメントと購入される商品の傾向を可視化し、ついで買いされやすい商品の組み合わせを見出していました。
また、実際に店舗を訪れて店頭の様子を視察したり、周辺の競合店の視察や、評判の聞き込みを行うなどして、現場から得られた示唆も提案にふんだんに盛り込まれていました。
講師からは、数字のみにとらわれず、現場とドメイン理解への積極性を評価されていました。
みなさん、7ヶ月間の学びの成果を存分に発揮いただいた発表でした。
本当にお疲れ様でした。
皆様のご活躍をデータミックス一同、引き続き応援してまいります。