データサイエンティストになるためには? 必要なスキルや学習方法を解説
データサイエンティストとは、データを分析してビジネスに役…
データサイエンスが学べる
日本屈指のビジネススクール「datamix」
データサイエンス
2021.08.12
デジタルトランスフォーメーション(DX)に注目が集まる中、よくデータミックスのコンサルティングクライアントから「AI・データサイエンスへの投資についてROIを計算したい」という要望をいただきます。おそらく、AIやデータサイエンスのプロジェクトを行うにあたって意思決定に関わる者のうち懐疑論者がいる場合や稟議を回して上席者に説明しなくてはならない場合にご質問いただくのだと想像しています。そこで、この記事では、AIやデータサイエンスへの投資効果をどのように考えるべきかを考えてみたいと思います。
この論点を考える上で、以下のようなAI・データサイエンスのプロジェクトについて、プロジェクト単体の短期的なROIを計算するとしたら、どうしたら良いでしょうか?
・経営の可視化から始めたい。散在しているデータを統合して、月次で作っているレポートをタイムリーに確認できるようにダッシュボードを作って欲しい。
・物流現場でこれまで人間がやっていたシフト作成を出荷量を予測した上でシフト作成の自動化・最適化をしたい。
・ある会社で初回商談時に受注確率を予測したい。そうすることで、営業担当者の配置を最適化でき、全体の受注率も改善するはず。
省力化が主目的であれば、これまでやってきた業務がどれだけ省力化できるかを概算し、その省力化できた分の人件費をリターンだと言えます。また、売上アップを目的とする場合は、予想される受注率の増加を見積もり、売上増加分がリターンだと言ってしまえば良いわけです。簡単そうに見えますよね。しかし、これが想定以上に難しいのです。その理由は3つあります。
データの保管・メンテナンスの状況は各社で全く違います。顧客や業務に関するデータを細部まで収集し、活用しやすいように整理できている企業も多くありますが、ITの多くを外注しており自社にノウハウが少なく、自社でどんなデータの保管の仕方をしているかを把握しきれていない企業もあります。データが散在しているような場合もあるでしょう。さらに、業務で必要なデータとAIやデータサイエンスで必要なデータは「粒度」が異なります。実際にプロジェクトをやってみたら、結合できると聞いていたデータどうしが結合できなかったといったケースもあります。このようにデータの保管状態とプロジェクトの目的によって、データに関するコストを見積もるのがかなり難しいわけです。これが1つ目のハードルです。
AIやデータサイエンスプロジェクトでは、改善させたい重要指標(KPI)が定まっているケースがほとんどです。そこでROIを計算するにあたり問題になるのが、KPIをどの程度改善させられるかが、やってみないとわからないということです。例えば、あるプロジェクトでAIによる予測が必要な場合、その予測精度はデータに大きく依存します。解決したい課題によっても求められる必要なデータ量は変わりますし、予測に必要なデータ項目(特徴量)が十分かも蓋を開けてみないとわかりません。そのため、どのくらいの予測精度が出せるかもやってみないとわからないということになります。
一旦、予測モデルやダッシュボードを作ったとしても、その後はメンテナンスをし続けなくてはなりません。特に予測モデルは定期的に更新していくことが多いわけですが、その際に精度が下がってしまった場合には原因究明やモデルの作り直しやデータの見直しが発生する可能性があります。もし、社内にデータサイエンスチームがある場合は他のプロジェクトの遅延による機会損失になります。社内にデータサイエンスチームがない場合は、外注コストとして顕在化します。
このように、3つの理由を示しましたが、要は「やってみないとわからない」ということなのです。計算できないものは仕方ありません。では、どうしたら良いのでしょうか?その答えは、最初から難しいプロジェクトに手を出さず、簡単かつ小さく始められるプロジェクトを選ぶことです。定めた期間で、最小コストでできる範囲のプロジェクトを見つけて実験するという考え方です。例えば、データサイエンティストに外注して3ヶ月でどこまでできるかを試してみてもらう、うまくいかなかったら途中で中止できるサブスクリプション型のAIツールやBIツールを導入してみる、といったものです。
しかしながら、短期的かつ実験ばかりやっていても意味がありません。早々と実験段階から卒業し、競争優位性や顧客への新たな価値提供のためにAIやデータサイエンスを活用していくフェーズに向かわなければなりません。そのためには、大規模な投資が必要であり、その際に改めて投資の正当性を示す必要があります。この場合、投資の正当性を示したらよいのでしょうか?それにはAIやデータサイエンスを活用して、どのようなビジネスへと変革していくかのビジョンが必要です。
投資の正当性を考えるためには、AIやデータサイエンスをどのように自社の競争力へ結びつけていくかというビジョンが重要になってきます。そのビジョンとは現在のビジネスプロセスをデジタル技術を使って効率化するというものではなく、新しい提供価値や新しいビジネスモデル、さらに新しい組織のあり方といった将来のありたき姿です。そのありたき姿 = ビジョンに向かうために長期的に投資を行っていく必要があるものと考えます。
では、長期的なビジョンを考える上でのポイントはどのようなものがあるでしょうか?
IMDのマイケルウェイド氏の「対デジタル・ディスラプター戦略 既存企業の戦い方」によると、デジタル技術を用いてもたらされる顧客への提供価値は3つあると整理しています。
・コストバリュー :無料または超低価格といった価格面での価値
・エクスペリエンスバリュー:カスタマイズや自動化による体験価値
・プラットフォームバリュー:コミュニティ化やエコシステム化といったネットワークされることによる「場」の価値
どのようなバリューを組み合わせて、「自社ならでは」の価値を提供していくのかを考える必要があります。
提供したい価値から収集すべきデータを考えます。AIやデータサイエンスの活用は、顧客中心です。そのため、顧客がどのような行動をするのかを把握しておくことが重要になります。業務プロセスに関連するデータも細かく収集しておくことが大事です。使わないからと言って簡単にデータを上書きしてしまってはいけません。上書き前のデータに価値が出てくる可能性があることを忘れてはいけません。
描いたビジョンを実現するにあたり、ごく一部の人材がデータを活用すれば良いのか、全社員がデータを活用する必要があるのかによって、組織のあり方や、教育の方法が変わります。そして、現場でデータを活用していくためには、現場で課題発見と課題解決をしていくことを促す文化も必要になります。環境変化も激しいので、俊敏性も必要です。このように考えると、AIやデータサイエンスを活用していくというのは組織的なテーマであることをご理解いただけるのではないでしょうか。
上記のような視点で、中長期のビジョンを描き、その上で、一番簡単に手を付けられるプロジェクトから始めていきます。つまり、各個別のプロジェクトは、長期ビジョンを実現するためのステップであるということなのです。そのように考えると、「単発のAIプロジェクトでリターンがないと・・・」と議論しているのは、長期的なビジョンが社内で合意できていない、または浸透できていない可能性があると考えられます。
このように説明すると、途中のプロジェクトはビジョン達成までのステップであって、成功・失敗を検討しても意味がないと聞こえるかもしれません。しかし、それは間違いです。当然、プロジェクトなので成功・失敗があるべきで、プロジェクトの過程で多くのことを学ぶべきです。ただし、成功・失敗をデータの精査前に決めつけるのは危険です。やってみないとわからないわけですから。そのため、データサイエンティストが短時間でデータを精査した上で、プロジェクトの成功・失敗の状態を定義し、マネジメント層に説明と提案を行うことが重要になってきます。そうすることで、期待値ギャップが生じるリスクを低減できます。データサイエンティスト側もマネジメント側も「6ヶ月以内にモデルの精度がX%以上」といった約束をするべきではありません。
ビジョンの実現は、まるで見知らぬ外国への旅のようです。最終目的地はとても素敵な場所だとわかっていても、道中は大変なことがたくさんあります。飛行機から降りて、最初の数日は交通手段で危険な目に遭ってみたり、レストランで法外な料金を請求されたり、思いがけず安くて美味しい食事に出会ったりする中で、その土地の文化や勝手を学んでいくはずです。そして、長時間過ごしている中で、より的確に交通手段やレストランを選べるようになっていくのではないでしょうか。それと同じように、ビジョン実現に向けて動き出した際の初期の個別プロジェクトは、うまく行かないことのほうが多いのは当然です。大事なことは失敗から学び自社に合った方法を模索していくことです。目的地に向かって進む中で、より適切な判断ができるようになり、当初予定していた最終目的地よりももっと良い場所が見つかるかもしれません。
関連記事
ランキングRANKING
WEEKLY週間
MONTHLY月間