ブログ

Blog

データサイエンス(Data Science)とは?

データミックスメディア編集長の藤田です。

今日は、基本に立ち返って「データサイエンス(Data Science)」とは何かを考えてみたいと思います。

というのも、「データサイエンス」と言うワードを、データサイエンティストではない人からするとイメージが難く、また、人と話していても「データサイエンス」という言葉に対し、相手が全く異なるものをイメージしているな、と感じることが幾度もありました。

この記事によって、皆さんがデータサイエンスについて「自分なりの理解」を持っていただけたら幸いです。

ウィキペディアによるデータサイエンティストの定義

まずは、ウィキペディアによる定義を見てみましょう。以下のように書かれています。

「データサイエンス(data science)とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。データサイエンスを、統計的、計算的、人間的視点から俯瞰することができよう。それぞれの視点がデータサイエンスを構成する本質的な側面であるが、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である。これまでのデータ解析における現場の知識の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる」
引用元:https://ja.wikipedia.org/wiki/データサイエンス

???これはウィキペディアに無償で記事を提供されている筆者には大変心苦しいのですが、正直言葉が難しくて何を言っているのか、いまいち理解ができません…

データサイエンスを、よりシンプルに説明すると

データサイエンスとは何か。その一般的にも理解ができる説明をする為に、データサイエンスの専門家であるデータサイエンティストが行っているタスクから紐解いてみたいと思います。

彼らは日々何をしているのでしょうか。

会社の規模や組織によって違いはあると思いますが、
私はこれまで、アマゾンとツイッターでデータサイエンティストと働いた経験があります。

その経験からは、データサイエンティストは以下のようなタスクをこなしています。

  1. ユーザーの行動や会社の取引などのログをデータとして蓄積・整理する
  2. 整理されたデータから必要な情報を抽出する
  3. データを可視化する
  4. データを分析する
  5. KPIや指標を定義する
  6. KPIや指標をトラッキングする
  7. データからの示唆(インサイト)を関係者に説明し、意思決定を促す
  8. プロダクトの機能のABテストや実験(Experimentation)を行う
  9. モデルを作り将来の取引量や指標を予測する
  10. プロダクトにレコメンドエンジンなどの自動最適化機能を実装する

 

比較的細かく書きましたが、まとめると、

データサイエンティストは、会社がデータを生成して蓄積・加工・利用し価値を実現するまでの一連の役割を担っていると言えると思います。

上記1〜10のタスクを一連の役割に紐づけると以下のようになります。

生成・蓄積(1) → データ抽出(2,3) → 加工(4,5,6) → 利用 (7,8,9,10)

 

つまり、データサイエンスとは何か。その答えは

データサイエンティストが上記役割を担うのに必要な理論・技術の総称を意味しています。

データサイエンスと他分野との関係による理解

言葉で説明を聞いてもいまいち分かりにくい人もいると思うので、他の分野との関係性で整理してみたいと思います。

データサイエンスは分野としては若く、以下の3分野と多くの部分で重複しています。

  • コンピューターサイエンス
    • データエンジニアリング(取引等のログ蓄積・整理)
    • プログラミング(分析やモデリングのためのコーディング)
  • 数学・統計学
    • モデリングの理論
    • 分析・検証の理論
  • 経営学(ビジネス)
    • ロジカルシンキング(課題設定と分析結果の解釈)
    • ビジネスモデルやドメイン知識
    • プレゼンテーション(分析結果の伝達)

図でまとめると以下のような感じです。この図で理解するのが一番分かりやすいかもしれませんね。

 

実際には、全てが得意な人は少なく、データサイエンティストの中でも、組織や役割、個性によって、使っているスキルに濃淡があるのが実情です。

データミックス のスクールでは、さらに詳しくデータサイエンスやデータサイエンティストについて説明しています。
気になる方は、説明会に遊びに来てみてください。