データサイエンティストになるためには? 必要なスキルや学習方法を解説
データサイエンティストとは、データを分析してビジネスに役…
データサイエンスが学べる
日本屈指のビジネススクール「datamix」
データサイエンス
2020.05.14
新型コロナウイルスの影響で、これまで対面で行っていた授業を全面的にオンラインに切り替えています。これまで対面の授業であれば、講師と受講生との間で「最近どうですか?」といったちょっとした雑談をしていたのですが、オンライン授業の場合、こうした雑談をしにくくなってしまいました。
そこで、解決策として、事前予約制でオンラインのオフィスアワーを日々行っています。受講生は好きな講師を選び、講師が空いている時間に面談を予約することができます。
オフィスアワーでは、様々な質問が出ますが、中でも
・データサイエンティストになるためにはどこまでできれば良いのか?
・自分の経歴でデータサイエンティストとして転職は可能なのか?
・今の会社に留まるのが良いのか、他の会社に行ったほうが良いのかわからない。
といったキャリアに関する質問をされることが多いと感じます。
そこで、今回はデータミックスの卒業後のキャリアについて書きたいと思います。
データミックスを卒業後、転職してデータサイエンティストの仕事に就く受講生は、もともとどんな仕事に就いていたのでしょうか?
以下は一例ですが、眺めてみましょう。
・広告代理店の営業職
・ソフトウェア会社の営業職
・人材紹介会社の営業職
・ECサイトの企画職
・建設会社の企画職
・塾の運営・オペレーション職
・マーケティングリサーチャー
・インフラエンジニア
・ソフトウェアエンジニア などなど
このように見ると、かなり幅広い職種だと感じていただけるのではないでしょうか(実は年齢も20代から40代までと幅広いです)。
データサイエンティストとして転職した受講生の中には、入学時はデータサイエンスの知識もなく、プログラミングも全然できなかった人がほとんどです。
このように元の仕事も、年齢も、入学時点の知識もスキルも関係ない・・・
では、データサイエンティストとして転職する人の共通点は何でしょうか?
それは以下の2つだと考えています。
1.自分で疑問点を挙げて調べることができる
2.卒業プロジェクト(インテグレーションステップ)で徹底的にデータと対話したという実務に近い経験
この2つの点について説明していきたいと思います。
データサイエンティストとして転職する受講生のうち、知的好奇心が旺盛な方が多いと感じます。例えば、授業で学んだ内容を復習する中で消化不良の部分はどんどん質問する(データミックスではオンラインの質問フォーラムがあります)、自分で文献を調べてくるといったことを日々やっています。中には、自分の会社で使うとしたら、どのように分析技術が使えるのかを調べてきて、授業の範囲ではない技術まで調べてきて質問される方もいました。
このように、自分で気になることがあったら自力で調べて前進させる力はデータサイエンティストになるために非常に重要だと感じます。なぜなら、実務でデータサイエンスをやっていく中では、自分で新しい技術を吸収しつづけなくてはならないためです。データミックスでは限られた時間の中でデータサイエンスを広く浅く学び、基礎を固めます。そこから上のレベルを目指すには、自分で学習していく心構えが不可欠です。そのような心構えを受講期間中から実践できている方は、やはりデータサイエンティストに求められるマインドセットを持ち合わせているのだと思います。
データミックスの最後の1ヶ月である「インテグレーションステップ」は転職を考えている受講生にとって、非常に重要な期間です。インテグレーションステップとは、受講生自身でプロジェクトを企画し、データの収集から分析、レポート作成までの一連の流れを実際に行う、「卒業制作プロジェクト」です。
なぜ、このインテグレーションステップが重要なのでしょうか?
それは、実際にデータから示唆を出せるかどうかを示すデモンストレーションになるためです。正直なところ、データサイエンティストは専門職なので、未経験で内定を勝ち取るのは決して簡単ではありません。そのような中で、インテグレーションステップで一定の成果を出せれば、実務ではないものの、十分なアピール材料になります。実際、インテグレーションステップにいらっしゃった企業の人事の方が、ある受講生の発表を見て、その場でスカウトするようなケースもありました。
では、質の良いアウトプットを出すにはどうしたら良いのでしょうか?
押さえておいていただきたい点が3つあります。
1つ目は、データを徹底的に理解することです。材料であるデータを正しく理解しない限り、意味のあるアウトプットは出せません。ついつい機械学習アルゴリズムや統計モデルに安易にデータを突っ込んで、分析を進めてしまいがちですが、それでは有用な示唆を出すことはできません。仮説を立てて、グラフを描き、グラフを眺めるというサイクルを回し続け、データを十分理解していくことをサボらないことが重要です。もしPythonやRでコーディングするのが苦手で時間的に厳しいのであれば、エクセルやBIツールを使ってどんどんグラフを描いていくのが重要です。コーディングする時間よりもグラフを眺めている時間が長くあるべきだと個人的には思います。
2つ目は、粘り強く、データのクレンジングや整形をやりきることです。インテグレーションステップでは、自身でデータを収集しているので、欠損値ばかりの決してきれいとは言えないデータと格闘することになります。そうなると、自分で考えた分析アプローチを実現するためには、データクレジングを行い、整形していく必要があります。さらに、整形したデータを統計モデルや機械学習アルゴリズムに投入しても期待していた結果が出ず、試行錯誤を繰り返すことになります。その試行錯誤の先に、ビジネスの成果につながる発見に至るのです。そのため、全体を通して、粘り強さは大事なポイントだと考えます。
3つ目は、プレゼンテーションの準備です。データ分析と関係ないじゃないか、と思う方もいるかもしれませんが、そんなことはありません。データ分析は最終的に意思決定に活用されて初めて意味があります。そのため、発表を聞いている人にわかりやすく伝える必要があります。インテグレーションステップの発表会では、既卒生や在校生、データサイエンティストを採用したい企業の方など、様々なオーディエンスがいます。そのため、業界特有の言葉はわかりやすく言い換えたり、例や比喩を使ったりして工夫をするなど、相手の立場になってプレゼンテーションの準備をすることが重要です。
このように、全体を通じて、データと粘り強く向き合い示唆を出すことと、それをわかりやすく伝えることに注意すれば、十分、転職する際のアピールになるアウトプットを出せると思います。
データミックスでは、受講生を中心にデータサイエンス分野に特化した人材紹介サービスを行っております。就転職希望者の方のうち96%が、データサイエンス分野での仕事に就いています。受講後に転職をお考えの方は、無料のキャリア相談や採用企業を招いたセミナーなども行っております。ぜひお気軽にご相談ください。
関連記事
ランキングRANKING
WEEKLY週間
MONTHLY月間