データサイエンティストになるためには? 必要なスキルや学習方法を解説
データサイエンティストとは、データを分析してビジネスに役…
データサイエンスが学べる
日本屈指のビジネススクール「datamix」
データサイエンス
2020.05.08
こんにちは、データミックス編集部です。
新型コロナウイルスが毎日のように報道されておりますね。
そのようなご時世の中、感染者数や死亡者率など、数値に基づいて判断することが期待されているかと思いますが、これらはまさにデータ活用の第一歩である「データの可視化」の必要性がより高まっていることを示していると思います。
様々なメディアがわかりやすいデータの開示をしているかと思いますが、
私達も、Pythonライブラリを用いて、簡単にデータの可視化をしてみました。
当初は、厚生労働省のデータを自動的に抽出する所から始めたかったのですが、HPの構成上中々難しそうなことがわかり…、
東洋経済オンライン様が集計してくださっているCSVファイルを使わせていただきました。(Plotlyで使用するために少々加工しております)。
データ参照元:https://github.com/kaz-ogiwara/covid19
今回は、Pythonの可視化ライブラリとして最近流行り始めた「Plotly」を使ってみようと思います。
読者の皆さんの中には「Pythonを一から書くのは難しい」という方も多いかと思いますので、Plotlyがベースとなっている、Web上で無料で使えるBIツール「Plotly Chart Studio」を使ってみようと思います。
上記の公式URLの「Get a demo」ページから必要な項目を入力すると、
無料でサービスを使えます。有償のEnterpriseサービスもあるそうですが、無料サービスでも、25個程度のグラフ作成等ができるので、まずは試してみたいという方は無料のままで大丈夫でしょう。
登録が済んだら、早速使ってみましょう。
巷にあるようなBIツールの使い方で色々と可視化ができます。
とはいえ、全て英語なので、少々使い慣れるのに時間がかかります
「Import」をクリックしてデータをアップロードすることができます。
今回はお借りした新型コロナウイルス(COVID-19)の感染者数のデータをアップロードしてみました。
(CSVファイルだと日本語が文字化けしてしまいましたが、xlsx形式に変更したところ、なぜかうまくいきました…)
あとは、左側にある「Trace」や「Style」の部分を色々をいじってみると、良いでしょう。
試しに、作成してみたチャートをいくつか紹介します。
こちら↓は、都道府県毎の累計新規感染者数の棒グラフです。
うまく綺麗に描けてます。右下にある「EDIT CHART」を押すと、実際に皆さんもBIツール画面で触ることができるはずです。
やはり東京都がダントツで多いですが、次いで大阪府や神奈川県といった人口の多い府県の感染者数が多いですね。
※なお下図に関して、管理画面上で「Share」ボタン => 「Embed」にて、iframeやhtmlといったタグを入手できるので、それを記事内に貼り付けることにより、下図のようなWeb上である程度インタラクティブなグラフを埋め込むことができます。
また、時系列でのグラフも見てみましょう。都道府県別に累計の新規感染者数を日別にプロットしております。
が、少々都道府県が多くて見にくいですね…
そこで、少し都道府県を絞り込んでみましょう。
以下のように、「Structure」=> 「Subplot」にて、ピボットやフィルタリングができる機能もあります。「+Transform」から「Filter」を選択し、Targetを”都道府県”とし、見てみたい都道府県を「Values」にて絞り込んでおります。
今回は、せっかくなので、東京都(緑)に加えて、地方校として進出予定の大阪府(紫)や福岡県(黄)に絞ってみました。
(できれば凡例もFilteringしてもらいたかったのですが、色々探しましたが無理そうでした…)
ということで、今回は無料のPythonライブラリをベースとしたBIツールで、新型コロナの感染者数を可視化してみました。
やはり大手のメディアのような綺麗なサイトを直ぐに作るのは難しそうですが…普通に業務で可視化する程度であれば結構使えるのではないでしょうか。
一方で、細かい所にはやはり手が届かない部分もあるので、
そこまで細かく手を加えたければ、やはり自身でPythonコーディングを行う必要がありそうです。
今後、よりリッチな可視化や、Pythonを使った自動化・可視化などに関する記事も追加していきたいですね。
当社では、Pythonを使いながらデータサイエンスに関する実務的な使い方を学べます。気になる方は、データサイエンティスト育成コースのご案内をご覧ください!
関連記事
ランキングRANKING
WEEKLY週間
MONTHLY月間