Inside of data science
データサイエンスに纏わる様々な視点を発信しています

Python データサイエンティスト

東京・大阪・福岡など主要都市の新型コロナウイルス感染者数をPythonライブラリで簡単に可視化してみた

こんにちは、データミックス編集部です。

新型コロナウイルスが毎日のように報道されておりますね。
そのようなご時世の中、感染者数や死亡者率など、数値に基づいて判断することが期待されているかと思いますが、これらはまさにデータ活用の第一歩である「データの可視化」の必要性がより高まっていることを示していると思います。

様々なメディアがわかりやすいデータの開示をしているかと思いますが、
私達も、Pythonライブラリを用いて、簡単にデータの可視化をしてみました。

当初は、厚生労働省のデータを自動的に抽出する所から始めたかったのですが、HPの構成上中々難しそうなことがわかり…、
東洋経済オンライン様が集計してくださっているCSVファイルを使わせていただきました。(Plotlyで使用するために少々加工しております)。

データ参照元:https://github.com/kaz-ogiwara/covid19

さて、今回は、Pythonの可視化ライブラリとして最近流行り始めた「Plotly」を使ってみようと思います。さらに、読者の皆さんの中には「Pythonを一から書くのは難しい」という方も多いかと思いますので、
Plotlyがベースとなっている、Web上で無料で使えるBIツール「Plotly Chart Studio」を使ってみようと思います。

上記の公式URLの「Get a demo」ページから必要な項目を入力すると、
無料でサービスを使えます。有償のEnterpriseサービスもあるそうですが、無料サービスでも、25個程度のグラフ作成等ができるので、まずは試してみたいという方は無料のままで大丈夫でしょう。

登録が済んだら、早速使ってみましょう。「+Create」=>「Chart」をクリックすると、


以下のようなBIツール画面に遷移します。

あとは、巷にあるようなBIツールの使い方で色々と可視化ができます。
とはいえ、全て英語なので、少々使い慣れるのに時間がかかります

「Import」をクリックしてデータをアップロードすることができます。
今回はお借りした新型コロナウイルス(COVID-19)の感染者数のデータをアップロードしてみました。
(CSVファイルだと日本語が文字化けしてしまいましたが、xlsx形式に変更したところ、なぜかうまくいきました…)

あとは、左側にある「Trace」や「Style」の部分を色々をいじってみると、良いでしょう。
試しに、作成してみたチャートをいくつか紹介します。

こちら↓は、都道府県毎の累計新規感染者数の棒グラフです。
うまく綺麗に描けてます。右下にある「EDIT CHART」を押すと、実際に皆さんもBIツール画面で触ることができるはずです。

やはり東京都がダントツで多いですが、次いで大阪府や神奈川県といった人口の多い府県の感染者数が多いですね。

※なお下図に関して、管理画面上で「Share」ボタン => 「Embed」にて、iframeやhtmlといったタグを入手できるので、それを記事内に貼り付けることにより、下図のようなWeb上である程度インタラクティブなグラフを埋め込むことができます。

また、時系列でのグラフも見てみましょう。都道府県別に累計の新規感染者数を日別にプロットしております。
が、少々都道府県が多くて見にくいですね…

そこで、少し都道府県を絞り込んでみましょう。
以下のように、「Structure」=> 「Subplot」にて、ピボットやフィルタリングができる機能もあります。「+Transform」から「Filter」を選択し、以下のようにTargetを”都道府県”とし、見てみたい都道府県を「Values」にて絞り込んでおります。

今回は、せっかくなので、東京都(緑)に加えて、地方校として進出予定の大阪府(紫)や福岡県(黄)に絞ってみました。
(できれば凡例もFilteringしてもらいたかったのですが、色々探しましたが無理そうでした…)

ということで、今回は無料のPythonライブラリをベースとしたBIツールで、新型コロナの感染者数を可視化してみました。
やはり大手のメディアのような綺麗なサイトを直ぐに作るのは難しそうですが…普通に業務で可視化する程度であれば結構使えるのではないでしょうか。

一方で、細かい所にはやはり手が届かない部分もあるので、
そこまで細かく手を加えたければ、やはり自身でPythonコーディングを行う必要がありそうです。
今後、よりリッチな可視化や、Pythonを使った自動化・可視化などに関する記事も追加していきたいですね。

当社では、Pythonを使いながらデータサイエンスに関する実務的な使い方を学べるので、是非気になる方は、データサイエンティスト育成コースに関する情報を見てもらえると良いかと思います!

ご興味のある方は、ぜひ説明会にお申込みください!
お申込はこちらからお願いします。

«
»

ブログ一覧