実践 Python データサイエンス@Udemy の理解度を試すために、使用電力量と電気代推移データを使って実践してみる

現在、実践 Python データサイエンス講習を3分の1程度消化したところ。

初学者でも分りやすい構成で、とても良いです。

ただ、言われた通りに練習しているだけだと身についた感じがしないので、これまでの「numpyを知ろう」「pandas入門」辺りの内容を組み合わせて、自前のデータを可視化してみます。

使うのは以下のデータです。東電の電気家計簿から取得した、我が家の月ごとの消費電力量と電気代。

これをexcelファイルとしてダウンロードしてDataFrame化した後、単純にbarplotしてみると、こうなります。

だからどうしたって感じのグラフが出来上がりました。

月ごとのデータを年ごとに並べて表示した方が、比較検討しやすいですよね。要するに東電の電気家計簿のグラフ表示形式なんですが…。

そんな形でプロットしやすくするため、元データをちょっと加工します。

まずは元データの中身を把握。

「年月」カラムを、「年」カラムと「月」カラムに分離します。

でもここで問題が。

data[29]の年月カラムだけ、文字列フォーマットが異なります。「3/1」になってるのは何故だ…。

とりあえず他と揃えます。

元のデータフレームに新しいカラムとして追加します。

いい感じです。

このデータを、hueオプションに年カラムを指定しつつ、barplotで描画します。

これでほぼ目的は達成できたんですが、2013年のデータが10月から始まっているせいで、スタート地点が中途半端です。

思い切って2013年のデータは削除し、ついでに請求金額も描画してみます。

こうして出来上がったのが、以下の使用量総計推移グラフ。

こちらは請求金額推移グラフ。

こうしてみると、2014年と比較して、2015,2016年は電力使用量がかなり減っているのがわかりますね。

これまでに実践 Python データサイエンス@Udemy講習で学んだことの1割程度しか活用できてませんが、この講習を受けると、こんなことがPythonで出来るようになりますよ、という宣伝でした。

講師の方の回し者ではございませんが、とても分りやすい講習内容だと思うので、興味のある方は是非どうぞ。

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする