[Python]seabornライブラリが超便利な件[初学者必見]
こんにちは。kakeです。
今回はPythonのseabornライブラリが超便利だったということを備忘録的に残しておこうと思います。例も載せてあるので、初学者の方は参考にしてみてください。
スポンサードサーチ
Contents
[Python]seabornライブラリが超便利な件[初学者必見]
今回はkaggleにあるタイタニックのデータを使っていきます。
Pythonのseabornライブラリとは
seabornライブラリとはグラフ描画をするためにあるライブラリでして、matplotlibというライブラリに比べて簡単に手軽にグラフがかけるというのが特徴です。
seaborn使い方の例(準備編)
kaggleにあるタイタニックのデータを元に解説していきます。まずは、ライブラリのインポートからはじめます。以下の通りです。
ライブラリのインポート
import seaborn as sns
import pandas as pd
これでOKです。次に、kaggleのタイタニックデータを読み込みます。
データ読み込み
df = pd.read_csv('./Downloads/titanic/train.csv')
df.head()
jupyter notebookで見ると以下の通りです。
これで準備完了です。
seaborn使い方の例(実践編)
さてseabornを使う準備ができたので、実際にグラフを書いていこうと思います。
相関をヒートマップで可視化する(heatmap)
まず、データの相関を見ることはデータ分析する上で大切なので、ヒートマップで可視化します。
sns.heatmap(df.corr())
たったのこれだけで、簡単にそして割と綺麗にヒートマップがかけちゃいます。素晴らしいライブラリですね。
男女ごとに生死を棒グラフで表す(countplot)
男女でどのような差がありそうかを調べるために、使います。言葉で説明するよりみた方が早いです。
sns.countplot("Sex",data=df, hue="Survived")
めちゃくちゃ楽じゃないですか?たったの一行で、これだけ綺麗にかけるので、便利です。
実はseabornというライブラリについてあまり知らなかった時、以下のように長いコードを書いてしまいました。無駄でした。
plt.figure(figsize=(8, 4))
bar_width = 0.4
sex = ['male', 'female']
i = [0,1]
for sex,i in zip(sex, i):
plt.bar(i, df[df['Sex']== sex]['Survived'].value_counts()[0], color='red', width=bar_width, label='0')
plt.bar(i + bar_width, df[df['Sex']== sex]['Survived'].value_counts()[1], color='blue', width=bar_width, label='1')
plt.xticks(x + bar_width/2, df['Sex'], fontsize=20)
plt.legend()
plt.show()
データ分布をみる(pairplot)
sns.pairplot(df)
データ分布をみる(jointplot)
pairplotに似ているやつでして、特にみたいところをみれます。みた方が早いです。以下です。
sns.jointplot(x="Age",y="Fare",data=df)
箱ひげ図などの分布可視化(factorplot)
sns.factorplot(x="Pclass",y="Age",data=df,kind="box",hue="Sex",col="Survived")
seabornは他にもまだまだたくさんのグラフがかけます
今回紹介したのは本当にごく一部です。他にもいろんなグラフがかけてデータの可視化ができます。
Seabornの全メソッドを解説(その1:グラフ一覧)
本記事は以上になります。