DataFrameの各列のデータのヒストグラムを作ったので、メモしておきます。
データセットとして、ボストン住宅データセットを使います。
では、作成していきます。
環境としては、以下のようになります。
- python 3.6
- pandas 1.1.5
まずデータ読み込みます。
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
dataset = load_boston()
df = pd.DataFrame(dataset.data,columns=dataset.feature_names)
では、各列のヒストグラムを作成します。
DataFrameのhistメソッドを使います。
plt.rcParams['font.size'] = 10
fig, ax = plt.subplots(figsize=(10,10))
df.hist(ax=ax)
綺麗にできました!pandasとmatplotlibに感謝です。
githubにもあげてあります。
参考文献
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.hist.html