今回はkerasが提供しているボストンの住宅価格回帰データセットに
ついて調べた内容をお話します。
データセットの概要
ボストンの住宅価格回帰データセットとは、
ボストン近郊の住宅の価格についてのデータセットになります。
ボストンの各地域の住宅情報が13種類の属性によって表現してあり、
各地域の住宅価格を中央値のデータが保存してあります。
データの内容
まず、以下のコードでデータセットを読み込みます。
import keras from keras.datasets import boston_housing (x_train, y_train), (x_test, y_test) = boston_housing.load_data()
説明変数(X)
説明変数は、各住宅の情報を13個の属性により表現したものになります。
x_trainの最初の要素を見てみます。
print(x_train[0]) # => [ 1.23247 0. 8.14 0. 0.538 6.142 91.7 3.9769 4. 307. 21. 396.9 18.72 ]
x_train[0]地域での住宅を13個の要素により表現されていることがわかります。
目的変数(Y)
地域での住宅価格の中央値によって表されます(単位はk$)。
トレーニング用データの0番目の値を確認してみます。
print(y_train[0]) # => 15.2
コメント