機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

【keras、データセット】住宅価格回帰データセット(boston_housing)

今回はkerasが提供しているボストンの住宅価格回帰データセット
ついて調べた内容をお話します。

データセットの概要

ボストンの住宅価格回帰データセットとは、
ボストン近郊の住宅の価格についてのデータセットになります。
ボストンの各地域の住宅情報が13種類の属性によって表現してあり、
各地域の住宅価格を中央値のデータが保存してあります。

データの内容

まず、以下のコードでデータセットを読み込みます。

import keras
from keras.datasets import boston_housing

(x_train, y_train), (x_test, y_test) = boston_housing.load_data()

説明変数(X)

説明変数は、各住宅の情報を13個の属性により表現したものになります。

x_trainの最初の要素を見てみます。

print(x_train[0])
# => 
[  1.23247   0.        8.14      0.        0.538     6.142    91.7
   3.9769    4.      307.       21.      396.9      18.72   ]

x_train[0]地域での住宅を13個の要素により表現されていることがわかります。

目的変数(Y)

地域での住宅価格の中央値によって表されます(単位はk$)。

レーニング用データの0番目の値を確認してみます。

print(y_train[0])
# => 15.2

参考文献

https://keras.io/ja/datasets/