【scikit-learn、データセット】糖尿病患者のデータセット

今回はscikit-learnが提供している糖尿病患者のデータセットに ついて調べた内容をお話します。

データセットの概要

糖尿病患者のデータセットとは、 442人分の糖尿病患者のデータになります。 各患者の基本情報と糖尿病の進行状況のデータです。

データの内容

まず、以下のコードでデータを読み込みます。

説明変数(X)

説明変数は患者の基本情報となります。
以下のコードで説明変数について見てみます

各情報については、以下のようになります。

  • age:年齢
  • sex:性別
  • bmi:BMI
  • bp(Average blood pressure):平均血圧
  • s1〜s6:6つの血清データ
Beginner Scikit-learn Linear Regression Tutorial | Kaggle
Download Open Datasets on 1000s of Projects + Share Projects on One Platform. Explore Popular Topics Like Government, Sports, Medicine, Fintech, Food, More. Fle...

データの最初の要素を見てみます。
最初の患者が10つの属性によって表現されています。

目的変数(Y)

次に目的変数を見てみます。

糖尿病の進行度合いが目的変数となります。
25〜346の間の整数で表現されます。

先程の患者(data.data[0])の(data.target[0])は

参考文献

sklearn.datasets.load_diabetes — scikit-learn 0.21.3 documentation

コメント

タイトルとURLをコピーしました