今更ながら混合行列、Accuracy、Precision、Recall、Specificityをまとめておきます
混合行列
混合行列は2値分類の結果をまとめた行列のことで、
正解のTrue・False、予測のTrue・Falseで構成されています。
具体的には以下のようになっています。
ここでは
- TP はTrue Positive。つまり正しく(True), Positive(正)と判断したもの
- FP = False Positive = 間違えて(False) Positive(正)と判断したもの
- FN = False Negative = 間違えて(False) Negative(負)と判断したもの
- TN = False Negative = 正しく(True) Negative(負)と判断したもの
になっています。
Accuracy、正答率
正答率は、そのまま全体のうち正しく識別できた確率なので以下のようになります。
Precision、精度、適応度
Positiveと予測した中で正しくPositiveと予測できた確率
Recall
正解がPositiveの中で正しくPositiveと予測できた確率
Specificity
Negativeが正解の中で正しくNegativeと予測できた確率
ROCカーブ(工事中)
しきい値ごとに縦軸をTPR、横軸をFPRとした折れ線グラフ。
ROCカーブの例を以下に示します。まず正しく分類可能スコアがあるとき。
- 上段:モデルが予測したスコアの棒グラフ。色がラベル(青がnegative、赤がpositive)。赤の横線が閾値、この閾値を上回ったデータをpositive、下回ったデータをnegativeとするとします。
- 中段:混合行列
- 下段:ROCカーブ
次に正しく分類できないスコアの時。
コメント