dataframeやseriesにnullが含まれているかどうかを判定してみます。
isnullメソッドを使います。早速サンプルコードを見てみます。
nanがあるかどうか
今回は以下のような欠損値があるdataframeを使います。
>>> df
C1 C2 C3
R1 NaN 2.0 3
R2 4.0 NaN 6
R3 7.0 8.0 9
R4 10.0 11.0 12
では、isnull()を使って確認してみます。
>>> df.isnull()
C1 C2 C3
R1 True False False
R2 False True False
R3 False False False
R4 False False False
nanが入っているところだけ、trueになっていることがわかります。
nanの数
nanの数を確認してみます。
>>> df.isnull().sum()
C1 1
C2 1
C3 0
dtype: int64
各列に対してnanがいくつあるかを出力してくれます。
nanを埋めるfillna
nanはfillnaメソッドで埋めることができます。
今回はnanを100に置き換えてみます
>>> df.fillna(100)
C1 C2 C3
R1 100.0 2.0 3
R2 4.0 100.0 6
R3 7.0 8.0 9
R4 10.0 11.0 12