【Pandas】欠損値nanが含まれているかどうか判定 isnull

dataframeやseriesにnullが含まれているかどうかを判定してみます。

isnullメソッドを使います。早速サンプルコードを見てみます。

nanがあるかどうか

今回は以下のような欠損値があるdataframeを使います。

>>> df
      C1    C2  C3
R1   NaN   2.0   3
R2   4.0   NaN   6
R3   7.0   8.0   9
R4  10.0  11.0  12

では、isnull()を使って確認してみます。

>>> df.isnull()
       C1     C2     C3
R1   True  False  False
R2  False   True  False
R3  False  False  False
R4  False  False  False

nanが入っているところだけ、trueになっていることがわかります。

nanの数

nanの数を確認してみます。

>>> df.isnull().sum()
C1    1
C2    1
C3    0
dtype: int64

各列に対してnanがいくつあるかを出力してくれます。

nanを埋めるfillna

nanはfillnaメソッドで埋めることができます。

今回はnanを100に置き換えてみます

>>> df.fillna(100)
       C1     C2  C3
R1  100.0    2.0   3
R2    4.0  100.0   6
R3    7.0    8.0   9
R4   10.0   11.0  12

参考文献

https://colab.research.google.com/drive/1DyhSPuFeM3tSqJwQJnRbOE6m_FdXL2Tb#scrollTo=WpK3LZ-9uets

タイトルとURLをコピーしました