今回はpandasのDataFrameの行の削除方法を紹介します。
今回は以下のようなデータを使います。
>>> import pandas as pd >>> df = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9],[10,11,12]], ... index=["R1", "R2","R3","R4"], ... columns=["C1","C2","C3"]) ... >>> df C1 C2 C3 R1 1 2 3 R2 4 5 6 R3 7 8 9 R4 10 11 12
指定した1行の削除
>>> df.drop("R2") C1 C2 C3 R1 1 2 3 R3 7 8 9 R4 10 11 12
指定した2行の削除
>>> df.drop(["R2","R3"]) C1 C2 C3 R1 1 2 3 R4 10 11 12
n行目以降の削除
>>> df.drop(df.index[:2]) C1 C2 C3 R3 7 8 9 R4 10 11 12
n行目までの削除
>>> df.drop(df.index[2:]) C1 C2 C3 R1 1 2 3 R2 4 5 6
n〜mまでの行の削除
>>> df.drop(df.index[1:3]) C1 C2 C3 R1 1 2 3 R4 10 11 12
参考文献
現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法