Pandas中的缺失值怎么处理

在Pandas中,处理缺失值的方法通常有以下几种:

删除缺失值:可以使用dropna()方法删除含有缺失值的行或列,参数axis可以指定是删除行还是删除列。

df.dropna()  # 删除含有缺失值的行
df.dropna(axis=1)  # 删除含有缺失值的列

填充缺失值:可以使用fillna()方法填充缺失值,可以指定填充的值,如0、平均值、中位数等。

df.fillna(0)  # 将缺失值填充为0
df.fillna(df.mean())  # 将缺失值填充为列的平均值

插值填充:可以使用interpolate()方法进行插值填充,根据缺失值前后的值进行插值填充。

df.interpolate()  # 插值填充缺失值

使用其他值代替缺失值:可以使用replace()方法将缺失值替换为其他指定的值。

df.replace(np.nan, -1)  # 将缺失值替换为-1
阅读剩余
THE END