缺失值是由于某些原因引起的。通常有两种缺失值的处理方法,无论是删除还是填充(具有一定的值而不是缺少值)。缺少值通常分为两种类型,一个是特定列中缺少数据。另一个是缺少整个数据行,即一个空行。
本文中使用的Excel表单的内容如下:
结果:
从结果中,每列都缺少。在这里特别注意,时间日期类型的数据丢失值由NAT表示,而其他类型则由NAN表示。不要认为丢失值由NAN表示
结果:
从结果来看,该省的列是9个非努力。解释该省具有4个无效的值。以相同的方式,本列中有4个丢失值。此列中有2个缺少值。该列中的这一专栏中有一个缺少的价值。
isnull():确定是否缺少特定值,如果返回到true,否则为false
结果:
dropna():删除缺失的值
结果:
从结果中,dropna()方法将默认情况下删除包含缺失值的行。只要这条线缺乏字段,它将被删除。因此,最终只保留了4个完整的数据记录
结果:
How ='all'表示仅删除所有字段缺少线路,也就是说,仅删除空白行。保留11个记录。仅在第六行中删除差距。
通常有用的0填充,填充平均值,填充人群的数量(大多数时间),向前填充(填充缺少值的相应字段的值,例如缺少D3单元格。值),回填(对应于前填充)和其他方法。
填充():缺乏损失,参数表示要填充的内容。
结果:
从结果中,此方法将在默认情况下填充所有缺失值
结果:
结果:
结果: