本文中使用的Excel表单的内容如下:
int integer float浮点数oojectpypython对象类型,即字典,使用o代表字符串_字符串类型,并且经常使用s 10表示Unicode_ Unicode_固定长度Unicode的长度。与字符串定义方法datestime64 [ns]的方式相同,表明时间格式与字符串和unicode无关,并且页面无法构造这2的数据类型。
结果:
在删除特定列的特定列时,您只需要使用子集参数即可得到很好的判断。
结果:
astype():实现数据类型转换
结果:
异常值的检测方法有三种主要类型:
(1)根据业务经验确定不同指标的正常范围。
(2)绘制盒子图,并在盒子盒子的盒子上部边缘的上边缘的上边缘(或下边缘)调用。
(3)如果数据遵守正态分布,则可以使用3σ的原理。如果数据与平均值之间的偏差超过3σ,那么我们认为该值是一个异常值
通常,有几种处理异常价值的方法:
(1)删除,这是最常用的方式。
(2)将异常值作为缺失值并填充
(3)将异常值视为特殊情况并研究异常值的原因