在获得或生成数据源后,您应该在分析数据之前熟悉数据,并在分析之前通常了解数据形式和结构。
本文中使用的Excel文件的内容如下:
当文件中的数据太多或数据库记录太大时,建议一次获得或检查所有数据库。:预览先前行的数据。在默认情况下,这是金钱5行数据
结果:
结果:
形状:获取数据表大小,即有几行数据表。结果是一个元组,由(行数,列数)组成
结果:
(12,5)
注意:这里的行数不计算标题。
info():在当前数据表中获取每列的数据类型
结果:
描述():获取当前数据表中具有类型的列的分布
结果:
注意:因为仅表格中的指示器是数字,所以结果仅显示此列的统计信息
输出内容说明:
其中,计数是数字,这意味着有12个记录。
平均值是平均值
性病是标准偏差
最小值是最小值
最大值是最大值
后三个正在描述统计数据,只了解它
25%是25%百分比
50%至50%
75%是第75个百分点