在日常使用pandas的过程中,由于我们分析的数据表的规模和格式的差异,同样的功能或效果不同数据的方法是不同的。而且pandas有自己的一套“参数设置系统”,可以帮助我们在遇到不同的数据时灵活调整,以达到最佳效果。本文将介绍pandas常用的参数设置知识。1.设置DataFrame中显示的最大行数pandas设置参数中的display.max_rows用于控制打印的DataFrame中显示的最大行数。我们使用pd.set_option()对参数进行相应的设置,如下例所示:2修改display.max_rows的参数值后,我们的数据框将只显示指定行数的数据,中间部分将以省略号的形式显示。当我们的数据框有大量的行时,我们可以增加这个参数来显示更多的数据行。2.设置DataFrame中显示的最大列数,类似display.max_rows。通过修改display.max_columns,我们可以调整数据框中显示的最大列数(默认为20列)。这是当我们有很多数据框字段并想要查看它们时。非常有用:图33.设置每列的最大显示宽度。对于一些单元格内容长度比较长的数据,比如长文本,在查看数据框的时候会把过长的部分简化为省略号,我们可以通过修改display.max_colwidth参数,在需要的时候也可以将过长的部分显示出来:图44.指定小于某个数的元素显示为0通过display.chop_threshold参数,我们在不修改原始数据的情况下,指定数据框中绝对值小于阈值的数显示为0:图55.格式化浮点数我们可以通过display.float_format参数来设置浮点数的显示格式。比如这里我们给浮点数加一个¥前缀,设置小数点后两位:图66.设置info()方法中检查非缺失值的行数上限。数据框的info()方法可以帮助我们查看数据框的一些概览信息,比如每一列对应的非缺失值个数。但是默认情况下,当dataframe的行数大于1690784行时,再检查info()信息,为了计算效率,会省略掉缺失值检查信息。这时候我们可以通过设置display.max_info_rows参数来增加上限:图77控制小数打印的精度控制数据框中小数的显示精度除了上面提到的方法,还可以修改参数display.precision控件,默认小数点后6位:图88.临时修改参数有时候我们只想修改某个表上的设置参数,不想影响后面其他表的显示。这时除了用pd.reset_option()恢复指定参数外,我们还可以使用with关键字配合pd.option_context将指定参数临时应用到本地作用域:图9
