当前位置: 首页 > 科技观察

每日两技能:Pandas和Docker的使用技巧

时间:2023-03-21 14:06:13 科技观察

pandas读取headlessCSV我们知道CSV一般是这样的:其中,第一行的姓名、薪水、工作称为CSV的header。一般情况下,CSV是有头部的,所以我们在使用pandas读取CSV时很方便:importpandasaspddf=pd.read_csv('example.csv')print(df)效果如下图所示:但是有时候,一些特殊的CSV文件可能没有标题。例如,它们可能是这样的:这种情况下,如果直接使用pandas读取,第一行数据就会成为表头,如下图所示。但这显然不是我想要的结果:为了解决这个问题,有两种方案。第一种方法是用文本编辑器打开CSV文件,手动添加标题,然后保存。然后用pandas来读。第二种方法是在pandas读取的时候加一个参数names,它的值是一个list,也就是header:importpandasaspddf=pd.read_csv('example.csv',names=['name','salary','work'])print(df)运行效果如下图所示:Dockerbuild提升apt-get的速度在国内使用Docker构建基于Ubuntu的镜像时,默认使用官方源。由于众所周知的原因,构建速度可能会很慢。如果是Ubuntu直接运行宿主机,我们可以使用vim或者图形界面修改源,使用阿里源来提高速度。如果在Docker中呢?我们可以使用Linux文本处理三剑客之一的sed来非交互地修改源文件。在Docker中添加如下两行语句:RUNsed-is@/archive.ubuntu.com/@/mirrors.aliyun.com/@g/etc/apt/sources.listRUNapt-getclea它的作用是把/etc/apt/将sources.list文件中的archive.ubuntu.com全部替换为mirrors.aliyun.com。从而提高速度。所谓Linux文本处理三剑客,指的就是grep、awk和sed。只要掌握常用的用法,就可以大大提高你的开发效率。本文转载自微信公众号“闻所未闻的密码”,可通过以下二维码关注。转载本文请联系Code公众号。