当前位置: 首页 > 科技观察

Excel竟然还有这种操作!自动同步网站数据

时间:2023-03-18 22:41:12 科技观察

有时候我们需要从网站上获取一些数据,传统的方法是直接复制粘贴到Excel中。但是,由于网页的结构,并非所有副本都有效。有时即使成功了,得到的也是“死数据”。一旦后面有更新,就要重复上面的操作。能否制作一个与网站自动同步的Excel表格?答案是肯定的,这就是Excel中的PowerQuery函数。1、打开网页  下图为中国地震台网官方网页(http://news.ceic.ac.cn/)。每当发生地震时,都会自动更新到这里。既然我们要抓取,就必须先打开这个网页。首先打开要抓取的网页2.确定抓取范围  打开Excel,点击“数据”→“获取数据”→“来自其他来源”,粘贴要抓取的网址。这时PowerQuery会自动对网页进行分析,然后将分析结果显示在框架中。以本文为例,PowerQuery分析两组表,点击找到我们需要的那一组,然后点击“转换数据”。片刻之后,PowerQuery将自动完成导入。3.数据清洗  导入完成后,可以通过PowerQuery进行数据清洗。所谓“清理”,简单来说就是一个预筛选过程,我们可以在其中选择我们需要的记录,或者对不需要的列进行删除和排序。其中,右键负责删除数据列,面板中的“保留行”用于筛选你需要的记录。清理完毕后,点击左上角的“关闭并上传”即可上传Excel。数据“预清洗”4.格式调整  数据上传Excel后,可以继续格式化。这里的处理主要包括修改表格样式、文字大小、背景色、对齐方式、行高列宽、添加标题等,总的来说就是一些美化操作,最后得到下图这个表格。对表格做一些美化5.设置自动同步间隔  目前表格的基础已经完成,但是就像复制粘贴一样,此时得到的仍然只是一堆“死数据””。如果想让表格自动更新,需要点击“查询工具”→“编辑”→“属性”,勾选“刷新频率”和“打开文件时刷新数据”。处理完成后,表就可以自动同步了。设置内容自动同步注意:默认情况下,数据刷新会导致列宽变化。这时候可以点击“表格工具”→“外部表格数据”→“属性”,取消“调整列宽”前面的复选框即可解决这个问题。防止更新时破坏表格格式,写在末尾  这个技巧很实用,尤其是做一些动态报表的时候,可以大大减少手动提取带来的麻烦。嗯,这就是本期要分享给大家的一个小技巧,是不是很有用呢!