当前位置: 首页 > 科技观察

Excel打开CSV文件后出现乱码问题的两种处理方法

时间:2023-03-14 20:38:12 科技观察

大家好,我是Python进阶。前几天跟大家分享了一些关于乱码的文章。阅读量还不错。有兴趣的朋友可以去:盘点Python网络爬虫过程中的3个中文乱码,UnicodeEncodeError:'gbk'codeccan'tEncodecharacter解决办法,今天根据粉丝的提问,介绍两种处理方法CSV文件在Excel中打开后出现乱码的原因,希望对大家的学习有所帮助。前言前几天有个叫[RSL]的爱好者在Python交流群里问了一个关于用Excel打开CSV文件后出现乱码的问题,如下图。直接在Excel中打开csv文件,如下图:群里提问:看起来真的很大。对于爬虫初学者来说,这段乱码就摆在面前,就像一道拦路石。不过别着急,小编为大家整理了两种方法,专门用来处理CSV文件中的乱码。希望大家以后再遇到这样的乱码,可以在这里得到启发!1.思路其实是为了解决问题重点在于一点,就是编码的转换。这里举两个例子,肯定还有其他的方法,欢迎大家在评论区提意见。2、解决方法一:用notepad++打开因为csv文件本质上是一个文本文件,所以直接用notepad++打开csv文件就不会乱码了。如果抓取网页时指定存储格式为utf-8编码,那么用notepad++打开csv文件是没有问题的。f=open('filename.csv',mode='a',encoding="utf-8")csvwriter=csv.writer(f)如下图:因为我的源文件本身就是韩文和日文的,所以看这是我到达了什么。上图绝对不是乱码。不要误导大家,嘻嘻!方法二:Excel转换这种方法稍微复杂一点,但是比较容易理解。对于初学者来说,还是比较能接受的,直接在Excel中操作,步骤如下。1)打开一个Excel文件,然后点击“数据”-->“来自文本/CSV”,如下图所示。2)之后,选择要加载的CSV文件,会自动弹出如下图。从这里看,原来的文件确实是乱码。接下来,您需要对其进行一些设置。3)文件的原始格式设置为“无”或您的原始编码“UTF-8”;分隔符默认为逗号;数据类型检测选择是基于整个数据集,最后选择右下方的load,如下图。4)稍等片刻,CSV文件会自动加载到Excel中,如下图所示。因为我的源文件是韩文和日文的,所以我看到的是这样的。5)Excel中的显示如下图:看起来比较清爽,这样一来,中文乱码的问题就迎刃而解了。之后,您可以进一步传输到标准Excel文件或进行数据处理。3.总结我是Python进阶。本文根据粉丝的提问,提供了两种用Excel打开CSV文件后出现乱码问题的解决方法,成功帮助粉丝解决了问题。