当前位置: 首页 > 后端技术 > Node.js

NPM酷库040:jschardet,识别数据编码

时间:2023-04-04 00:08:16 Node.js

NPM酷库,每天两分钟了解一个流行的NPM库。·在npm酷库039中,我们实现了iconv-lite库可以将任意字符编码转换为JavaScript内置的Unicode编码,使我们的程序可以友好的与外部系统对接。但是如果我们不知道外部数据的编码方式,那么我们就不能调用iconv-lite来进行转换。jschardetjschardet可以识别一个Buffer数据使用的编码格式。具体支持的格式包括:Big5、GB2312/GB18030、EUC-TW、HZ-GB-2312、ISO-2022-CN(繁体和简体中文)EUC-JP、SHIFT_JIS、ISO-2022-JP(日文)EUC-KR和ISO-2022-KR(韩语)KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5和windows-1251(俄语)ISO-8859-2和windows-1250(匈牙利语)ISO-8859-5和windows-1251(保加利亚语)windows-1252ISO-8859-7和windows-1253(希腊语)ISO-8859-8和windows-1255(视觉和逻辑希伯来语)TIS-620(泰语)UTF-32BE,LE,3412-ordered,or2143-ordered(withaBOM)UTF-16BEorLE(withaBOM)UTF-8(withorwithoutaBOM)ASCII我们可以方便的使用jschardet库:constjschardet=require("jschardet");//Big5jschardet.detect("\xa6\xb8\xb1\x60\xa5\xce\xb0\xea\xa6\x72\xbc\xd0\xb7\xc7\xa6\x72\xc5\xe9\xaa\xed");//{encoding:"Big5",confidence:0.99}参考https://github.com/aadsm/jsch...