当前位置: 首页 > 后端技术 > Java

最新名称正则化,支持小数“·”,使用字符集GB18030编码

时间:2023-04-01 20:58:22 Java

preg_match('/^([\x{4E00}-\x{9FFF}]|[\x{3400}-\x{4DBF}]|[\x{20000}-\x{2A6DF}]|[\x{2A700}-\x{2B738}]|[\x{2B740}-\x{2B81D}]|[\x{2B820}-\x{2CEA1}]|[\x{2CEB0}-\x{2EBE0}]|[\x{30000}-\x{3134A}])+[·?]?([\x{4E00}-\x{9FFF}]|[\x{3400}-\x{4DBF}]|[\x{20000}-\x{2A6DF}]|[\x{2A700}-\x{2B738}]|[\x{2B740}-\x{2B81D}]|[\x{2B820}-\x{2CEA1}]|[\x{2CEB0}-\x{2EBE0}]|[\x{30000}-\x{3134A}])+$/u','有趣');基本汉字的Unicode编码范围是[4e00-9fa5],但是很多生僻字无法匹配,2000年发布的国标GB18030字符集包含了更多的汉字。