preg_match('/^([\x{4E00}-\x{9FFF}]|[\x{3400}-\x{4DBF}]|[\x{20000}-\x{2A6DF}]|[\x{2A700}-\x{2B738}]|[\x{2B740}-\x{2B81D}]|[\x{2B820}-\x{2CEA1}]|[\x{2CEB0}-\x{2EBE0}]|[\x{30000}-\x{3134A}])+[·?]?([\x{4E00}-\x{9FFF}]|[\x{3400}-\x{4DBF}]|[\x{20000}-\x{2A6DF}]|[\x{2A700}-\x{2B738}]|[\x{2B740}-\x{2B81D}]|[\x{2B820}-\x{2CEA1}]|[\x{2CEB0}-\x{2EBE0}]|[\x{30000}-\x{3134A}])+$/u','有趣');基本汉字的Unicode编码范围是[4e00-9fa5],但是很多生僻字无法匹配,2000年发布的国标GB18030字符集包含了更多的汉字。
