在处理用户提交的内容时,出现这样的问题。用户提交的内容是物化内容,我们很难处理内容过滤判断,所以,需要转成普通中文。通常字符实体用于编码转换。比如用日文编码浏览中文网站,如果网站不是UTF-8编码,就会出现乱码。这个时候怎么办?比如网站是GB2312编码的,我们可以使用下面的代码直接将汉字转换成HTML字符实体,这样就可以兼容各种编码:echomb_convert_encoding('Helloeveryone','HTML-ENTITIES','gb2312');这时候浏览器输出“HelloeveryoneHa”,但是源文件中的代码是:大家好哈想切回去怎么办?其实大可不必,浏览器会转换回来的。如果你一定要问,如何转换回来,你可以这样做:echomb_convert_encoding('大家好哈','gb2312','HTML-ENTITIES');如果要转换整个页面怎么办?不用怕,在网页头部加上下面三句即可:mb_internal_encoding('yourwebsite'sencoding');mb_http_output('HTML-ENTITIES');ob_start('mb_output_handler');原文地址:汉字转HTML字符实体
