当前位置: 首页 > 后端技术 > PHP

利用AI对文章摘要进行汇总,发布到微头条,达到最佳的SEO优化效果

时间:2023-03-29 16:33:26 PHP

阅读文章前,先上传一张图片,看看我们要达到的实际效果。这是一个自动操作过程。由于自动化流程是基于chrome插件实现的,实现起来比较简单,所以这方面我这里就不分析了(关于chrome插件自动化实现的思路,我会在下篇分析)博文)。这里我只对如何实现文章的总结和混淆实现伪原创的过程做一个总结。1.抓取文章正文。使用chrome插件获取页面的HTML富文本内容,过滤掉HTML标签,获取纯文本内容。正则表达式为:“/<[^>]*?>/ig”。2.总结文章的提要。这里直接使用现成的新闻摘要提取接口:http://showdoc.dagoogle.cn/index.php/Home/page/index?page_id=1273。文章内容混淆实现伪原创和自动伪原创思路有好几万,最好的就是自动改写,但是要实现自动改写,一般的手段是做不到的,所以我只尝试抓取每日热点5118.com网站(接口https://www.jsanai.com/hotwords)的关键词自动混淆,并提供php下html富文本自动插入关键词的代码//separatehtml随机插入内容指定文本,txt内容;insert插入关键字,可以是链接,数组functionrand_in_str($txt,$insert){//将内容拆分成一个数组,每个字符是一个值,英文,中文,符号算一个,只有在utf-8Preg_match_all("/[\x01-\x7f]|[\xe0-\xef][\x80-\xbf]{2}/",$txt,$match);$delay=array();$加=0;//获取不能插入的位置索引号($delay数组),即<>之间的位置foreach($match[0]as$k=>$v){if($v=='<')$添加=1;如果($add==1)$delay[]=$k;如果($v=='>')$add=0;}$str_arr=$匹配[0];$len=count($str_arr);if(is_array($insert)){foreach($insertas$k=>$v){//获取随机插入的索引值$insertk=insertK($len-1,$delay);//循环将插入数据拼接到随机生成的索引$str_arr[$insertk].=$insert[$k];}}别的{//获取随机插入位置的索引值$insertk=insertK($len-1,$delay);//循环拼接插入数据到随机生成的索引$str_arr[$insertk].=$insert;}//Merge将插入关键字后的数据拼接成一段内容returnjoin('',$str_arr);}functioninsertK($count,$delay){//count随机索引取值范围,即内容拆分成数组后的总数Length-1;延迟不允许的随机索引值,即不能在<>$insertk=rand(0,$count)之间;if(in_array($insertk,$delay)){//索引值不能在允许的位置(即<>内的索引值)$insertk=insertK($count,$delay);//递归calluntiltherandominsertindexvalueisnotintheindexvaluearrayof<>}return$insertk;}4.后台可以实现自动推送百度或者其他自动推送,但是使用后台的效果不如和使用前端js推送一样好,所以要实现前端js推送,必须要有人访问这个页面来实现,所以顺便在这里使用微头条的兴趣推送功能,发文章summary作为内容发给微头条,然后附上文章链接作为微头条的详情链接,这样即使没有人点击查看这个微头条,字节跳动的服务器也会通过内部服务器模拟附上的链接。这个接入实际上实现了自动推送功能。整个过程的实现代码会在后续文章中一一展示。欢迎关注本话题。