在讲分词之前,笔者先介绍一下什么是分词:分词就是将连续的词序列按照一定的规范重新组合成词序列的过程。在英语中,空格作为词与词之间的自然分隔符,而中文分词要复杂得多,涉及到一些算法,对于初学者来说还是很吃力的。这里笔者只介绍一种最简单的方法。有兴趣的朋友可以看看,直接上传代码:python实现#-*-coding:utf-8-*-#flake8:noqa__author__='wukong'importurllibfromurllibimporturlencode#ConfigureyourapplicationappKeyandopenIdapp_key="***"open_id="***""""request_url请求地址params请求参数方法请求方法"""defrequest_content(request_url,params,method):params=urlencode(params)ifmethodandmethod.lower()=="get":f=urllib.urlopen("%s?%s"%(request_url,params))else:f=urllib.urlopen(request_url,params)content=f.read()打印内容defmain():domain="http://api.xiaocongjisuan.com/"servlet="data/chinesekeyword/analysis"method="get"request_url=domain+servlet#dictionaryparams={}params["appKey"]=app_keyparams["openId"]=open_id#changepartparams["content"]="我是中国人,你懂的"request_content(request_url,params,method)if__name__=='__main__':main()PHP实现<?php/***@author*@copyright2019*/header("content-type:text/html;charset=utf-8");//设置编码//配置你申请的appKey和openId$app_key="***";$open_id="***";/**$url请求URL$params请求参数$ispost请求方法*/functionhttp_curl($url,$params=false,$ispost=false){$httpInfo=array();$ch=curl_init();curl_setopt($ch,CURLOPT_HTTP_VERSION,CURL_HTTP_VERSION_1_1);curl_setopt($ch,CURLOPT_USERAGENT,"小丛机算");curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,60);curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,60);,CURLOPT_TIMEOUT,60);curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);if($ispost){curl_setopt($ch,CURLOPT_POST,true);curl_setopt($ch,CURLOPT_POSTFIELDS,$params);curl_setopt($ch,CURLOPT$url);}else{if($params){curl_setopt($ch,CURLOPT_URL,$url.'?'.$params);}else{curl_setopt($ch,CURLOPT_URL,$url);}}$响应=curl_exec($ch);if($response===FALSE){//echo"cURLError:".卷曲错误($ch);返回假;}$httpCode=curl_getinfo($ch,CURLINFO_HTTP_CODE);$httpInfo=array_merge($httpInfo,curl_getinfo($ch));curl_close($ch);返回$response;}functionmain(){global$app_key;全局$open_id;$domain="http://api.xiaocongjisuan.com/";$servlet="数据/中文关键词/分析";$方法=“得到”;$url=$domain."".$servlet;$params['appKey']=$app_key;$params['openId']=$open_id;//更改部分$params["content"]="我是中国人,你知道的";//编码转换foreach($paramsas$key=>$value){$params[$key]=mb_convert_encoding($value,"UTF-8","GBK");}$paramstring=http_build_query($params);$content=http_curl($url,$paramstring,true);return$content;}echomain();?>原理主要是调用接口,直接输入一串字符串,接口会自动以json或xml的形式返回结果。具体文件请点我查看这种实现非常简单,节省了大量的开发时间,并且屏蔽了语言之间的差异。值得推荐。