当前位置: 首页 > 后端技术 > PHP

一波关于十九大代表的数据解析

时间:2023-03-29 19:33:51 PHP

今年共有2287名代表赴京开会。我做了一个数据分析。结果如下图所示。其他的也可以过滤掉,比如xx姓多少,xx姓多少。我可以明确的告诉你,姓习的只有一个,就是我,习先生。准备工作:获取所有具有代表性的信息都是公开的,可以在百度百科上找到。数据分析的第一步是将得到的所有具有代表性的信息串转化为数组。可以使用match或者使用拆分代码如下:我们得到一个长度为2287的数组如下:[0]=>易晓光[1]=>丁宁(女)[2]=>丁琪(Hui)[3]=>丁小强[4]=>丁业先[5]=>丁向阳[6]=>丁洪都[7]=>丁志峰[8]=>丁来航[9]=>丁雪冬[10]=>丁荣军[11]=>丁维秀(女)[12]=>丁雪香[13]=>卜贤群[14]=>奈木亚森(维吾尔族)[15]=>于勇。..2。提取名字中的姓氏(少数民族我取点号前面的姓氏,比如阿里巴巴Jackma,我取阿里巴巴为姓氏)我们得到一个长度为2287的数组如下:[0]=>B[1]=>Ding[2]=>D[3]=>D[4]=>D[5]=>D[6]=>D[7]=>D[8]=>D[9]=>D[10]=>Ding[11]=>Ding[12]=>Ding[13]=>Bu[14]=>Naimu[15]=>Yu...3.计算数每个姓氏的人返回一个数组,如下所示:Array([0]=>0[1]=>Array([0]=>B[1]=>1)[2]=>数组([0]=>D[1]=>12)[3]=>数组([0]=>Bu[1]=>1)[4]=>数组([0]=>Naimu[1]=>1)4.将数据按照姓氏的个数降序排列5.统计女性和少数民族,只需要对名字进行正则判断6.可以计算百分比来自现有数据如下(女性人数/总人数*100)代码有点草率预览代码下载代码