国内的UGC平台,知乎是老大,但是因为太火了,其他很多综合平台都被忽略了。那么其他平台有哪些呢?以简书为例。这是一个类似于知乎的综合平台,但是因为没有“一个在美国刚下飞机的人”这样的东西,所以逐渐被人们遗忘了……简书上的用户?有多少大V拥有几万粉丝,几万个点赞?哪些文章阅读量最高?哪些热门栏目最受用户欢迎?1.获取数据不得不说,数据必须要用Python爬取。如果找到我们要爬取的数据,简单的代码就直接走向世界了~由于简书官方保护和数据限制,单个用户只能获取900。Followers(也是追随者),以及前1900篇左右的文章。经过2-3层数据的爬取,一共得到了261277条用户信息。具体数据包括:用户名、首页url、是否署名作者、粉丝数、点赞数、关注数、文章数、总字数等。同时,按照这1916篇文章获得的点赞数降序排列,排名第一的文章获得的点赞数为:17076;排在最后的点赞数是488,可见简书上最热门的文章可能都拿到了(其实并没有)。2、BI分析一般来说,用Python搞定一个好数字后,就是数据可视化。说到数据可视化,可谓百花齐放。一时之间,前端世界出现了五花八门的第三方库:Highcharts、Echarts、Chart.js、D3.js等。然而,同样的道理:需要很好的代码知识,这些产品不是真正的开源。那么对于我们这些不会编码的菜鸟来说,有什么解决办法呢?这就是我今天要讲的BI,也叫商业智能。百度搜索BI,感觉内容铺天盖地,看得人眼花缭乱。其实真正做的好的BI很少,但是国内外还是有一些优秀的产品的。国外代表是Tableau,以157亿收购,实力足以见分晓,但不适用于中国:基于数据查询、实时数据分析功能的工具还很缺乏,而且价格昂贵(当地霸绕过),都是这样,所以代理商的售后服务很差。它没有后端数据仓库。它声称是内存中的BI。在实践中,它需要极高的硬件要求。千万条以上的数据分析,必须要用其他ETL工具处理数据,再进行前端分析,无法支持中国式的复杂表格,所以选择了国产BI产品FineBI,一个企业级的数据分析软件,最重要的是它的个人版是免费的。优点是:自动建模,建模简单,模型灵活性强。丰富的可视化和前端分析操作,可进行数据钻取、数据切片、数据旋转等多维度分析操作。内置ETL,实时数据分析,同步分析大数据可快速处理3.数据可视化前文提到,FineBI虽然是企业级数据分析软件,但对个人免费。同时,FineBI支持多种形式的数据源、不同的连接方式,数据处理完全无压力。下载激活后,我将Python爬取的数据插入到FineBI中,开始了愉快的分析。一、签约作者分析既然是自媒体平台,那么里面的作者的目的就是成为签约作者。在这26万+的优质用户中,共有126人的首页上明确打上了“签约作者”的标签。这个比例可以说很小,也可以从侧面说明简书对作者的严苛程度。一共69位作者,单人贡献了5篇以上的热门文章,也可见写作的不易。2、用户和粉丝的情况这是一个金字塔状的分析图。26万+用户中:有5人粉丝超过10万,均为万分之一;其他渐变的数量只能看图片,就不细说了。值得一提的是,10-100个粉丝数占比最大,达到40.38%,而非0或1个粉丝的用户,进一步说明本次爬取的数据质量更高。3、24小时热门文章分析11点文章最多,比较奇怪。作为一个喜欢晚上发文的小透明,原本以为晚上是创作的好时机。11点已经是吃饭时间了吧?早上是否全身心投入写作,一天的计划都在早上,让自己早早完成一天的写作任务,心情轻松?而24小时有人发表文章,成为热门话题。4.阅读数、点赞数和评论数一篇文章的受欢迎程度直观地体现在点赞数和评论数上,从图上看确实如此。
