知乎的人均用户是985?它引起了很多讨论。事实上,知乎是国内领先的UGC平台,但因为太火爆,其他很多综合性平台都被忽略了。那么其他平台有哪些呢?我们以简书为例。这是一个类似知乎的综合平台,但是因为没有“人在美国刚下飞机”这样的东西,所以被人拖慢了速度。慢忘……短本上有哪些优质用户?几万大V粉丝,几万点赞?哪些文章的阅读量最高?哪些热门栏目最受用户欢迎??1。获取数据不得不说,数据必须要用Python爬取。如果找到我们要爬取的数据,简洁的代码就直接走向世界啦~具体的代码会在文末给大家。由于简书官方的数据保护和限制,只能获取单个用户900个粉丝(和粉丝),以及前1900篇左右的文章。经过2-3层数据的爬取,一共得到了261277条用户信息。具体数据包括:用户名、首页url、是否署名作者、粉丝数、点赞数、关注数、文章数、总字数等。同时,按照这1916篇文章的点赞数从高到低排序,排名第一的文章点赞数为:17076;排在最后的点赞数是488,可见简书上最热门的文章可能都拿到了(其实并没有)。2、BI分析一般来说,用Python搞定一个好数字后,就是数据可视化。说到数据可视化,可谓百花齐放。一时之间,前端世界出现了五花八门的第三方库:Highcharts、Echarts、Chart.js、D3.js等。然而,同样的道理:需要很好的代码知识,这些产品不是真正的开源。那么对于我们这些不会编码的人来说,我们能做些什么呢?这就是我今天要讲的BI,也叫商业智能。百度搜索BI,感觉内容铺天盖地,看得人眼花缭乱。其实真正做的好的BI很少,但是国内外还是有一些优秀的产品的。国外的代表是Tableau,157亿被收购,实力足以见分晓,但不适用于国内:基于数据查询的工具,实时数据分析功能还欠缺,价格很贵(土豪绕道),都因此代理商的售后服务很差。它没有后端数据仓库。它声称是内存中的BI。在实践中,它需要极高的硬件要求。千万条以上的数据分析,必须要用其他ETL工具处理数据,再进行前端分析,无法支持中国式的复杂表格,所以选择了国产BI产品FineBI,一个企业级的数据分析软件,最重要的是它的个人版是免费的(链接在文末):FineBI制作的数据可视化自动建模,建模简单,模型灵活性强丰富的可视化和前端分析操作,干练可视化进行数据钻取、数据切片、数据轮转等多维分析操作内置ETL,实时数据分析,大数据快速处理3.数据可视化如前所述,虽然FineBI是一个企业-级数据分析软件,对个人免费。同时,FineBI支持多种形式的数据源、不同的连接方式,数据处理完全无压力。下载激活后,我将Python爬取的数据插入到FineBI中,开始了愉快的分析。一、签约作者分析既然是自媒体平台,那么里面的作者的目的就是成为签约作者。在这26万+的优质用户中,共有126人的首页上明确打上了“签约作者”的标签。这个比例可以说很小,也可以从侧面说明简书对作者的严苛程度。一共69位作者,单人贡献了5篇以上的热门文章,也可见写作的不易。2、用户和粉丝的情况这是一个金字塔状的分析图。26万+用户中:有5人粉丝超过10万,均为万分之一;其他渐变的数量可以看图,就不赘述了。值得一提的是,10-100个粉丝数占比最大,达到40.38%,而非0或1个粉丝的用户,进一步说明本次爬取的数据质量更高。3、24小时热门文章分析11点文章最多,比较奇怪。作为一个喜欢晚上发文的小透明,原本以为晚上是创作的好时机。11点已经是吃饭时间了吧?是不是早上专心写作,一天的计划都在早上,一天的写作任务早早完成了,心情就轻松了?然后,人们一天24小时发表文章,成为热点。4、浏览量、点赞数和评论数一篇文章的受欢迎程度直观地体现在点赞数和评论数上,从图片上看确实如此。
