当前位置: 首页 > 科技观察

Python爬取+BI分析后,微博求助患者的眼泪都被数据看到了

时间:2023-03-12 02:34:31 科技观察

一个多月了,相信大部分人都和我一样:开机第一件事早上的电话是看最新的疫情消息,看看今天有没有新人,加了多少人。看着数据从一开始的几十个增长到现在飞快的8W,渐渐的数据在我们眼里只是一串数字。我们可以从数字和新闻报道中看出它的严重性,但如果我们通过数字仔细观察每一位患者的经历,悲剧的真实程度总能超出我们的认知。其中,微博“肺炎患者求助”超级群里求助者的遭遇,就是疫情惨烈程度的一个缩影。最初的追星聚集地“微博超话”,谁来求助?他们都得到帮助了吗?他们从寻求帮助到得到帮助经历了什么,又等了多久?1.Python爬取这些数据是怎么来的?必须只能通过python爬虫来获取(前提是不能获取其他东西,否则……),具体过程我这里就不赘述了,需要的可以看文末。我们在“肺炎患者求助”微博上获取了1055条求助信息(时间节点:2020年2月20日23:00),分析了这些患者求助时的状态,是否得到帮助,以及他们得到帮助的时间。进一步整理时间等信息,剔除重复数据后得到638条数据回答上述问题。2、如何分析?python可以进行数据分析吗?绝对有可能!其实像Python这样的伪代码语言入门并不难,但是要深入其中并不是一件简单的事情,而且Python语言不能加密,只是目前国内市场上卖的越来越少纯粹通过编写软件来提供给客户。网站和移动应用程序不需要给客户源代码,所以这个问题是个问题。有什么可以和python结合的吗?所以我想到了BI工具!BI工具简单易用,灵活快速,尤其是敏捷BI,不需要代码建模。比如FineBI这样的敏捷自助工具,傻瓜式操作,非常适合数据分析初学者。即使掌握了编程语言R,也非常适合作为分析工具使用。关于FineBI,可能很多朋友都或多或少的知道过这款BI工具。这是市场上使用最广泛的自助式BI工具之一。类似于国外的Tableau等BI分析工具,但是FineBI是协同工作的。在数据权益方面,可以更好的解决国内企业的情况。你可以把它看成是一个可视化工具,因为它自带了几十种常用的图表和动态效果。你也可以把它作为报表工具使用,因为它可以接入各种OA、ERP、CRM等系统数据,各种数据库都没有压力。无需编写代码或SQL,即可批量制作报表。您也可以将其用作数据分析工具。内置常用的数据分析模型和各种图表。可以使用FineBI做一些探索性的分析有了这个工具,IT部门只需要根据业务模块的分类准备好数据,业务部门在浏览器前端点击拖动鼠标就可以得到他们想要的数据分析结果。3、数据可视化结果以下均为FineBI分析。从头到尾我只用了3分钟。它自带ETL,太快了!1.哪几天寻求帮助的人最多?可以看到,2月4日到2月7日,这些患者会集中在网上求助,而求助最多的是2月5日。这次恰逢疫情数据。诊疗新动向2、谁在微博求助?全国救援力量全部集中到一个地区后,“微博”这个社交平台和“微博超话”的粉丝谁来用?以前追星营救的地方呢?我们对求助患者的年龄做了统计,发现50岁以上的中老年人占绝大多数(81.9%)。图片来自网络微博求助人群,他们更倾向于老年患者。但是,为什么老年患者会在微博超话上求助呢?我们统计了患者的求助信息,发现只有3.4%的求助信息是患者自己通过微博发的,95.3%的求助信息是别人发的。也就是说,由于信息不畅,行动不便,这些老人只能借助晚辈的帮助来发求助信息。3.求助者多为合并基础疾病的危重患者。他们求助时自己的情况如何?我们从求助信息中提取了这些求助者描述的症状。可以看出,“发烧”、“呼吸困难”、“咳嗽”、“疲劳”、“胸闷”、“腹泻”、“呕吐”都是高频词,其中出现了“呼吸困难”的症状求助信息中患者占35.8%,有呼吸问题的患者占48.2%。由此可见,微博上的这些求助者,绝大部分都是重症患者。此外,从这些患者的抢救信息中可以看出,21.1%的患者同时存在“高血压”、“糖尿病”、“心脏病”、“冠心病”、“肾衰竭”等基础疾病。.4.他们等了多久?从发现病情到最终抢救,总平均时间为13天。在这13天里,患者和家属经历了怎样的救治过程,又遇到了多少坎坷才最终获救?几乎每一条帮助信息中的患者“病情描述”都能告诉我们答案。我们把患者的描述做成了词云图,里面的每一个字都充满了沉重和无奈。5、每个求助者是否都得到了帮助?在微博上求助有什么作用?从转发效果来看,即使是40%的微博求助者,其微博粉丝数也不足50人。甚至有21.4%的求助者正在向刚注册微博的新人求助,57.2%的微博获得10次以上转发,30%的微博获得50次以上转发。然而,最终,这些求助者是否得到帮助才是帮助的最终意义。据我们统计,只有26.5%的求助者通过微博反馈获得帮助。因此,并不是每个微博求助者都能幸运地得到帮助。由于病情发展,部分患者还未等救助就已萎靡不振。4.总结以上就是这些微博求助者在微博上的经历。这些数据背后的每一个救援者都是一个接受者,他们是每一个普通人,他们有的等待帮助,有的没有。