在传染病研究领域,社交媒体数据已被证明是预测感冒发病和进展的指标流感季节。在本文中,我们将使用GoogleTrendsAPI来衡量冠状病毒的状态。我们将使用pythongoogletrendsAPIpytrends在州级别分析google搜索“冠状病毒”。安装依赖安装pytrends请打开命令行输入:pipinstallpytrends对我们来说,如果需要代理,需要安装requests的依赖pipinstallrequests[socks]写代码然后打开你喜欢的编辑器(我使用PyCharm社区版)frompytrends.requestimportTrendReq接下来,我们指定宿主语言、时区和负载。我们将宿主语言指定为英语(“en-US”),将时区指定为“CentralStandardTimeZone”,即“360”,并且可以将google属性过滤器(gprop)保留为空字符串。我们还设置了category=0,对应关键词相关的所有分类。让我们获取纽约从2020年2月到2020年3月的“冠状病毒”数据:pytrends=TrendReq(hl='en-US',tz=360)pytrends.build_payload(['Coronavirus'],cat=0,timeframe='2020-02-012020-03-10',gprop='',geo='US-NY')然后,我们定义一个dataframe作为生成的pytrends对象并打印前五行:df=pytrends.interest_over_time()print(df.head())我们还可以使用seaborn和matplotlib绘制“冠状病毒”搜索的时间序列:']=pd.to_datetime(df.index)sns.lineplot(df['timestamp'],df['Coronavirus'])plt.title("纽约冠状病毒的标准化搜索")plt.ylabel("搜索次数")plt.xlabel("Date")让我们对马萨诸塞州的“冠状病毒”做同样的事情:包装到一个函数中我们可以定义一个函数,允许我们提取任何一周的数据:defget_searches(key_word,state):pytrends=TrendReq(hl='en-US',tz=360)pytrends.build_payload([key_word],cat=0,timeframe='2020-02-012020-03-10',gprop='',geo='US-{}'.format(state))df=pytrends.interest_over_time()打印(df.head())sns.set()df['timestamp']=pd.to_datetime(df.iindex)sns.lineplot(df['timestamp'],df[key_word])plt.title("在{}中对{}的标准化搜索".format(key_word,state))plt.ylabel("搜索次数")plt.xlabel("Date")接下来我们查看纽约、马萨诸塞州、加利福尼亚州:get_searches('Coronavirus','NY')get_searches('Coronavirus','MA')get_searches('Coronavirus','CA')也可以使用其他关键字输入来提取其他州或整个美国的数据。也许您想搜索“冠状病毒症状”或“冠状病毒死亡率”。总结我们使用python库“pytrends”提取了与关键字“coronavirus”对应的州级谷歌趋势数据。社交媒体数据(例如Google趋势数据)可能有助于衡量与公共卫生相关主题(例如冠状病毒)的社会参与度。这可以帮助疾病预防控制中心等卫生机构定量评估需求、分配资源和传达预防措施。我希望你觉得这篇文章有用/有趣。从曲线上我们可以看出,虽然说自己不太重视,但美国民众并不这么认为。大家早就很关注了,到了3月11日达到了顶峰,正好是NBA球星米切尔和汤姆汉克斯被感染,所以美国民众的关注度达到了顶峰。送货到这里终于验证老外为什么喜欢囤厕纸了?据报道,外国人将冠状病毒与诺如病毒混淆,而诺如病毒引起的主要症状是腹泻,目前尚无疫苗和特效药。看看老外对这个词有多重视:seeItreallylooksthis。该关键词热度从11月开始飙升,基本增长趋势与冠状病毒相同。所以从这个角度来看,确实和拼错有关系。最后记得关注deephub-imba公众号
