当前位置: 首页 > 后端技术 > Python

蟒蛇与你见证:李子柒的螺蛳粉有多火?

时间:2023-03-26 01:28:53 Python

CDA数据分析师出品居家隔离的日子里,各种方便快捷的食品成为了很多人的最爱。尤其是螺蛳粉,异军突起,火遍全网,几乎断货。一些螺蛳粉热卖店的购买页面也显示现在下单,预售40天后发货。这是什么操作?万万没想到,这几天除了口罩还有螺蛳粉不能发货。今天我们就来说说火遍全网的螺蛳粉。01让吃货们买断货的螺蛳粉。螺蛳粉气味难闻,味道酸辣。它们被戏称为“生化武器”。不过吃起来太过瘾了,再加上堪称灵魂的酸笋,让人忍不住大喊,我爱了!就是这个味道!那么谁卖的螺蛳粉最受欢迎又好吃呢?吃货怎么看?我们收集整理了淘宝上螺蛳粉店铺的数据:可以看到店铺的销量排名:排名前三的店铺分别是李子柒旗舰店、好欢落旗舰店、溪洛汇鼎荣鲜专卖店。其中,李子柒旗舰店月销量66万+。其次是好欢络,月销量57万+。第三个是溪洛会21万+。各省螺蛳粉门店及销量排行榜,都是螺蛳粉的发源地。就门店数量和产品销量而言,广西占据了全国大部分地区,是绝对的王者。螺蛳粉卖多少钱?我们分析了市面上销售的螺蛳粉价格区间,发现一份螺蛳粉一般有3-5包。其中,单价在30-50元的商品最为畅销,占全网销售总额的59.04%。这个价格区间总体可以接受,3-5包的量也很合适。其次是0-30元一件,占销售额的27.93%。这个价格不仅物美价廉,对于想尝试螺蛳粉的新手也很友好。然后是价格在50-80的螺蛳粉,占销售额的10.22%。这个价位一般都有5包以上,是认真的螺蛳粉爱好者不错的选择。买螺蛳粉看重什么?从广大螺蛳粉的评价中可以看出,大家的关注点尤其在螺蛳粉的“正宗”产地。来自“广西”,尤其是“柳州”,螺蛳粉的发源地。当然,有意思的是,李子柒卖得最多的螺蛳粉,产地却不是广西,而是嘉兴。或许这就是网红强大的带货力量吧。其次,“包邮”也是最关键的。毕竟为了几块钱的运费和电商卖家谈半天,或者毫不留情地直接转给不包邮的店家,才是我们的真实写照。02Python分析李子柒的螺蛳粉有多火?接着,我们看到了全网螺蛳粉销量之王李子柒店。本次使用Python进行分析,先看结论:评论时间热图:从数据中可以看出,螺蛳粉的数据从去年12月2日开始一直不温不火,但是从3月中下旬开始,数量购买量和评论量持续上升,而且这个数据还在大幅上升。消费者关注维度占比:看来螺蛳粉的口味(好不好吃)是顾客最关注的点,占比高达41.45%,领先其他品类N个位置。其他维度:包装、原材料、品牌以及很少提及的物流和日期。目前看来,消费者对这些方面的关注度并不高,或者说基本符合要求。关注细节分布:总体来看,主流评论以正面评价为主,其中口味、品牌(此处不细分)、包装绝对以正面为主。原材料、日期和性价比,差评比例分别为10%、32%和15%。评论分布词云图:从词云可以看出,螺蛳粉好吃不好吃是大家关注的重点。“味道”、“质地”、“美味”、“新鲜”等词语出现频率很高。其次,“李子柒”巨大的带货能力也不容小觑。毕竟很多人都是为了李子柒小姐姐买的。具体步骤和代码如下:1、导入数据及基本处理importpackageimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassnsimportrereaddatadf=pd.read_excel('李子柒螺蛳粉评论。xlsx')df.head去除重复值df.drop_duplicates(inplace=True)http://df.infoInt64Index:1980个条目,0到1979个数据列(总计5列):UserNick1980非空对象comment_time1980非空datetime64[ns]content1980非空对象auctionSku1980非空对象comment_date1980非空对象类型:datetime64ns,对象(4)内存使用:92.8+KB代码:时间图表df['comment_time']=pd.to_datetime(df['comment_time'])df['comment_date']=df['comment_time'].dt.datecomment_num=df['comment_date'].value_counts。sort_indexfrompyecharts.chartsimportLinefrompyechartsimportoptionsasoptslinechartline1=Line(init_opts=opts.InitOpts(width='1350px',height='750px'))line1.add_xaxis(comment_num.index.tolist)line1.add_yaxis('热点',comment_num.values.tolist,areastyle_opts=opts.AreaStyleOpts(opacity=0.5),label_opts=opts.LabelOpts(is_show=False))line1.set_global_opts(title_opts=opts.TitleOpts(title='商品评价数量图'),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate='30')),toolbox_opts=opts.ToolboxOpts,visualmap_opts=opts.VisualMapOpts(max_=400))line1.set_series_opts(linestyle_opts=opts.LineStyleOpts(width=3))line1.renderguess2019On12.02,产品上线,购买量和评论量持续攀升3.评论分析我们从以下几个角度分析评论:包装品牌物流产品性价比defjudge_comment(df,result):创建一个空数据框judges=pd.DataFrame(np.zeros(13*len(df)).reshape(len(df),13),columns=['品牌','物流正面','物流负面','包装正面','包装负面','材料正面','材料负面','味道正面','负口味','正约会','负约会','正性价比','负性价比'])foriinrange(len(result)):word=result[i]李子柒的product具有很强的IP属性,基本都是正面评价。这里不统计情绪,只统计'李子琼'或'子奇'或'小奇'或'李子七'或'小奇'字词的提及次数:judges.iloci=1首先判断是否与物流有关,如果是word中的'logistics'或者word中的'express'或者'delivery'或者word中的'pickup':然后判断是不是积极情绪如果是'good'则为消极情绪单词或单词中的“nice”或单词中的“great”或单词中的“satisfied”或单词中的“quick”:judges.iloci=1elif单词中的“slow”或单词中的“turtlespeed”或单词中的“violence”或'poor'inword:judges.iloci=1判断包装是否相关if'packaging'inwordor'box'inwordor'bag'inwordor'appearance'inword:if'high-end'inword或“气氛”或“好”或“完整”或“好”或“严格”或“严密”或“精致”:法官。iloci=1elif'broken'inword或'broken'inword或'deflated'inword或'shabby'inword:judges.iloci=1商品的原料主要是牛肉,评论中提到牛肉的居多,所以我们分别分析这个词是'米粉'还是'汤'还是'配料'还是'腐竹’字或花生字:如‘力’字或‘多’字或‘足’字或‘香’字或‘才’字或‘脆’字或‘nice'inword:judges.iloci=1elif'small'inword或'less'inword或'no'inword:judges.iloci=1tasteif'taste'inwordor'taste'inwordor'Taste'inwordor'taste'inword:if'good'inwordor'thickandfresh'or'full'inwordor'fresh'or\'can'inwordor'like'inwordor'conform'inword:judges.iloci=1elif'bad'inwordor'notgood'inwordor'notfresh'inwordor\'toobad'inword:judges.iloci=1在口味方面,有些有不需要介词,消费者直接评价食物好吃不好吃,例如:if'unpalatable'inwordor'notdelicious'inword:judges.iloci=1elif'delicious'inwordor'fragrant'inword:judges.iloci=1日期是否新鲜if'date'inwordor'time'inwordor'shelflife'inword:if'fresh'inword:judges.iloci=1elif'long'inword或'long'inword:judges.iloci=1elif'expired'inword:judges.iloci=1cost-effectiveif'cost-effective'inword或'cheap'inword或“赚取”一词或“放养”wordor'value'or\'value'wordor'物美价廉'orword'affordable'or'cost-effective'orword‘notexpensive':judges.iloci=1elif“昂贵”或“不值得”或“失去”或“不值得”或“不便宜”:judges.iloci=1final_result=pd.concat([df,judges],axis=1)返回final_result得到数据框judge=judge_comment(df,result=df.content)judge.head结果汇总rank=judge.iloc[:,5:].sum.reset_index.sort_values(0,ascending=False)rank.columns=['类别','提及次数']rank['比例']=rank['提及次数']/rank['提及次数'].sumrank['高级分类']=rank['Classification'].str[:-2]rankrank.loc[0,'AdvancedClassification']='Brand'rankdf.shape(1980,5)去重后共有1980条评论数据点评数据,粗略一看,口味、包装、原材料占比比较高部分。画个图仔细看看。rank_num=rank.groupby('高级分类')['提及次数'].sum.sort_values(ascending=False)rank_num高级分类味道1511.0包装695.0原料602.0品牌422.0日期208.0性价比146.0物流61.0名称:提及,dtype:float64data_pair=[list(z)forzinzip(rank_num.index,rank_num.values)]data_pair[['taste',1511.0],['packaging',695.0],['rawmaterial',602.0],['品牌',422.0],['日期',208.0],['性价比',146.0],['物流',61.0]]frompyecharts.chartsimportPiepie1=Pie(init_opts=opts.InitOpts(width='1350px',height='750px'))pie1.add(series_name="num",radius=["35%","55%"],data_pair=data_pair,label_opts=opts.LabelOpts(position="outside",formatter="{a|{a}}{abg|}n{hr|}n{b|{b}:{c}{per|{d}%}",background_color="#eee",border_color="#aaa",border_width=1,border_radius=4,rich={"a":{"color":"#999","lineHeight":22,"align":"center"},"abg":{"backgroundColor":"#e3e3e3","width":"100%","align":"right","height":22,"borderRadius":[4,4,0,0],},"hr":{"borderColor":"#aaa","width":"100%","borderWidth":0.5,"height":0,},"b":{"字体ize":16,"lineHeight":33},"per":{"color":"#eee","backgroundColor":"#334455","padding":[2,4],"borderRadius":2,},},),)pie1.set_global_opts(legend_opts=opts.LegendOpts(pos_left="left",pos_top='30%',orient="vertical"),toolbox_opts=opts.ToolboxOpts,title_opts=opts.TitleOpts(title='消费者注意力比例分布'))pie1.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger="item",formatter="{a}
{b}:{c}({d}%)")))从pie1.render来看,螺蛳粉的味道(好不好吃)是顾客最关注的点,没有之一,占比高达41.45%,领先于其他包装、原材料、品牌N个品类,而物流、日期很少提及,消费者似乎不太关心,或者说目前基本满足要求。不同类别的正面和负面评论的比例是多少?frompyechartsimportoptionsasoptsfrompyecharts.chartsimportBarfrompyecharts.commons.utilsimportJsCodefrompyecharts.globalsimportThemeTypelist2=[{"value":1484.0,"percent":1484.0/(1484.0+27.0)},{"value":692.0,“百分比”:692.0/(692.0+3.0)},{“值”:539.0,“百分比”:539.0/(539.0+63.0)},{“值”:422.0,“百分比”:422.0/(422.0)+0)},{"值":142.0,"百分比":142.0/(142.0+66.0)},{"值":124.0,"百分比":124.0/(124.0+22.0)},{"值":58.0,"percent":58.0/(58.0+3.0)},]list3=[{"value":27.0,"percent":27.0/(27.0+1484.0)},{"value":3.0,"percent":3.0/(3.0+692.0)},{"值":63.0,"百分比":63.0/(63.0+539.0)},{"值":0,"百分比":0/(0+422.0)},{“价值”:66.0,“百分比”:66.0/(66.0+142.0)},{“价值”:22.0,“百分比”:22.0/(22.0+124.0)},{“价值”:3.0,“百分比”:3.0/(3.0+58.0)},]bar1=Bar(init_opts=opts.InitOpts(width='1350px',height='750px',theme=他们eType.LIGHT))bar1.add_xaxis(['口味','包装','原料','品牌','日期','性价比','物流'])bar1.add_yaxis("正面评价",list2,stack="stack1",category_gap="50%")bar1.add_yaxis("负面评论",list3,stack="stack1",category_gap="50%")bar1.set_global_opts(title_opts=opts.TitleOpts(title='关注细分比例分布'))bar1.set_series_opts(label_opts=opts.LabelOpts(position="right",formatter=JsCode("function(x){returnNumber(x.data.percent*100).toFixed+'%';}"),))bar1.renderimportjiebaimportjieba.analysetx=df['content'].str.cat(sep='')将关键字jieba.add_word('李子柒')加入停用词列表stop_words=withopen('stop_words.txt','r',encoding='utf-8')asf:lines=f.readlinesforlineinlines:stop_words.append(line.strip)添加停用词stop_words.extend(['40','hellip','abag','apack','onemonth','alittle','一个多月','第一次','哈哈哈','蜗牛粉','蜗牛'])分词处理word_num=jieba.analyse.extract_tags(txt,topK=100,withWeight=True,allowPOS=)停止词word_num_selected=foriinword_num:ifi[0]notinstop_words:word_num_selected.append(i)key_words=pd.DataFrame(word_num_selected,columns=['words','num'])key_words。headfrompyecharts.chartsimportWordCloudfrompyecharts.globalsimportSymbolType词云图word1=WordCloud(init_opts=opts.InitOpts(width='1350px',height='750px'))word1.add("",[*zip(key_words.words,key_words.num)],word_size_range=[20,200],shape=SymbolType.DIAMOND)word1.set_global_opts(title_opts=opts.TitleOpts('评论分布词云图'),toolbox_opts=opts.ToolboxOpts)word1.renderfrom图表。图表导入Pagepage=Pagepage.add(pie1,bar1,word1)page.render('commentanalysis.html')以上就是关于螺蛳粉的全部分析内容。我想问一下,为什么螺蛳粉那么臭,那么多人爱吃?其实对于吃货来说,喜欢的就是螺蛳粉的腥、臭、辣的味道。疫情过后,螺蛳粉店估计会爆满。更多行业干货持续为您分享,您可以随时关注我们!(1)获取更多优质内容,可以前往:当前疫情有所缓和,也是提升自我、为未来蓄力的好时机——蓄势待发!(2)搜索CDA小程序,手机端随时随地浏览最新资讯和优质课程: