当前位置: 首页 > 后端技术 > Python

Python告诉你:甜咸粽子谁胜谁负?吃货们最喜欢买哪种粽子?

时间:2023-03-25 22:07:25 Python

【简介】:今天就来说说粽子吧。Python分析部分请参考第三部分。又是一年端午节。粽子作为中华民族的传统节日,相传是为了纪念投江自尽的屈原。现在吃粽子已成为端午节的主要习俗之一。除了商场里琳琅满目的粽子外,各家各户的妈妈和奶奶还泡糯米、洗粽叶、包粽子。粽子的包法和形状也很有讲究。除了常见的三角、方形粽子外,还有长条粽子、塔形粽子、牛角粽子等,说到粽子的口味就更多了。粽子几乎每年都会引发咸甜之争。有句话叫吃货不分南北,必有甜咸之分。北方人更喜欢吃粽子。多以红枣、豆沙为馅,少数也以果脯为馅,蘸白糖或红糖食用;而南方人更喜欢咸粽子。口味有咸肉粽、咸蛋黄粽、栗肉粽、腊肉。腊肠饺子、火腿饺子、虾饺等等。那么哪一家的粽子最好吃呢?你一般喜欢什么口味?今天我们就用数据来盘一盘端午节的粽子。本文主旨:甜咸粽子之争,自己包粽子选什么材料?吃货的力量,全网谁卖的粽子最好吃?01粽子“甜咸之争”你会选择什么样的材料来包自己的粽子?自己包的粽子总是最好吃的,比起外面卖的粽子,就没那么好吃了。对厨艺有信心的朋友可以自己试试包包。那么自己包饺子,选甜的还是咸的?红豆馅还是五花肉馅?首先,我们从美食世界网站上得到了,一共460个关于粽子的食谱。查看哪些食谱最受欢迎。1甜粽子还是咸粽子?在甜咸的较量中,这次甜粽子赢了。33.04%的食谱是甜粽子,其次是咸粽子,占22.17%。同时,很多朋友选择最简单的纯糯米团子,原味,占比17.83%。2在选择什么食材方面,我们可以看到:无论如何,糯米和粽叶是必不可少的。在咸粽子方面,五花肉是很多人的首选,其次是咸蛋黄、香菇、排骨、香肠等;在粽子方面,红豆和红枣是很多人的首选。其次,绿豆、豆沙、花生、西米等也不错。3、从调料里放什么调料来看:糖和酱油缺一不可。还有花生油、蚝油等选择。除了这些常规操作,还有一个创新的选择抹茶粉的方法。02吃货的力量全网谁卖的粽子最好吃?考虑到他们不会包粽子,又方便,又逢年过节送人,网上直接买粽子的人不少。那么哪些店家的粽子最受欢迎呢?我们分析得到了淘宝上销售的粽子数据,共计4403条。粽子店销量TOP101全店第一:五芳斋是嘟嘟的霸主,粽子销量排名第一。其次,震震老老排在第二位。2各地区粽子店前10名这些店从哪里来?谁才是真正的粽子省?经过分析发现,浙江一骑绝尘的粽子店远远多于其他省份。浙江粽子门店占全网的67.71%。无可争议的老板。接下来,广东、上海、北京分公司分别位于第二、三、四位。3粽子卖多少钱?粽子能卖多少,对于消费者来说也是最重要的。通常,在淘宝商店购买的粽子大约有10个。分析发现,大部分粽子价格在50元一个以内,全网55.22%的粽子价格在50元以内。其次是50-100元,占比24.81%。![在这里插入图片描述](https://img-blog.csdnimg.cn/2...4不同价格的粽子销量那么销量怎么样?什么价位的粽子最好卖?大家可以看看粽子的价格50-100元的价格销量最高,占比53.61%,其次是50元以下,占比22.06%,毕竟从送礼的角度来说,还是要考虑一定的价格的,如果太便宜,需要一定的档次.5粽子标题词云最后我们来看粽子的产品标题:我们发现除了“粽子”“端午节”等关键词之外,“嘉兴”被提及的次数最多。。看来嘉兴的粽子真的很受欢迎。很有名。“蛋黄”,“鲜肉”,“豆沙”在粽子的馅料方面都很受欢迎。同时,“礼盒包装”,“送礼”,“五芳斋”也被多次提及03用Python教你爬取淘宝粽子数据我们用Python获取淘宝粽子产品t销售数据和美食世界食谱数据,并进行了数据分析。下面是部分淘宝商品分析代码。按照数据读取-数据处理和数据可视化流程,首先导入我们使用的Python库,其中数据处理使用pandas,分词使用jieba,可视化使用pyecharts。importpackageimportpandasaspdimporttimeimportjiebafrompyecharts.chartsimportBar,Line,Pie,Map,Pagefrompyechartsimportoptionsasoptsfrompyecharts.globalsimportSymbolType,WarningTypeWarningType.ShowWarning=False1dataimport#读取数据df_tb=pd.read_excel('../data/淘宝商城粽子数据6.23.xlsx')df_tb.head()查看数据集大小,可以看到共有4403条数据。df_tb.info()RangeIndex:4403entries,0to4402Datacolumns(total5columns):#ColumnNon-NullCountDtype--------------------------0goods_name4403非空对象1shop_name4403非空对象2价格4403非空float643purchase_num4403非空对象4位置4403非nullobjectdtypes:float64(1),object(4)memoryusage:172.1+KB2数据预处理我们对数据集进行如下处理,以便我们后续的可视化分析工作。处理后的数据共有4192条。去除重复值goods_name:暂不处理shop_name:暂不处理price:暂不处理purchase_num:提取人数,注意unit10000的处理计算sales=price*purchase_numlocation:提取省份#去除重复值df_tb.drop_duplicates(inplace=True)#删除购买人数为空的记录df_tb=df_tb[df_tb['purchase_num'].str.contains('peoplepay')]#重置索引df_tb=df_tb.reset_index(drop=True)#提取值df_tb['num']=df_tb['purchase_num'].str.extract('(\d+)').astype('int')#提取单位df_tb['unit']=df_tb.purchase_num.str.extract(r'(万)')df_tb['unit']=df_tb.unit.replace('万',10000).replace(np.nan,1)#重新计算salesdf_tb['true_purchase']=df_tb['num']*df_tb['unit']#删除列df_tb=df_tb.drop(['purchase_num','num','unit'],axis=1)#计算销售额df_tb['sales_volume']=df_tb['price']*df_tb['true_purchase']#extracttheprovincedf_tb['province']=df_tb['location'].str.split('').str[0]df_tb.head()3数据可视化数据可视化部分主要针对以下数据进行总结并进行分析,分析维度如下:各省粽子店产品销量排名各省粽子店数量各省粽子销量分布粽子卖多少钱?不同价格区间的销售分布?粽子食材商品标题词云图粽子店铺商品销量排名Top10shop_top10=df_tb.groupby('shop_name')['true_purchase'].sum().sort_values(ascending=False).head(10)#条形图bar1=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar1.add_xaxis(shop_top10.index.tolist())bar1.add_yaxis('',shop_top10.values.tolist())bar1.set_global_opts(title_opts=opts.TitleOpts(title='粽子店Top10商品销量排名'),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),visualmap_opts=opts.VisualMapOpts(max_=1350657.0))bar1.render()各省粽子店排名Top10province_top10=df_tb.province.value_counts()[:10]#条形图bar2=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar2.add_xaxis(province_top10.index.tolist())bar2.add_yaxis('',province_top10.values.tolist())bar2.set_global_opts(title_opts=opts.TitleOpts(title='每个地区排名前10的粽子店province'),visualmap_opts=opts.VisualMapOpts(max_=1000))bar2.render()浙江省和其他省份粽子销量对比names=['浙江','其他省份']numbers=[3378601.0,1611409.0]data_pair=[list(z)forzinzip(names,numbers)]#画饼图pie1=Pie(init_opts=opts.InitOpts(width='1350px',height='750px'))pie1.add('',data_pair,radius=['35%','60%'])pie1.set_global_opts(title_opts=opts.TitleOpts(title='浙江与外省门店粽子销量对比'),legend_opts=opts.LegendOpts(orient='vertical',pos_top='15%',pos_left='2%'))pie1.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))pie1.set_colors(['#EF9050','#3B7BA9'])pie1.render()粽子销售分布在全国各地的商店中='750px'))map1.add("",[list(z)forzinzip(province_num.index.tolist(),province_num.values.tolist())],maptype='china')map1.set_global_opts(title_opts=opts.TitleOpts(title='全国门店粽子销量分布'),visualmap_opts=opts.VisualMapOpts(max_=300000),)map1.render()粽子卖多少钱?#bins=[0,50,100,150,200,500,1000,9999]labels=['0-50元','50-100元','100-150元','150-200元','200-500元','500-1000元','1000-9999元']df_tb['price_cut']=pd.cut(df_tb.price,bins=bins,labels=labels,include_lowest=True)price_num=df_tb['price_cut'].value_counts()#数据对data_pair2=[list(z)forzinzip(price_num.index.tolist(),price_num.values.tolist())]#画饼图pie2=Pie(init_opts=opts.InitOpts(width='1350px',height='750px'))pie2.add('',data_pair2,radius=['35%','60%'],rosetype='radius')pie2.set_global_opts(title_opts=opts.TitleOpts(title='粽子多少钱?'),legend_opts=opts.LegendOpts(orient='vertical',pos_top='15%',pos_left='2%'))pie2.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))pie2.set_colors(['#EF9050','#3B7BA9','#6FB27C','#FFAF34','#D8BFD8','#00BFFF'])pie2.render()不同价格区间的销量#添加列cut_purchase=round(df_tb.groupby('price_cut')['sales_volume'].sum())#数据对data_pair=[list(z)forzinzip(cut_purchase.index.tolist(),cut_purchase.values.tolist())]#画饼图pie3=Pie(init_opts=opts.InitOpts(width='1350px',height='750px'))pie3.add('',data_pair,radius=['35%','60%'])pie3.set_global_opts(title_opts=opts.TitleOpts(title='不同价格区间的销售额显示'),legend_opts=opts.LegendOpts(orient='vertical',pos_top='15%',pos_left='2%'))pie3.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))pie3.set_colors(['#EF9050','#3B7BA9','#6FB27C','#FFAF34','#D8BFD8','#00BFFF','#7FFFAA'])pie3.render()