当前位置: 首页 > 科技观察

高考结束后,用Python分析高考哪里是地狱级难度

时间:2023-03-22 16:05:44 科技观察

一年一度的高考,可以说是绝大部分学生的必经之路。高考也成为中国最广泛、最公平的晋升路径。可以说,考上了名牌大学,以后的路就会轻松很多。但是,由于我国幅员辽阔,不同地区的教育资源不同,不同省份的升学难度也不同。在一些地方,高考是优惠模式,而在一些省份,高考竞争堪称地狱模式。让我们仔细看看一组数据。考生人数高考升学难不难,一个更直观的因素是内部竞争压力是否大,所以各省的考生人数很重要。考生人数排名前十的省份从上图可以看出,河南的考生人数远超其他省份,据说复读生占30%,这也太严重了。山东、广东、四川的考生人数超过70万,内部竞争的压力应该也很大。候选后十名的省份位列后十名,三个直辖市全部上榜。毕竟面积小,人口也比较少。西北还有新疆、宁夏、内蒙古等,当然还有青藏双胞胎,西藏和青海。在这些省份中,除了三个直辖市外,其他省份的教育资源都不是特别好,所以可以想象,即使没有太大的内部压力,在与其他省份竞争的时候,比如河南,山东等,你会吃很多苦头。各省历年分数线这里我们从以下网站抓取了各省历年分数线,先做个横向比较:http://college.gaokao.com/areapoint/p1/codefor捕获和数据处理df=pd.DataFrame()foriinrange(1,206):test="http://college.gaokao.com/areapoint/p%s/"%str(i)print(test)d=pd.read_html(test)[0]df=pd.concat([df,d],axis=0,ignore_index=True)benke=df[df["批次名称"].isin(['本科生批次'])|df["批次名"].isin(['本科批次'])|df["批次名"].isin(['本科生'])|df["批次名"].isin(['部分平行录取'])|df["批次名称"].isin(['普通班部分'])]benke_2020=benke[benke["年份"]==2020].drop_duplicates()benke_2020_like=benke_2020[(benke_2020["文理科"]=='理科')|(benke_2020["文理科"]=='综合改革')]benke_2020_like_wenke=benke_2020[(benke_2020["文理科"]=='艺术')|(benke_2020["文理科"]=='综合改革')]benke_2020_like_sort=benke_2020_like.sort_values(by=['最低控制分数线'],ascending=False)benke_2020_like_sort_wenke=benke_2020_like_wenke.sort_values(by=['最低控制分数线'],ascending=False)再来看看2021年各省的分数线:可以看到四川的理科分数线最高,高达521。这个数字好像不是特别高,因为我们似乎还记得2020年的最高分线。接下来文科录取分数最高的居然是云南,高达565,不得不说还是文科更牛逼!与2020年相比,浙江最高分594分,只能说浙江的学生太难了,太厉害了!当然,河南的同学们也不容易,都是第二名,辛苦了!下面通过图例来更直观的看一下各省的录取分数线。2020年,前十名中,一本书的分数线超过500分,竞争压力还是很大的。2021年,前十名中,不仅总分有所下降,而且部分前五名全部低于500分。这是不是说明高中生的压力没那么大了~总的来说,文科的分数比理科高,但是2021年还是比2020年低很多。当然,以上并不能完全反映一个省高考的难易程度。下面我们来看看各省高校的情况。对于优质高校,我提前获取了全国各省高校的数据。我们来看看各省的高校数量。df=pd.read_csv("college_data.csv")df_new=df.drop_duplicates(subset=['name'])#有重复数据,需要删除df_site=df_new[df_new['site']!='——']df_site=df_site[df_site['site']!='------']#分析高校总数site_counts=df_site['site'].value_counts()dict_site={'name':site_counts.index,'counts':site_counts.values}data=pd.DataFrame(dict_site)b=(Bar().add_xaxis(data['name'].values.tolist()[:10]).add_yaxis("",data['counts'].values.tolist()[:10]).set_global_opts(xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),title_opts=opts.TitleOpts(title="各城市高校数量",subtitle=""),#datazoom_opts=opts.DataZoomOpts(),).set_series_opts())grid=Grid(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))grid.add(b,grid_opts=opts.GridOpts(pos_left="20%"))grid.render_notebook()对其进行简单的数据处理,每个pr中的高校数量可以得到ovince。从高校数量可以看出,江苏的高校数量最多,被誉为高校重灾区的河南也榜上有名。然后看985&211的数量?现在差距很明显,北京太强了,唯一的存在!河南没了,郑州大学是唯一的苗子!在高考难度等级下面,我们写一个规则来确定每个省份的高考难度。我们选择的参考变量是各省优质院校数量和该省考生人数。公式为:(优质院校/10)/(考生人数/10)这里得到的数值就是各省份的难易程度。数值越大,难度越高!最终我们得到的数据大致如下,finally_par为最终的难度系数。河南带头,这很河南!从高考难度排名前十就可以看出。通过上述计算方法得出的难度系数后,河南、江西、广西占据前三。不知道这三个地方的童鞋们是不是也有同感呢?对于高考难度的后十名,相信很多同学都有自己的看法。显然,三大直辖市人口少,优质高校多,相对来说,考上名牌大学的机会自然要多一些。此外,东北三省也有幸上榜。人口少是优势吗?高考难度图分布我们来看看优质高校分布和高考难度分布图。优质高校分布热图明显,京津地区无可比拟。高考难度分布热力图与优质高校分布基本呈逆向分布。看来建设优质高等学府才是出路啊!最后,我们来看一个更直观的地图分布。我只想说,河南啊河南,你们都红了!