2020年1月17日,国家统计局发布2019年国民经济报告,指出我国人口突破14亿。朱哥的朋友圈刷屏是14亿人口,但很多人没有看到我国复杂的人口问题:老龄化、男女比例失衡、生育率下降、人口红利下降。今天就来分析一下我国的人口数据吧!一、背景1.人口突破14亿。2020年1月17日,国家统计局发布2019年国民经济报告。军人,不包括香港、澳门特别行政区和台湾省及华侨人数)140.005万人。也就是说,到2019年底,我国人口将超过14亿!报告链接:http://www.stats.gov.cn/tjsj/...2、人口普查年度依据5月12日国务院第111次常务会议通过的《全国人口普查条例》第一章第八条,2010年:每10年进行一次人口普查,以0结尾的年份为普查年,标准时点为普查年11月1日0时00分。也就是说2020年11月将进行第七次人口普查,新中国成立后的前六次人口普查分别是:1953年、1964年、1982年、1990年、2000年、2010年。ps:可能有同学有疑问:人口普查是十年一次,那么其他年份的人口怎么获取呢?非普查年计算当年总人口=上年总人口+当年出生人口-当年死亡人口!3、全面放开二孩《中华人民共和国人口与计划生育法修正案(草案)》明确规定,2016年元旦起实施“全面二孩政策”,全面实施一对夫妇可生育两个孩子的政策具有历史意义中国生育政策调整,36岁的独生子女政策全面终止。二、分析目标新中国成立70年来,经历了许多风风雨雨。政策、经济、文化也发生了很多变化,人口也随之发生了变化。人口变化对社会经济发展有着巨大而深远的影响,所以今天我们从多个角度来分析我国的人口变化:总人口男女比例城镇化增长率人口结构3.抓取数据人口可从AvailablefromtheCountryData网站获得。这是国家统计局提供的网站,收录了多个国家的公开数据信息!1、请求单页数据在国家数据网站中,有新中国成立到2018年的人口相关数据,在人口数据中,我们需要三项:总人口、增长率、人口结构。我们先按F12查看请求的链接,然后复制链接,使用requests请求数据。只使用简单的get请求获取数据,直接返回json数据!2.分页数据我们这次的目的是抓取新中国到现在的所有人口数据,页面中最多可以获取近20年的数据,所以我们需要分析关于分页的参数在网页请求。分析请求参数,朱哥发现主要有两个参数:zb和sj,分别代表指标和时间。参数:sj=LAST10,表示将近10年,于是朱哥猜测:sj=LAST70,能不能得到70年的数据?然后我们更改zb参数来获取所有数据!3、保存Excel在获取到数据后,我们首先对数据进行清洗,提取出我们需要的数据,然后在Excel中进行整理保存。我们仍然使用MasterPan(pandas)进行数据处理。我们来看看保存的excel文件数据。4.2019年数据目前数据唯一不完整的是没有2019年的数据,因为2019年才刚刚结束,网站上还没有登记数据。我们只能自己计算,填上。猪哥根据国家统计局2020年1月17日发布的2019年国民经济报告中的人口数据,得到了2019年的相关数据。来看看整整70年的人口数据。4.数据分析数据保存好后,我们就可以开始数据分析步骤了。一般来说,在我们进行数据分析之前,我们需要有一个想法:分析什么?从哪些角度?选择哪种可视化?得出了什么结论?(当然,实际工作中的分析报告需要更加严谨,但大体思路是差不多的。)1.总人口首先,我们提取Excel中“年末总人口”一栏的数据为分析。直接上传代码,猪哥先用潘大师读取Excel,然后获取总人口的列数据(完整代码请查看源码)。上面的代码与之前的曲线绘制有点不同:增加了自定义曲线的背景色和区域颜色的功能。下次想自定义pyecharts曲线背景的同学可以参考这里的代码。在下图中,朱大哥标注了四点:1949年:新中国成立,总人口5.42亿。1980年:计划生育正式启动,总人口9.87亿。2016年全面放开二孩,总人口13.83亿。2019年:总人口14亿。通过观察总人口曲线,我们知道总人口在增加,但是增长曲线在慢慢变慢。据社科院预测,中国人口将在2029年达到14.42亿的峰值,建国后逐渐下降。到目前为止(2020年),人口减少的次数只有1960年和1961年,那是我国自然灾害多发的年份。我们根据总人口来分析计划生育实施前31年和实施后31年的人口增长情况。从上图可以看出,计划生育确实控制了人口增长!然而,二胎放开后,生育高峰期并没有迎来。联合国相关机构发布的《世界人口展望》2017修订版给出了类似的预期。倾向于假设中国人口已经开始倒V型反转。人口达到顶峰后,2050年将保持在13亿以上,之后将加速下降(低、中、高生育率,来自联合国人口基金)。2、男女人口比例我们经常听到有人说:“中国男女比例失调,未来将有3000万中国男人娶不到老婆。”其实这是我国男女比例失衡的结果。接下来,朱哥将从以下四个角度来分析一下我国男女比例的关系:2019年男女人口占总人口的男女比例。男女人口的曲线。根据以上4个数字,我们可以得出一些结论:新中国成立以来,男性人口一直多于女性人口,这可能与我国的重男轻女思想有关。男性比例最高的是新中国成立之初的51.96%,最低的是1996年的50.82%。下图是中国、印度、日本、英国、美国的男性比例由快易数据提供。从图中可以明显看出,中印两国的男女比例一直失衡。2000年我国男女人口差距最大的是4131万,最小的是1965年的1718万。2006年以来,我国男女比例失衡的情况逐年缓解。我国有多少男同胞会单身?限于篇幅,下期我们将对此问题做专题分析!3.人口城镇化很多同学不明白什么是“人口城镇化”。以下是百度百科诸葛介绍:人口城镇化是指农村人口向城市人口、农业人口向非农业人口转变的过程。它是社会生产力发展到一定阶段的产物。城镇化是衡量地方经济发展、基础设施建设和人民生活水平的综合指标。同时,城镇化进程在需求层面也是房地产市场的重要支撑力量。下图显示了人口城镇化与社会发展的关系。根据美国地理学家诺瑟姆对世界各国城市化的研究,世界城市化可分为三个阶段: 早期(人口城市化率低于30%):农村人口占主导地位,工农业生产力水平下降低,该行业提供的就业机会少,农业富余劳动力得不到释放。 中期(人口城镇化30%~70%):工业基础较为雄厚,经济实力显着增强,农村劳动生产率提高,剩余劳动力转向工业,农村人口比例增加城市人口已迅速超过50%,然后升至70%。 后期(人口城镇化70%~90%):农村人口向城镇人口转化趋于停止,农村人口比重稳定在10%左右,城镇人口可达到90%左右,趋于稳定到饱和。这个过程城市化不再是人口从农村向城市流动,而是城市人口在产业间的结构性转移,主要是从第二产业向第三产业转移。 来看看我国人口城镇化数据分析:从上图分析可以看出,2019年我国人口城镇化率达到60.6%,处于人口城镇化中期阶段。1995年,我国农村人口达到顶峰:8.59亿。1996年,我国城镇化步伐加快,同年城镇化率超过30%,进入城镇化中期阶段。2010年我国城镇人口和农村人口约6.7亿,城镇化率50%。联合国对中国人口城市化进程有预测:我国城市化初期是1949年到1995年,中期是1996年到2032年,后期是2033年之后。4.朱哥不会放人口增长率数据可视化代码。想看的同学可以直接看源码。我们直接看图吧。从上图可以看出,在自然灾害发生的三年(1959年、1960年、1961年)期间,我国人口死亡率急剧上升,出生率也下降。新中国成立以来人口首次出现负增长!自然灾害后的两年(1962年、1963年)迎来了我国最大的生育潮。我们也可以通过2010年第五次人口普查的数据来验证这个结论。经过三年的自然灾害,我国的死亡率一直趋于稳定,维持在6-7‰左右。我国的生育率整体上一直在下降,在计划生育之前生育率一直在下降。我国2016年全面放开二孩后的三年时间(2017-2019年),生育率不仅没有改善,反而持续下降。现在的育龄女性基本上都是80后、90后出生的。受计划生育(1980年)的影响,育龄妇女数量比以前少了,生育孩子的数量自然也比以前少了。这种情况将持续下去。出生率下降,死亡率上升,人口增长缓慢放缓。社科院预测,我国人口将在2029年左右达到顶峰(14.42亿),然后慢慢减少!题外话:朱大哥爬取数据后发现,国家数据网站提供的数据也是错误的:1961年的人口比1960年的少,但是增长率是一个整数!五、年龄结构人口年龄结构是衡量老龄化和人口红利的指标。老龄化:指老年人口相对增多,占总人口的比例不断增加的过程。国际上普遍认为,当一个国家或地区60岁以上的老年人口占总人口的10%,或65岁以上的老年人口占总人口的7%时,即表示该国或地区的人口占总人口的7%。地区正处于老龄化社会。——百度百科老龄化是每个国家、每个社会都会经历的一个阶段。目前,发达国家的老龄化问题比发展中国家更为严重。根据快易数据提供的一份世界各国老龄化排名,中国仅排在第65位,第一名是日本,前几名基本都是欧洲国家。人口红利:经济学术语,指一国劳动年龄人口占总人口比重较大,抚养比较低,为经济发展创造有利的人口条件。整个国家经济呈现出高储蓄、高投资、高增长的态势。简单地说,人口红利就是劳动力人口多于非劳动力人口。较高的劳动力比重保证了经济增长对劳动力的需求。丰富的劳动力资源和成本优势,使中国成为世界工厂和世界经济增长引擎。从以上三个数字分析,我们可以得到:1982年我国0-14岁儿童占比为33.59%,2019年下降到17.9%,占比下降近一半。2019年我国65岁以上人口占比12.57%,已进入老龄化社会。世界上有92个国家老龄化,中国排在第65位。2010年,我国总抚养比达到最低:34.2%,这意味着每3个劳动力需要抚养一个老人或一个孩子。人口红利在2010年达到顶峰,此后一直在缓慢下降。2019年我国老年人口为1.76亿,我国老龄人口即将进入快速老龄化阶段。当前,我国多个省份养老金急需,我国养老金制度改革迫在眉睫。5.总结由于文章篇幅,很多分析代码没有放出来。如果想学习,可以查看源码(https://github.com/pig6/china...)。总结一下我们今天的分析结果:总人口:我国总人口在稳步增长。据社科院预测:我国人口将在2029年达到14.42亿的峰值,未来男女比例将逐渐下降:新中国成立以来,一直处于男多女少的状态,2019年男女相差3000万。因为老年人中女性多于男性,所以青年男女之间的差异应该更大。下一期我们可以具体分析一下:中国会有多少光棍?人口城镇化:2019年我国城镇化率超过60%,处于城镇化发展中期。联合国曾预测中国人口城市化进程:我国城市化初期为1949-1995年,中期为1996-2032年,后期为2033年以后。人口增长率:我国出生率继续下降。全面放开二胎后,生育潮一直没有出现,人口增长缓慢放缓。据社科院预测,2029年人口增长率为0,之后出现负增长,生育率偏低。加速我的衰老过程。人口年龄结构:人口年龄结构影响两个重要指标:人口红利和老龄化。我国人口红利在2010年达到顶峰,之后逐渐下降。老龄化问题是世界特别是发达国家的共同问题。快易数据显示,2018年全球有92个国家进入老龄化进程,日本以27.58%的老龄化率排名第一,我国老龄化率排名第65位。但随着时间的推移,我国即将进入快速老龄化时期,养老问题日益突出!综上所述,我国人口结构存在两个严重问题:养老问题:低出生率、劳动力萎缩、老龄化加速,人口即将见顶,人口红利消失,多省养老紧迫,中需要补贴!剩男问题:实行计划生育后,男女人口差距拉大,男女失衡,剩男问题严重,越南买媳妇的消息传得沸沸扬扬并不少见!面临两次严峻考验,希望有专业人士为我们的国家出谋划策,希望我们的国家早日实现伟大复兴!数据来源:1.http://data.stats.gov.cn/easy...2.http://www.stats.gov.cn/tjsj/...3.https://www.kylc.com/stats参考:1.https://yq.aliyun.com/article...2.https://mp.weixin.qq.com/s/Sm...3.https://www.ssap.com.cn/c/201...源码地址:https://github.com/pig6/china...更多有趣的分析,可以关注猪哥微信公众号“裸睡猪”!
