在数字化转型浪潮下,大数据产业作为城市数字化转型的重要助推器,带来了城市管理方式、模式和理念的深刻变革和创新。为更好地了解全国城镇就业和居住分布结构,帮助城管部门制定更加合理的规划策略,为城市商业产业提供有效的规划依据。本期【极客星球】请来了MobTech的数据工程师坤坤,为大家介绍一种生活和工作人口的统计技术。一、常用的人口统计方法统计一定范围内的人口,包括常住人口、劳动人口、人口状况、人口流动分析等,是了解该地区经济社会发展状况的基础,也是政府或企业进行区域分析的依据,是未来规划的重要依据。现有的人口统计指标和数据模型数量众多且种类繁多。按照数据来源的类型,大致可以分为两类方法:一类是比较传统的方法,比如政府发起的大规模全国人口普查或者每年地方政府的统计数据;组织人员现场统计,如:问卷调查、统计特定地点人数等;根据社区规划户数和办公楼建筑面积估算居民人口;另一类是基于人工智能的数据管理和联邦学习、多方安全技术等核心技术。在有效保障数据安全的前提下,通过更加精准的数据分析,实现人口数据统计。2.住宅和办公人口统计解决方案无论是新的统计方法还是传统的统计方法,在人口数据分析的准确性方面,都面临着几个共同的问题:例如,如何区分居住人口和工作人口和他们的属性;如何剔除失真异常的定位数据;定位数据人口覆盖不足等导致的数据缺失如何修正。为此,MobTech数据工程师坤坤表示,针对这些统计痛点,基于大数据分析和智能算法模型,通过五个步骤,可以快速、高效、经济、灵活地统计当前特定范围内的常住和就业人口数量。第一,资料准备。在数据准备阶段,需要划分特定范围内的功能区,利用经纬度划分居住区、工作区、工作居住两用区。划分功能区的方法有很多种。我们一般采用公开地图信息、人工绘制等方式。二是数据清洗。数据清洗就是解决数据异常和数据重复问题。这些异常数据在统计过程中很难完全避免。如果不消除它们,某些地区的人口计算结果将被大大扭曲。为了处理异常数据,统计时需要将经纬度数据截取到小数点后六位,得到一定时间范围内这些经纬度的上报点数。当数量大于平均值的某个倍数时,则标记为经纬度异常。
