地区名称通过直接去掉常见的后缀来简化,比如直接去掉末尾的市|区|县|街道办事处|XX民族自治X。数量少,一些名称中会引起歧义的后缀被去掉,没有简化。省市前三级数据合并:统计局数据与民政部数据交叉比对后合并;由于统计局数据明显滞后,民政部新增市、区将没有镇级(同名镇级自动补全);如果民政部数据中有明示撤销的市、区,则合并时删除统计局对应的数据。新嘉市莱芜区、港城区;民政部数据中没有统计局数据的,按原样保留。高德地图的行政区域会和腾讯地图的行政区划数据进行交叉比对,然后选择需要的数据。最后将前三层数据(国家统计局+民政部)和(高德地图+腾讯数据)交叉融合,得到[省市]≈[统计局数据]-[约160个开发区和经济区、高新区、国家级新区】-【封城】+【新城】+【港澳台】。四级乡镇主要使用腾讯地图的行政区划数据,结合高德和统计局的数据。与统计局数据相差3000左右,占比7.5%(3000/40000)。得到的【乡镇级别】≈【腾讯地图行政区划数据】。数据应用更新综合应用库提供在线测试页面,提供三级或四级数据的多级选择测试,并提供数据格式转换和导出,方便转换成需要的格式。城市数据、坐标和边界都可以导入数据中使用。因为所有城市数据都有拼音,所以在选择界面显示时很容易分组显示拼音前缀。省市三级拼音准确率极高,四级略差。边界坐标可以根据用户坐标分析城市信息,可以覆盖除台湾以外的所有城市。库中提供了采集源码,采集方法是在浏览器控制台执行js采集。所有自己收集也很快,30分钟左右就可以完成;当然直接下载也是可以的。更新计划目前新版数据的前三层貌似和其他大网站没有太大区别,比他们新,主要是160多个开发区和经济区的学分被舍弃了.4级,因为直接采用了腾讯地图的数据,与统计局相比,相差不大。与其他网站没有可比性。能提供这么深的层次还是比较少见的,数据量太大了。比较一个是不容易的。可信数据。目前,更新主要靠民政部。民政部有新数据出炉后,会比较数据是否有变化。如果没有变化,将全面更新。但是对于已经在使用的数据库中的旧数据进行更新目前还没有简单的解决方案,因为更新数据库中的这种数据是一件非常麻烦的事情。==结束==
