杭州常住人口有多少(续)
基于用户画像数据探寻杭州常住人口增长特征
作者:岳雨峰阚长城钮心毅
本报告由百度地图慧眼与同济大学建筑与城市规划学院空间分析和决策支持实验室联合研究发布,合作双方发挥各自在时空大数据分析研究领域的资源、技术优势,形成一系列在城乡规划行业中具有前瞻性的研究成果,并不断促进研究成果的转化与应用。双方协作研究的领域涵盖城镇化发展动态监测与预测、城市空间分析评估与模拟、城市空间决策支持与咨询、人工智能与城市智慧管理、空间规划新技术创新等。
本文旨在基于前序文章“杭州常住人口有多少”(点击红字可查看)中基于时空大数据跟踪测度城市常住人口变化趋势的基本思路,进一步探讨杭州常住人口的变化特征。在延续杭州市常住人口规模激增现象的讨论基础上,笔者利用百度慧眼数据的用户画像功能,进一步揭示杭州市中心区边缘区常住人口集聚现象背后的人群社会属性变化特征。通过与、两个年度杭州市统计局所发布的人口数据公报的横向比较,从常住居民的受教育水平、消费水平、从业类型等社会经济属性视角,解读杭州区县、街道两级空间统计单元下的人口用户画像数据。分析结果再一次论证了杭州常住人口近期所呈现的激增现象,其中,中心城区边缘区内相对高学历、高消费人群的增长特征最为显著。同时,中心城区还存在特定从业人口规模的减少趋势,这应与地区产业职能的更替发展息息相关。笔者认为百度慧眼用户画像数据有助于从常住居民的社会经济属性视角,揭示城市产业职能的空间分布及其演化发展特征。
关键词:常住人口规模测度、用户画像数据、人口增长特征
01
利用、年度数据测度杭州常住人口的变化特征——统计公布数据、百度慧眼数据共同揭示杭州常住人口的激增现象
1.针对两个年度百度慧眼数据进行质量检验
笔者基于百度慧眼所统计归纳的、两个年度的杭州人口数据,以及杭州市统计局公布数据的横向比较,尝试探讨杭州常住人口增加特征及其背后的社会经济影响因素。本研究使用的两个年度数据,均以统计公布数据的11月1日标准时间点进行常住人口规模统计,即统计公布数据与百度慧眼数据针对、两年度的人口统计时间段一致。
在进行两组数据源的数据分析前,首先进行了针对百度慧眼数据的质量检验。通过百度慧眼数据原始设备识别数(即百度慧眼直接识别的六个月以上常住人口)相较于公布调查数据的常住人口识别率可以发现(如表1):
、年百度慧眼数据的原始设备数识别率保持总体一致。其中,年全市总体识别率相较于略有增长,且杭州中心城区边缘区的余杭、滨江、江干、萧山四区识别率较高,均不同程度超过了当年统计公布数据的%以上。此外,位于杭州远郊的淳安、建德、临安、桐庐四县市识别率较低,远低于全市总体识别率水平。
通过对、两个年度两组数据源的识别率比较,可以初步判断:
1)百度慧眼数据对两个年度常住人口规模的识别总量基本符合公布统计数据所调查获得的各区人口分布特征,百度慧眼数据的常住人口识别量在空间分布上符合杭州常住人口空间分布的一般规律,该数据可以作为下一步继续深化分析的基础;
2)百度慧眼数据原始设备数的识别率在中心城区边缘区均超过%以上,则其扩样后的常住人口数将大大超过公布调查数据结果。可以初步判断,杭州中心城区边缘区的实际常住人口应当高于同时期统计公布数据的调查结果。
2.杭州常住人口增长幅度或远超公布统计数据规模,且各区县常住人口的增长趋势不一致
通过比较、两个年度间的各区县常住人口变化总量可以发现:基于统计公布数据的人口增长总量为33.8万人,其中下城、上城两区为人口负增长区县,余杭、萧山、江干、滨江依次为人口增长最为显著地区(如表2)。
与此不同,基于百度慧眼数据原始设备识别数的人口增长总量为44.5万人,其中仅下城区为人口负增长区县,人口增幅最大的几个区县则与公布统计数据结果不同,依次为余杭、萧山、富阳、临安(如表3)。
两组数据源对杭州各区县人口的统计存在两个方面的差异:
其一,是至年末总人口增长规模的差异。基于百度慧眼原始设备识别数的统计结果,杭州常住人口的增量即已达到了44.5万人。考虑到还需进行数据扩样,则推算的全样本人口增长规模将至少超过60万人,远高于公布统计数据所提供的人口增长规模。
其二,是至年末杭州各区县人口增长规模的差异。基于百度慧眼数据的统计结果,杭州常住人口不仅在中心城区边缘区,如余杭、萧山等区发生显著的人口增长现象。同时在城市近郊区的富阳、临安等区也存在常住人口显著增长现象,这与统计公布数据所呈现的结果存在显著差异(如图1)。
一言以蔽之,杭州常住人口近年的快速增长现象已无争议。当下不仅需