基于多源LBS数据的职住平衡对比研究——以北京城区为例

赵鹏军曹毓书

北京大学城市与环境学院, 城市与交通规划研究中心, 北京 100871; † E-mail: pengjun.zhao@pku.edu.cn

摘要采用多源LBS数据(热力图数据、POI数据、微博签到数据), 对北京城区职住关系进行测定和分析, 从不同角度测度北京城区职住关系的时间和空间特征, 研究结果可为改善城市职住关系提供决策参考。比较了LBS数据同传统人口和经济普查数据所测度的职住关系结果的差异性, 讨论差异产生原因, 为更好地利用LBS数据进行职住关系研究提供建议。

关键词LBS数据; 职住平衡; 对比研究; 北京城区

我国城镇化进入快速发展阶段, 人口和经济在城市的集聚不仅产生集聚效应, 也产生长距离“中心-郊区潮汐式”通勤方流、中心城区交通拥堵等“大城市病”。这些现象已成为我国建设宜居城市、改善民生亟待解决的现实问题。

职住平衡是用来描述给定地理区域范围内就业单位与居住单位的空间关系的概念[1], 其内涵为在一定的城市区域内, 居民能够有合理的通勤距离到达工作地, 并且能够满足该地域内职工的多样化住房需求[2–4], 实质上是城市就业人口居住地与就业地相互接近。

职住不平衡是过度依赖机动车、交通拥堵和空气污染的潜在原因[5–6], 也是导致城市长距离“中心-郊区潮汐式”通勤的重要因素之一[7–8]。增加职住地临近性可以减少尾气排放[9], 提供更多的就业机会[10], 促进规模经济[11–12]

职住平衡测定是国内外职住平衡研究领域的重要议题之一。当前国内外关于职住平衡相关研究中, 最常用的方法是测定职住比[2,5,13]。职住比指在特定范围内, 就业岗位数量与在业人口数量的比值。然而, 就实际情况而言, 工作地在某一区域的就业者, 其居住地并不一定在该区域内; 在某一区域内居住的就业者, 其工作地也不一定在该区域。因此, 可能存在大量就业者的流入流出, 而就业岗位与从业人口数量接近的情况, 实证研究也证明了该现象的存在[5]。针对这一问题, 部分学者采用某一区域内在本地工作居民数量占居民总数的比率[14–15]以及某一区域内在本地工作的居民数量占就业岗位总数的比率[15]

从测定职住关系的数据来源看, 当前研究可以分为基于传统数据的研究和基于LBS数据的研究。传统数据方法主要采用统计数据、普查数据(人口、经济或单位普查)、问卷调查以及深度访谈等数据。LBS数据方法主要采用手机信令数据[16]、公交刷卡数据[17]和热力图数据[18]等。学者们分别采用这些方法进行了大量研究, 取得一定进展。但是, 从研究方法来讲, 当前仍然存在一个重要争议: 在这些方法中, 哪种方法更能反映职住关系的实际情况? 澄清该争论, 不仅对职住关系研究具有重要的理论意义, 而且对于通过提升职住平衡来促进城市交通可持续发展具有重要的政策价值。要解决以上问题, 需要开展基于不同方法的比较研究。但是, 对不同数据源的比较研究目前尚属空白。

本文以北京城区为例, 在街道尺度上, 分别计算基于人口普查和经济普查等传统数据的职住平衡、基于热力图数据的职住平衡、基于POI与微博签到数据的职住平衡, 从不同角度测量北京城区职住关系的时间和空间特征。在此基础上, 对比这3种方法得出的职住平衡的差异性, 讨论传统数据与LBS数据方法下职住平衡的空间差异性, 为职住平衡的测定方法提出建议。

1 研究设计

1.1 研究区域

《北京城市总体规划(2016年—2035年)》确定了“一核一主一副、两轴多点一区”的城市空间结构。其中, “一核”为首都功能核心区, “一主”为中心城区(城六区), “一副”为北京城市副中心, 即原通州新城规划建设区; “多点”包括顺义、大兴、亦庄、昌平、房山等5个位于平原的新城; “一区”为生态涵养区, 包括门头沟区、平谷区、怀柔区、密云区、延庆区, 以及昌平区和房山区的山区。

本文选取生态涵养区以外的区域(包括北京市中心城区与新城区)作为研究区域, 并将这一区域统称为北京城区(图1(a))。现阶段, 该区域集中了北京市域范围内90%的居住人口和94%的就业岗位。根据《北京城市总体规划(2016年—2035年)》, 该区域将是未来北京市承载人口与产业的主要地区。

普查数据、热力图数据和微博签到数据在研究区域内覆盖范围不同。其中, 普查数据覆盖225个街道, 热力图数据覆盖162个街道, 微博签到数据覆盖126个街道。为方便职住平衡情况的测算及对比, 本文将3组数据覆盖的交集作为研究范围(图1(b)), 该范围内包括126个街道。

从人口与就业岗位集聚程度来看, 北京市城区聚集了大部分的居住人口与就业岗位, 其中本文研究范围内集中了北京市域65%的居住人口与74%的就业岗位。从道路交通运行状况来看, 北京市城区交通拥堵现象严重。早高峰时段入城方向与晚高峰时段出城方向的路段较为拥堵(图2)。这种现象可能是研究范围内居住、就业地分布不平衡所致。因此, 根据以上两方面, 有必要对北京市城区范围内的职住平衡情况进行研究。

1.2 分析单元

职住平衡测定结果受地理单元尺度影响, 且没有统一的标准尺度[19]。空间尺度越大, 该空间范围内职住关系越趋向平衡[20]。因此在进行计算之前, 需要选取合适的地理单元。

职住平衡测算的基本单元, 通常是土地利用政策实施的基本单元[21]。国际上城市的职住研究开始较早, 主要从3个尺度上进行职住平衡测算, 包括宏观尺度的城市和大都市区、微观尺度的交通小区(transport analysis zone, TAZ)以及中观尺度的半径5~7英里的缓冲区[1,22]

国内城市与国外城市地理单元划分方式不同, 用来进行职住测算的地理单元也不同, 包括交通小区[23–24]、邮政编码区[25]、区县[8]、街道[26–27]、组团与典型区域等[18,28]。其中, 街道是最常用的测算地理单元[15]

说明: width=467.75,height=226.8

据《北京城市总体规划(2016年—2035年)》市域空间结构规划图绘制

图1 城区范围和研究区域

Fig. 1 Urban area of Beijing and the research area

说明: width=458.15,height=227.5

图2 早高峰和晚高峰常发拥堵路段分布

Fig. 2 Spatial distribution of frequently-congested road sections during morning peak hours and evening peak hours

街道是中国城市最低级别的行政管理单元, 也是政策实施的基本单元, 在街道尺度上进行计算, 对政策相关的研究更有参考价值。另外, 街道是北京市的基本统计单元, 与人口普查的单元一致[7]。基于以上原因, 本文将以街道为基本单元进行计算与对比。

除花乡地区数据缺失外, 普查数据覆盖了研究范围内的191个街道。热力图数据与微博签到数据在部分街道层面也有一定程度的缺失, 热力图数据覆盖街道数量为183, 微博签到数据覆盖街道数量为127。

1.3 职住关系指标

我们需要从职住比、过剩通勤和可达性3种指标中选取热力图、普查和微博签到3组数据均能够计算的指标, 以便进行职住平衡的测算及对比。职住比可以简便、直观地反映某一地理单元内就业岗位相对于在业人口是过剩或过少, 通过对比不同的地理单元, 可以观察就业岗位与居住地点的集聚地。过剩通勤和可达性则分别更多地从通勤效率和职住地空间分布的角度来说明职住平衡状况。热力图数据反映不同时段某一地域单元内人口数量, 普查数据反映特定行政区内(街道、区、县等)人口数量与就业岗位数量, 微博签到数据反映微博签到用户的居住地和就业地。从以上特征来看, 热力图数据和普查数据无法进行过剩通勤和可达性相关指标的测算, 但3组数据均可以用于估计某一地理单元内居住人口数量与就业岗位数量, 进而进行职住比计算。

此外, 职住比、过剩通勤和可达性是相互关联的, 均用于探讨城市交通与土地利用的关系[4,29]。因此, 选取其中任意一项指标进行计算, 均是对现有职住情况的较为准确的描述。因此, 本文选取职住比作为各组数据计算及对比的指标。

结合数据特征与职住比的定义, 3组数据分别对应的具体测定方法如下。1)统计和普查数据: 在某一街道就业的人口数量除以本街道的就业岗位数量; 2)热力图数据: 某一街道工作时段人口数与居住时段人口数的比值; 3)微博签到数据: 某一街道就业类用地签到用户数量与居住类用地签到用户数量的比值。

另外, 为了将普查数据结果与热力图及微博签到数据计算结果进行对比, 本文将三者计算结果按照统一标准进行划分。与热力图和微博签到数据相比, 普查数据是更精确的调查数据, 因此以普查数据的划分方式为准。

2 基于传统普查数据的职住平衡分析

2.1 数据来源与处理方法

街道人口数量的来源为第六次人口普查数据(2010年), 街道就业岗位数量数据来源为全国第三次经济普查数据(2013年), 两者在时间上并不一致, 但由于相隔时间较短, 因此可以用于计算。

根据《北京统计年鉴2014》, 2013年末北京市城镇人口为1685.9万, 城镇从业人口为905.4万, 占城镇人口的53.70%。据此比例, 对每个街道人口数进行折算, 得到每个街道的就业人口, 进而计算北京市城区各个街道的职住比。

2.2 职住关系空间特征

根据前面所述的计算方法, 获得各街道职住比(图3(a))。五环内街道职住比整体上高于五环与六环之间街道, 北城街道职住比整体高于南城街道。城区街道职住比均值为1.435。根据图3(a)的职住比分布情况, 将其分为3个区间(<0.667, 0.667~ 1.563,>1.563), 分别对应三类模式(职小于住、职住平衡、职大于住)。

图3(b)显示, 北京市城区职住比偏高的街道主要分布在五环以内, 包括东二环至东四环间的中央商务区附近的街道、二环中心地区、西二环至西三环间、中关村–海淀街道以及酒仙桥街道。在五环以外, 职住比偏高的街道包括上地街道、北京经济技术开发区以及机场附近的仁和–南法信–天竺地区。北京市城区职住比偏低的街道主要分布在五环以外, 在各个方向上均有分布, 包括大型居住区所在的街道, 如东小口、天通苑等街道。职住平衡的街道在五环内外均有分布, 既包括六环边缘的沙河地区、通州和石景山部分街道, 也包括部分中心城区的街道。

3 基于热力图数据的职住平衡情况的时空分析

3.1 数据来源

热力图数据为腾讯宜出行产品分时段人口活动热度数据, 是桌面端和移动端应用用户使用过程中产生的过程数据, 能够反映在某一时刻、一定空间范围内的人口数量。原始数据包括4个属性, 分别为经度、纬度、时间和该小时的平均人口数量。数据采集点的网格密度为25m, 呈均匀点阵分布。本文采用2015年7月31日的热力图数据。

3.2 就业地、居住地的确定

3.2.1 基于热力图数据的职住时间特征

基于热力图数值变化趋势线, 判断工作时段与居住时段。图4中,T9T10处于上升趋势,T10开始上升幅度变缓, 说明9—10时之间是北京市城区比较稳定的工作时段;T17之后, 热力图数据开始呈现下降趋势, 直到T20, 转而呈现上升趋势, 说明16—17时北京市城区就业人口开始下班, 19—20时是北京市城区比较稳定的居住时段;T23后, 即22—23时, 热力图数据呈现较快的下降趋势, 可能是因为用户睡眠导致相关产品的使用量减少。

说明: width=456.7,height=254.6

图3 北京市城区各街道职住比(a)和职住平衡程度(b)(基于普查数据计算)

Fig. 3 Job-housing ratio (a) and job-housing balanced degree (b) of each jiedao in research area (based on census data)

说明: width=375.7,height=93.1

图4 北京市城区范围内热力图数值变化趋势

Fig. 4 Trends of numerical values of heatmap in urban areas of Beijing

根据北京市城区范围内热力图数值变化趋势, 本文选取T10~T17(9—17时)作为工作时段,T20~T23(19—23时)作为居住时段。

3.2.2 职住比计算

结合热力图数据特征, 可以获得在某一时段北京市城区某一街道的人数。首先计算每个小时在各个街道的人口数量。由于相关应用使用者在不同时间段的总人数不同, 在一天内会随着时间的推移产生较大的变动[27], 因此需要将其标准化, 计算过程如下。

width=49.65,height=37.25, (1)

其中,t表示时间,i表示街道,width=12.4,height=14.9表示t时间i街道的人口数量所占比例,width=14.9,height=14.9表示t时间i街道人口数量,width=24.85,height=24.85表示t时间所有街道人口数量之和。

随后, 计算各个街道工作时段与居住时段的标准化人口数量均值AjiAhi:

width=73.25,height=34.75, (2)

说明: width=459,height=254.4

图5 北京市城区各街道职住比(a)和职住平衡程度(b)(基于热力图数据计算)

Fig. 5 Job-housing ratio (a) and job-housing balanced degree (b) of each jiedao in research area (Based on heatmap data)

width=78.2,height=34.75。 (3)

最后, 计算各个街道职住比JHRi:

width=49.65,height=32.3。 (4)

3.3 职住关系空间特征

3.3.1 热力图数据计算结果

基于热力图数据计算的职住比均值为1.052, 与普查数据计算结果略有差异。热力图数据计算结果如图5(a)所示。虽然五环内的街道职住比同样整体上高于五环与六环之间街道, 北城街道的职住比高于南城街道, 但不如普查数据计算的趋势明显。

基于热力图数据计算结果, 职小于住、职住平衡和职大于住3类街道的结果如图5(b)所示。热力图数据计算得到的街道职住平衡情况与普查数据计算结果差异较大, 绝大多数街道属于职住平衡状态。

3.3.2 与传统数据的空间差异

通过计算热力图数据计算结果相对于传统数据计算结果的偏差(Dhi), 探讨计算结果的差异。

width=162.6,height=32.3, (5)

其中i代表街道,width=42.2,height=14.9代表热力图数据计算的i街道职住比,width=78.2,height=14.9代表普查数据计算的i街道职住比,Dhi代表热力图数据计算结果相对于普查数据计算结果的偏差值。

Dhi值计算结果(图6)与普查数据职住比计算结果(图3)进行对比, 发现Dhi值小于-0.4的街道基本上是职大于住的街道,Dhi值大于0.4的街道基本上为职小于住的街道, 而Dhi值介于-0.4~0.4之间的街道基本上是职住平衡的街道。热力图数据与普查数据计算结果的差异, 主要体现在职住失衡的街道。

说明: width=215.4,height=223.9

图6 北京市城区各个街道Dhi值计算结果

Fig. 6Dhivalue of each jiedao in research area

4 基于POI数据与微博签到数据的职住关系时空分析

微博签到数据能够反映微博用户签到点的时间和位置信息。通过签到点的时间信息, 判断微博签到点是否处于居住时段或工作时段; 通过位置信息, 结合所在位置的土地利用属性, 判断微博用户签到点位置的居住或就业属性。签到点所在地块的土地利用类型, 可通过POI数据进行判断。时间在居住时段, 位置具有居住属性, 签到点即为用户居住地;时间在工作时段, 位置具有就业属性, 签到点即为用户就业地。

4.1 数据来源

4.1.1 微博签到数据

微博签到数据采集于新浪微博开放平台的微博API, 包括北京市城区从2016年2月24日00:00:00至2016年3月1日23:59:59的163802条微博签到数据。本文基于微博签到数据的签到时间、纬度、经度、用户ID和位置5个变量进行研究。

4.1.2 POI数据

基于百度地图开放平台中的PlaceAPI功能, 采集北京市城区截至2015年底的555059条POI数据。基于POI数据的经度、纬度、POI名称和POI类型4个变量, 对土地利用类型进行判断。

4.2 就业地、居住地的确定

4.2.1 基于POI判断土地利用类型

根据POI点类型变量, 确定表1中POI类型的分类方法, 筛选出居住类型的POI和就业类型的POI, 剩余POI类型为交通、游憩、教育与生活服务设施, 因此归类为服务类型POI。

利用北京市路网数据, 将城区分割为若干地块。计算地块内就业、居住和服务POI所占比例(分别设为Pj,PhPs), 以及各个地块POI密度。剔除密度位于后5%的地块, 认为这些地块POI密度过低, 无法用来判断地块属性。随后, 计算各地块就业、居住和服务类型POI比例的均值(分别设为width=12.4,height=17.4,width=13.65,height=17.4width=12.4,height=17.4), 并将各个地块3种POI比例与均值进行比较, 从而将地块分为6种类型(表2)。北京市城区各个地块类型的分布如图7所示。

表1 就业、居住、服务类型POI分类

Table 1 Classification of POI in employment, residence, service type

POI类型功能职住属性 地名地址信息, 门牌信息居住居住 商务住宅, 商务住宅相关 商务住宅, 住宅区 公司企业工作就业 商务住宅, 产业园区 商务住宅, 楼宇 金融保险服务 政府机构及社会团体 道路附属设施交通其他(服务) 交通设施服务 风景名胜游憩 体育休闲服务 科教文化服务, 学校教育 科教文化服务, 科研机构 医疗保健服务生活服务 科教文化服务(除学校与科研机构)

表2 北京市城区地块类型土地利用类型定义标准

Table 2 Land use type definition standard for urban land parcels in Beijing

与均值比较情况土地利用类型定义与均值比较情况土地利用类型定义 >><就业–居住混合<>>居住–服务混合 ><>就业–服务混合<><居住 ><<就业<<>服务

说明: width=226.05,height=253.2

图7 北京市城区各地块类型及空间分布

Fig. 7 Different types of urban land parcels and spatial distribution in Beijing

4.2.2 基于微博签到数据的职住时间特征

以1小时为划分单位, 将一天划分成24个时间段, 以T0表示00:00:00—00:59:59时间段,T1表示01:00:00—01:59:59时间段, 依此类推。统计2016年2月24日(周三)到2016年3月1日(周二)每个时间段的微博签到次数, 变化趋势如图8所示。横轴Tn代表本周某一天的第n小时, 纵轴Wn代表Tn时间段内(即(n-1)时至n时)北京市城区的微博签到点数量。

通过变化趋势线, 判断工作时段与居住时段。8—9时签到点数量快速上升, 9时上升速度变缓, 说明微博用户9时开始处于工作状态; 晚上17时之前签到点数量比较稳定, 17—18时上升较快, 说明17时之前微博用户处于工作状态。

与工作时段确定方法相同, 每天6时后签到点数量增加较大, 说明早上6时前微博用户处于在居住地休息状态; 晚20时后, 微博签到点数量增加速度较快, 说明微博用户20时后在居住地休息的概率更大。

由此确定, 微博签到用户工作时段为工作日9—17时。每天0—6时以及20—24时为居住时段。

4.2.3 确定就业地和居住地

在获取微博签到点所在地块的土地利用类型以及签到微博用户签到的时段后。将工作时段签到且在就业、就业–服务混合和就业–居住混合之中的一种类型地块上的签到点, 作为签到用户的工作地; 将居住时段签到且在居住、居住–服务混合、就业–居住混合之中的一种类型地块上的签到点, 视为签到用户的居住地。

4.3 职住关系空间特征

4.3.1 微博签到用户筛选

通过微博签到数量随时间变化趋势, 可以判断北京市城区职住关系时间特征。为了利用微博签到数据计算各个街道职住比, 提出如下用户筛选条件: 1)拥有两个或者两个以上微博签到点; 2)至少拥有一个代表工作地的签到点; 3)至少拥有一个代表居住地的签到点。最后筛选出1114个符合要求的微博ID。

4.3.2 街道层面的居住地、就业地统计

在筛选出同时具有代表就业地与居住地签到点的微博用户后, 确定用户就业地与居住地所在的街道。在此基础上, 从街道层面统计其居住或就业的微博用户数量, 进而计算各个街道的职住比。

说明: width=372.95,height=141.45

图8 2016年2月24日—3月1日微博签到次数变化趋势

Fig. 8 Trends of number of Weibo check-in (2016/02/24–2016/03/01)

说明: width=448.2,height=239.85

图9 北京市城区各街道职住比(a)和职住平衡状况(b)(基于微博签到数据)

Fig. 9 Job-housing ratio (a) and job-housing balanced degree (b) of each jiedao in research area (based on Weibo check-in data)

4.3.3 街道职住比计算

基于街道层面的居住地和就业地统计, 可以得到每个街道就业和居住微博用户数量, 两者之比即为该街道的职住比, 计算结果见图9(a)。微博签到数据计算职住比平均值为2.481, 与普查数据和热力图数据的计算结果偏差均很大。从整体上看, 五环内街道职住比高于五环与六环之间的街道, 南城与北城的差别不显著。

根据普查数据职住比计算结果划分标准, 将图9(a)中的街道划分为职小于住、职住平衡和职大于住3类, 结果见图9(b), 可以看出, 采用微博签到数据的计算结果,职住比偏高的街道数量较少, 主要包括中央商务区所在的朝外、建外街道以及首都机场办事处等街道; 职住比偏低的街道, 从二环至六环之间都有分布; 职住平衡的街道分布没有明显的规律, 既有上地、海淀、中关村街道等就业地相对集中地街道, 也有马驹桥这样六环边缘的居住地较为集中的街道。

4.4 与普查数据计算结果的异同

4.4.1 相似

对比微博签到数据与普查数据计算结果可以看出, 微博签到数据识别出一些典型的职住比偏高的街道(如朝外、建外街道)以及一些典型的职住比偏低的街道(如回龙观、东小口地区)。

4.4.2 差异

虽然微博签到数据识别出部分典型街道, 但与普查数据识别出的职住平衡、偏高与偏低街道的整体空间分布均存在较大的差距。街道微博签到数据职住比计算结果与传统数据计算结果的偏差(Dwi)计算公式如下:

说明: width=206.85,height=216.2

图10 北京市城区各个街道Dwi值计算结果

Fig. 10Dwivalue of each jiedao in research area

width=158.9,height=32.3, (6)

其中,i代表街道,width=39.7,height=14.9代表基于微博签到数据计算的i街道职住比,width=79.45,height=14.9代表基于人口普查与经济普查数据计算的i街道职住比。基于式(6)的计算结果如图10所示。

比较基于普查数据计算的北京市城区职住比与Dwi值计算结果, 没有显示出一致的规律。从图10可以发现,Dwi值高的街道既包括大型居住区所在的职住比低的街道(如东小口), 也包括朝外、呼家楼等位于中央商务区的职住比高的街道, 因此并没有展现明显的规律性。

5 讨论

本文通过计算职住比以及定义的DhiDwi值, 将热力图数据以及POI和微博签到两组数据与普查数据计算结果进行对比, 结果表明, 热力图数据更接近普查数据的计算结果。下面我们尝试从LBS数据采样偏差的角度, 解释差异产生的原因。

5.1 热力图数据计算结果的差异性解释

普查数据计算职大于住的街道,Dhi值多小于-0.4; 职小于住的街道,Dhi值多大于0.4; 职住平衡的街道,Dhi值多介于-0.4~0.4之间。与普查数据的计算结果相比, 用热力图计算职住比的结果更向1收敛。将热力图与普查数据计算所得结果分别从小到大排序(图11), 比较数值分布情况, 结果更清楚地显示了这一点。

造成热力图数据计算偏差的主要原因是热力图相关LBS数据源产品的使用者范围较广, 既包括就业人口, 也包括非就业人口(如学生和退休的老年人等)。由于包括大量非通勤人口, 可能产生两方面的影响。一方面, 反映出来的跨街道通勤出行数量相对较小; 另一方面, 在工作时段与居住时段热力图数值的差异较小。

这里做一个简单的推算。假设普查数据中, 街道就业岗位数为a, 就业人口数为b, 职住比为a/b。对热力图数据来说, 某街道的所有就业者中, 使用LBS产品的人口比例为p1(热力图相关LBS产品中, 一个就业者既对应一个就业岗位, 又对应一个就业人口, 是一个数据源点), 非就业人口数量为m, 使用LBS产品的比例为p2, 则热力图计算职住比为width=47.15,height=29.8。易证a>b时,width=47.15,height=29.8<width=12.4,height=27.3;a<b时,width=47.15,height=29.8>width=12.4,height=27.3。因此, 职大于住的街道, 热力图计算结果小于普查数据计算结果, 反之则大于。最终, 相对于普查数据, 热力图计算的职住比更向1收敛。

说明: width=394.3,height=260.5

图11 基于热力图数据和普查数据计算的职住比数值分布

Fig. 11 Distribution of job-housing ratio based on heatmap data and census data

5.2 微博签到数据计算结果的差异性解释

通过微博签到数据与普查数据计算结果的对比, 发现微博签到数据识别出一些典型街道, 但没有显示出明显的规律性。另外, 微博签到数据计算结果与统计数据计算结果分布情况相似, 但数值偏差很大, 如图12所示。以上结果说明微博签到数据可以用于描述职住关系, 但仍需改进, 才能接近真实状况。

由于偏差没有显示出明显的规律性, 我们定性地解释微博签到数据计算偏差产生原因。首先, 微博签到用户包括非就业人口, 且更多是年轻人(如学生等)。另外, 微博签到点数在工作时段明显小于休息时段, 相对于就业活动, 微博数据更多地反映用户居住地和娱乐活动信息。因此, 利用微博签到数据筛选用户职住地信息, 会面临信息密度较低的情况。

通过本文的计算方法, 从163802条微博签到数据中仅筛选出1114个可用样本, 覆盖127个街道, 相对于热力图数据覆盖的183个街道, 减少近1/3。因此, 需要更大量的微博签到数据进行职住比计算, 才可能获得更好的效果。

6 结论

6.1 北京城区职住平衡情况时空特征

在时间特征方面, 基于热力图数值和微博签到次数变化趋势线, 北京市城区就业人口在上午9时进入比较稳定的工作状态; 下午16—17时陆续下班, 到晚上19—20时之间回到家中, 进入比较稳定的居住状态。

在空间特征方面, 五环内的街道职住比普遍高于五环与六环之间, 北城街道整体上高于南城; 典型就业中心附近的街道职大于住; 大型居住区所在的街道职小于住。职大于住的街道主要分布在五环以内; 职小于住的街道主要分布在五环以外, 在各个方向上均有分布; 职住平衡的街道在五环内外均有分布。

6.2 不同数据计算结果异同

热力图数据计算结果与普查数据展现出相似的空间分布趋势, 职住比偏高、偏低以及平衡的街道与普查数据计算结果基本上一致。但是, 相对于普查数据, 热力图职住比计算的数值, 更加向1收敛。

说明: width=394.3,height=256.3

图12 基于微博签到数据和普查数据的职住比数值分布

Fig. 12 Distribution of job-housing ratio based on Weibo check-in data and census data

微博签到数据在一些典型地区的职住比计算结果展现出与普查数据相同的趋势。但整体上并没有呈现很强的规律性。

6.3 LBS数据在职住平衡测度的合理性、不足与改进

本文尝试从样本偏差方面来解释LBS数据与普查数据计算结果的差异: 1)LBS数据采样不仅包括就业人口, 还包括非就业人口, 如热力图数据直接反映某一时段某一区域人口相对数量, 而非就业岗位数量, 因此仅能做近似替代; 2)LBS产品设计的目的并非用于用户职住信息的搜集, 如微博以用户娱乐为目的, 因此LBS数据不一定直接反映用户职住信息, 与此同时, 其偏向于娱乐的功能使得用户产生数据更集中于休息时段而非工作时段, 因此反映用户的职住信息, 相对于其他信息(如娱乐活动等)更少。以上两点也是LBS数据现阶段的弱点, 其数据量虽大, 但不能精确地反应用户的具体信息与社会经济属性。

虽然存在样本偏差, 但从热力图数据计算结果来看, 职住失衡与平衡的街道空间分布与普查数据计算结果十分接近。从微博签到数据计算结果来看, 虽然相对于普查数据结果有较大的偏差, 但也识别出部分典型街道。因此, LBS数据可以应用于职住关系计算。与此同时, LBS数据具有时效性, 数据获取时间间隔远小于普查数据, 并能获取某一区域人口相对数量的变化趋势及特征, 根据其变化趋势, 可以判断一定地域内LBS产品用户的工作时段与居住时段, 这是普查数据无法比拟的。相对于普查数据与LBS数据, 大规模调查问卷能够更准确地反映职住平衡状况, 但调查周期相对较长, 时效性不及LBS数据。

虽然从定性的角度, LBS数据计算可以获得与普查数据计算相近的结果, 但具体数值仍存在较大偏差, 因此需要基于普查数据和问卷调查数据进行校对。从微博签到数据计算结果可以看出, 如果想获得更接近实际情况的结果, 应当增加样本量, 使其达到一定数量级; 另外, 应注意结合不同LBS数据反映的信息, 以便更准确地获取职住信息。

参考文献

[1]Peng Zhongren. The jobs-housing balance and urban commuting. Urban Studies, 1997, 34(8): 1215–1235

[2]Cervero R. Jobs-housing balance as public policy. Urban Land, 1991, 50(10): 4–10

[3]Giuliano G. Is jobs-housing balance a transportation issue?. Transportation Record, 1991, 13(5): 305–312

[4]Horner M W. Spatial dimensions of urban commuting: a review of major issues and their implications for future geographic research. The Professional Geogra-pher, 2004, 56(2): 160–173

[5]Cervero R. Jobs-housing balancing and regional mo-bility. Journal of the American Planning Association, 1989, 55(2): 136–150

[6]Cervero R. America’s suburban centers: the land use-transportation link. Abingdon: Routledge, 1989

[7]Zhao Pengjun, Lü Bin, De Roo G. Impact of the jobs-housing balance on urban commuting in Beijing in the transformation era. Journal of Transport Geography, 2011, 19(1): 59–69

[8]孙斌栋, 李南菲, 宋杰洁, 等. 职住平衡对通勤交通的影响分析——对一个传统城市规划理念的实证检验. 城市规划学刊, 2010(6): 55–60

[9]Scott D M, Kanaroglou P S, Anderson W P. Impacts of commuting efficiency on congestion and emis-sions: case of the Hamilton CMA, Canada. Transpor-tation Research Part D: Transport and Environment, 1997, 2(4): 245–257

[10]Handy S L, Boarnet M G, Ewing R, et al. How the built environment affects physical activity: views from urban planning. American Journal of Preventive Medicine, 2002, 23(2): 64–73

[11]Anas A, Arnott R, Small K A. Urban spatial structure. Journal of Economic Literature, 1998, 36(3): 1426–1464

[12]Giuliano G, Small K A. Is the journey to work explained by urban structure?. Urban Studies, 1993, 30(9): 1485–1500

[13]Boussauw K, Neutens T, Witlox F. Relationship be-tween spatial proximity and travel-to-work distance: the effect of the compact city. Regional Studies, 2012, 46(6): 687–706

[14]Ewing R, Pendall R, Chen D. Measuring sprawl and its transportation impacts. Transportation Research Record: Journal of the Transportation Research Board, 2003, 1831(1): 175–183

[15]郑思齐, 徐杨菲, 张晓楠, 等. “职住平衡指数”的构建与空间差异性研究: 以北京市为例. 清华大学学报(自然科学版), 2015, 55(4): 475–483

[16]Zhang Ping, Zhou Jiangping, Zhang Tianran. Quanti-fying and visualizing jobs-housing balance with big data: a case study of Shanghai. Cities, 2017, 66: 10–22

[17]龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行. 地理学报, 2012, 67(10): 1339–1352

[18]冷炳荣, 余颖, 黄大全, 等. 大数据视野下的重庆主城区职住关系剖析. 规划师, 2015, 31(5): 92–96

[19]Levine J. Rethinking accessibility and jobs-housing balance. Journal of the American Planning Asso-ciation, 1998, 64(2): 133–149

[20]Cervero R. Jobs-housing balance revisited: trends and impacts in the San Francisco Bay Area. Journal of the American Planning Association, 1996, 62(4): 492–511

[21]Levinson D M. Accessibility and the journey to work. Journal of Transport Geography, 1998, 6(1): 11–21

[22]Sultana S. Job/housing imbalance and commuting time in the Atlanta metropolitan area: exploration of causes of longer commuting time. Urban Geography, 2002, 23(8): 728–749

[23]周江评, 陈晓键, 黄伟, 等. 中国中西部大城市的职住平衡与通勤效率——以西安为例. 地理学报, 2013, 68(10): 1316–1330

[24]Long Ying, Thill J C. Combining smart card data and household travel survey to analyze jobs-housing re-lationships in Beijing. Computers, Environment and Urban Systems, 2015, 53: 19–35

[25]刘望保, 闫小培, 方远平. 广州市过剩通勤的相关特征及其形成机制. 地理学报, 2008, 63(10): 1085–1096

[26]张纯, 易成栋, 宋彦. 北京市职住空间关系特征及变化研究——基于第五、六次人口普查和2001、2008年经济普查数据的实证分析. 城市规划, 2016, 40(10): 59–64

[27]Ta Na, Chai Yanwei, Zhang Yan, et al. Understanding job-housing relationship and commuting pattern in Chinese cities: past, present and future. Transpor-tation Research Part D: Transport and Environment, 2017, 52b: 562–573

[28]胡娟, 胡忆东, 朱丽霞. 基于“职住平衡”理念的武汉市空间发展探索. 城市规划, 2013, 37(8): 25–32

[29]Zhou Jiangping, Zhang Chun, Chen Xiaojian, et al. Has the legacy of Danwei persisted in transforma-tions? The jobs-housing balance and commuting efficiency in Xi’an. Journal of Transport Geography, 2014, 40: 64–76

①北京市规划和国土资源管理委员会. 北京城市总体规划(2016年—2035年). http://zhengwu.beijing.gov.cn/gh/dt/t1494703.htm

②2016年北京交通发展年报. http://www.bjtrc.org.cn/InfoCenter/NewsAttach/2016年北京交通发展年报_20161202124122244.pdf

Jobs-Housing Balance Comparative Analyses with the LBS Data: A Case Study of Beijing

ZHAO Pengjun, CAO Yushu

The Centre for Urban Planning and Transport Studies, College of Urban and Environmental Sciences, Peking University, Beijing 100871; † E-mail: pengjun.zhao@pku.edu.cn

AbstractMeasuring job-housing balance is an important part of job-housing related research, and the dataset applied in previous researches is expanded from survey and census data to LBS data. However, current research lacks comparative studies between different data sources. Beijing urban area is taken as an example to measure and analyze job-housing balance spatial-temporally from different aspects, using different kinds of LBS data, which including heatmap data, Point-of-interest data and Weibo-checkin data. This could provide decision-making reference to improve the job-housing balance. The authors compare the differences in the results of LBS data with the traditional population and economic census data, discusses the causes of the differences, and provides suggestions for further improving the research of LBS data in job-housing relations.

Key wordslocation based services data; job-housing balance; comparative study; Beijing urban area

中图分类号U121; K909

doi:10.13209/j.0479-8023.2018.077

国家自然科学基金(41571147)资助

收稿日期:2017-11-10;

修回日期:2018-06-25;

网络出版日期:2018-11-04