摘要 以海南省三亚市的“12345”市民服务热线数据为研究对象, 通过提取热线数据记录中的空间信息进行地理编码, 结合热线记录的原始信息, 刻画市民来电的时间、空间和类别特征。利用高频词分布及其相关性网络来归纳城市公共管理中的主要问题, 分析各类问题的时间变化特征和空间分布模式。用不同类型兴趣点(POI)反映城市功能, 用道路网反映城市结构, 探讨影响城市问题发生的因素。结果表明: 1)热线记录以周为单位波动, 周中数量大于周末; 2)城市问题发生数量前 5 类依次为噪音、建设施工、通信与网络、城市用水和停车, 且噪音与建设施工问题联系紧密; 3)不同城市问题在时间上有不同的发生模式, 空间上集中分布在城市活动密集的区域; 4)城市问题的发生与道路网密度关系不大, 与城市功能中的公共设施、交通设施和科教文化 POI 密度显著正相关, 与风景名胜、体育休闲和政府职能 POI 密度显著负相关。研究结果验证了“12345”市民服务热线在挖掘和刻画城市问题方面的有效性, 并提出利用大数据优化城市治理的途径(包括城市数据积累与分析、融合多源数据以及提高数据共享程度等), 对推动城市精细化治理和智慧城市建设具有迫切意义。
关键词 “12345”市民服务热线; 城市问题; 文本挖掘; 空间分析; 城市公共管理
快速城镇化正极大地改变着居民的生活方式, 层出不穷的城市管理问题也伴随而来, 如交通拥堵和占道经营等会降低城市的运转效率, 噪声和空气污染等会严重影响居民的生活及身心健康, 乱贴广告和垃圾随意堆放等会影响城市形象, 等等。形形色色的城市问题阻碍城市品质的改善和居民福利的提升, 解决城市管理中的突出矛盾和问题, 提高城市管理和公共服务水平, 已成为品质城市和新型城市治理体系建设过程中的迫切议题[1–2]。
然而, 城市问题的出现存在高度的时空不确定性, 如何准确地刻画各类城市问题的发生状况, 甚至提前判断城市问题的发生风险一直是城市公共管理领域的难题。传统的方法(如人工执法和卫星执法等)由于成本高、时效性不强等问题, 难以反映整个城市范围存在的问题。随着城市数据的积累以及智慧城市建设的推进, 利用各种来源的大数据对城市运行状态进行实时和全面的感知, 模拟城市运行, 预测城市状态, 进而辅助城市决策和城市管理, 已成为越来越普遍的现象[3–4]。
在城市研究和管理中使用的多源异构大数据可分为商业公共数据和政府政务数据两个类别[5]。前者主要包括商业网站(如大众点评和携程旅游)数据、地图开放平台(如高德地图和 Open Street Map)数据和社交媒体(如新浪微博和 Twitter)数据等, 后者主要涉及政府各部门监测并收集的车辆运行信息、河湖水情和在施工工程等数据。这些数据被用于刻画城市中的人群行为模式、经济活动分布和社会空间分异等, 如用手机信令数据、浮动车数据(车载 GPS、公交刷卡和地铁刷卡)等量化人群的通勤行为, 反映交通的方向和流量[6]; 结合城市 POI (point of intrest, 兴趣点)数据, 对城市街区的功能类型进行识别[7]。同时, 大数据也逐渐应用于公共设施、交通管理、治安管理以及灾害防范等城市管理领域。美国加州电网使用大数据传感器进行电网运营管理, 用以平衡电力的供应和需求, 同时对潜在危机做出响应[8]。纽约、波士顿以及南卡罗莱那州使用大数据收集犯罪线索, 预测犯罪行为可能发生的概率和区域, 以便提前响应[9]。手机 APP 可以提供用户的位置和目的地, 能够实时跟踪停车位数量变化,有效缓解了大城市停车困难的问题[10]。利用纽约市“311”投诉热线, 对噪声的空间分布和产生原因进行推断与分析[11]。
国内学者近几年在城市管理领域做了大量探索, 依托智慧城市建设, 推进公众参与系统、摊贩管理、风险预警以及精细化管理等[3,12]; 尝试城市网格化管理和电子政府等一系列城市数字化治理新模式, 通过与物联网、视联网和数联网等感知平台对接, 增强对市民需求和城市管理问题的感知能力, 提升城市治理水平[13]。作为一种政务数据, “12345”市民服务热线是对城市中各种问题的直接反映。已有的研究主要关注“12345”热线提升城市政府治理能力[14]、热线的标准化流程建设[15]以及热线能否促进政府服务型理念的实践[16]等方面, 未见利用热线记录的信息对城市问题本身进行刻画。挖掘“12345”热线内容, 可以有针对性地对城市问题的具体类型、地理位置及严重程度进行及时监测与量化分析, 准确地获取城市问题发生的时空状态及关联要素, 促进城市精细化管理的效率与质量。
本文以海南省三亚市为研究对象, 通过 184567条“12345”市民服务热线记录, 识别城市问题, 刻画问题的时空分布规律, 分析城市问题产生的原因, 探讨城市治理的优化路径。
由于海南省三亚市的“12345”数据开放程度与完整性较高, 本文选取三亚市(图 1)作为研究城市问题时空特征和影响规律的范例。三亚市的城镇建设和社会经济活动主要分布在环岛外围的滨海区域, 这些区域成为热线投诉的高发区域。
图1 海南省三亚市的行政范围
Fig. 1 Administrative region of Sanya City, Hainan Province
1.2.1 数据选取及来源
“12345”热线记录数据来自三亚市政府服务热线网站(http://12345.sanya.gov.cn)。该网站公开最近 3个月经过文本化的“12345”热线记录, 包括来电标题、来电内容、来电时间、来电类型、工单分类和处理情况等。本研究获取 184567 条热线记录, 时间范围为 2018–10–02 至 2019–02–15。
为分析城市问题与城市特征之间的关系, 选取兴趣点(point of interest, POI)数据反映城市的功能特征, 选取道路网反映城市的结构特征。POI 数据选取北京大学开放研究数据平台的高德地图兴趣点数据(https://doi.org/10.18170/DVN/WSXCNM), 为截至到 2018 年 9 月的全量数据, 分为餐饮服务、公共设施和交通设施服务等 13 个类别, 在三亚市共有38 万余个数据点。道路网数据来自 OpenStreetMap平台(https://www.openstreetmap.org), 获取时间为2019 年。POI 和道路网数据与热线记录数据在时间上较接近, 可满足分析时效性的要求。
1.2.2 数据预处理
数据预处理主要包括两个部分。
1)利用热线记录数据, 生成文档词条矩阵(do-cument term matrix, DTM): 将从原始网页表单中获取的内容整理为结构化数据, 对热线记录的来电标题进行分词、停用词处理等, 生成 DTM。该矩阵包括每条记录中每个关键词出现的次数, 热线记录来电标题中的内容转化为DTM的行向量。
2)位置提取和地理编码: 对热线记录的来电标题和来电内容, 以方位介词(如“对面”、“里面”、“下面”、“前”、“后”和“楼下”)和地点代词(如 “店”、“路”、“楼”、“门”等)为匹配标志, 经过多轮提取, 获得含地名信息的记录 125867 条, 占所有记录数的 68%。利用百度地图的地理编码 API, 查询地名对应的经纬度, 并进行坐标系转换, 将含地名的热线记录可视化到地图上。
在数据预处理的基础上, 采用高频词及相关性网络, 识别城市热点问题, 分析各类热点问题的时空分布特征; 对城市问题发生密度与 POI 及路网数据进行回归分析, 寻找影响城市问题发生的要素。
1.3.1 高频词相关性与城市热点问题提取
基于 DTM, 计算高频词之间的相关系数矩阵, 并可视化为高频词相关性网络。
针对城市问题的提取方法, 目前研究较少, 尚未建立完整的城市问题谱系, 缺乏统一的城市问题分类和识别方法。本文利用热线记录的高频词相关性网络, 用相关的一组高频词, 确定某一类问题。比如“噪声”、“噪音”、“大声”和“吵闹”等高频词, 如果在相关性网络中有较强的联系强度, 则划分为一类城市问题, 并以居于相关性网络中心位置的词语(如“噪声”)进行命名。若某条记录含有该类问题中的某些高频词, 则将该记录归为该类问题。
1.3.2 空间格网化和多元回归分析
为建立统一的分析单元, 将三亚市的行政区域范围离散化为 1 km 的格网。
从时间成本和方法验证的角度考虑, 本文选取发生数量最多的前 5 类问题, 计算每个格网中的问题点数量, 并作为每类城市问题的密度(个/km2)。同样地, 将 POI 数据中原有的 13 个类别作为城市不同的功能类别, 计算每个格网中每类 POI 点的数量, 并作为 POI 密度(个/km2); 计算道路网的长度, 并作为道路网密度(m/km2)。对 5 类城市问题密度与 13 类 POI 的密度、道路网密度进行多元回归, 分析不同类型的城市问题发生与城市不同功能的密集程度和道路网密度的关系, 判别影响城市问题发生的因素。
研究中采用的分析工具包括 Python 语言(2.7版)、R 语言(3.4.3 版)和 ArcGIS(10.2 版)。地图采用WGS1984 坐标系和横轴墨卡托投影。
2.1.1 时间分布特征
本文选取 2018–10–02 至 2019–02–15 共 137 天的热线记录, 采用逐日、逐周和逐小时 3 个时间尺度, 分析热线记录在时间上的分布特征(图2)。
如图 2(a)所示, 2018/10/01 为周一, 记录数量呈以一周为周期的波动, 表现为周末下降, 周中上升。此外, 记录数量在假期处于下降趋势。以日均热线数量 1000 作为标准, 除少数周末外, 平时的记录数均在 1000 以上, 而国庆、元旦和春节3个假期的记录数基本上在 1000 以下。从图 2(b)可以看出, 除国庆等 3 个假期外, 每周的数量变化趋势基本上相近, 周末的记录数量普遍少于周中, 在日均 1000左右波动; 周中记录数在日均 1500 左右波动。从图 2(c)可以看出, 一天内的记录数量存在两个高峰, 分别是上午 9—11 点, 下午 15—17 点。
图2 热线记录数量的时间变化
Fig. 2 Temporal variations in hotline record number
2.1.2 空间分布特征
在所有来电热线记录中, 有 12 余万条记录含位置信息, 如图 3 所示。热线记录中投诉问题的位置与道路网在空间上有高度的匹配关系, 表明社会经济活动密集区域是投诉问题的高发区域。
2.2.1 高频词分析
热线记录来电标题高频词的前 50 位统计结果见图 4。高频词分布可以反映热线记录中的关注重点, 如咨询与投诉是拨打“12345”热线的两类主要目的, 所反映的问题集中在民生领域, 如“小区”、“扰民”、“噪音”、“施工”等关键词反映出市民对周边生活环境的关注。
2.2.2 热点问题提取结果
高频词的相关性网络见图 5。可以看出几个明显的联系中心, 如高频词“车辆”与“停放”、“车道”、“违停”、“停车场”和“车位”等具有较高的联系强度, 将该类语义集群确定为一类城市问题, 即停车问题; “噪音”与“音响”、“音乐”和“唱歌”有较强的联系, 同时也与“工地”、“施工”有较强的联系, 由于本文只考虑问题的表现形式而不考虑造成问题的原因, 所以将噪声定义为一类问题, 将建设施工定义为另一类问题, 对于施工和工地造成的噪声干扰这种交互式问题在后续研究讨论。
结合图 4 和 5 以及对原始热线记录的判读, 提取出热线记录中涉及的主要城市问题, 如表 1 所示。在投诉的问题方面, 噪声记录数量最多, 其次是建设施工和通信网络等问题。
具体而言, 在交通出行方面, 除停车问题外, 关于公交车和出租车的记录也很多; 非机动车中, 对电动车和三轮车有较多投诉, 文本中没有自行车这一关键词, 说明相关举报较少。在交通场所方面, 车站和机场作为关键词出现, 由于三亚市未修建地铁, 故地铁未出现在关键词列表中; 交通存在拥堵现象, 但不严重; “黑车”也有一定数量的反映。在生活设施方面, 城市用水和城市用电是反映的主要内容, 包括停水、停电等具体问题以及关于水质、水压的投诉与咨询等; 对城市用气也有一些提及。在环境方面, 垃圾是提及最多的板块; 存在反映环境污染的记录, 但数量不大; 对空气质量有一定的关注, 特别是对一些区域臭味、异味等的反映; 城市积水在记录中有少量提及。
图3 含位置信息的热线记录空间分布
Fig. 3 Spatial distribution of hotline records with location information
图4 热线来电标题内容的高频词分布(前50位)
Fig. 4 Distribution of high frequency words in the title of hotline records (Top 50)
为刻画不同热点问题的特点, 进一步选择噪声、建设施工、通信与网络、城市用水以及停车这 5 类记录数最大的问题, 统计在时间和空间上的分布, 分析不同问题的发生规律。
2.3.1 时间分布
1)日际变化: 5 类热点问题每日的数量变化如图 6 所示。可以发现, 虽然不同热点问题的时间变化模式不尽相同, 但都具有周期性波动, 与总体记录数的变化趋势相近。
具体而言, 建设施工类和噪声类问题的记录较多, 基本上在每天 100 条以上波动, 其余 3 类问题基本上在日均 100 条以下波动。建设施工问题在春节期间迅速下降, 反映春节期间建设施工量的减少。此外, 城市用水问题的时间序列有一些极高的峰值, 可能是由于城市停水而引发大范围的投诉和询问, 这类区域性问题与噪声、停车等局部性问题发生的时间存在明显的差异。
2)小时变化: 按一天 24 小时统计 5 类问题在每小时上的数量, 如图 7 所示。可以看出, 5 类问题的变化模式明显分为两个类别, 第一类是建设施工和噪声, 特点为夜间的记录数比白天多; 第二类为通信网络、停车和城市用水问题, 体现为白天数量较多, 且波动趋势类似总体记录, 同样在上午 9—11点和下午 15—17 点出现峰值。
线段表示联系强度, 越粗表示词语之间的相关性越强, 颜色越相近表示关键词所属的语义类群关联越紧密
图5 高频词相关性网络
Fig. 5 Correlation network of high frequency words
此外, 噪声与建设施工问题的记录呈现非常相似的变化趋势, 特别是在夜间。由此推断, 很多噪声问题是由建设施工引起的, 特别是夜间的建设施工会引发大量的噪声类投诉。
2.3.2 空间分布
将 5 类问题中具有空间信息的记录映射到地图上, 如图 8 所示。5 类问题的分布具有相似的空间模式, 集中在城市中主要的经济活动区域。
从以下两个层面展开城市问题的影响要素分析: 1)热点问题与道路网和 POI 总体密度的关系; 2)热点问题与不同类别 POI 的关系。
2.4.1 热点问题与道路网和 POI 的关系
1)热点问题与道路网密度。对热点问题密度与道路网密度进行普通线性回归, R2 为 0.0224, 说明问题发生与道路网密度的联系比较弱。分别对 5 类热点问题与道路网密度进行回归分析, 得到的结果相近, 都表明与道路网密度的关联较小。这个结果证明了热点问题与城市道路网之间是一种间接关系, 热点问题的出现受其他因素的影响。
2)热点问题与 POI 密度。对 5 类热点问题的单个密度以及总体密度与 POI 密度进行回归, 分析结果如图 9 所示。停车问题密度与 POI 密度的 R2 为0.6238, 噪声与 POI 密度的 R2 为 0.5156。鉴于 POI密度在某种程度上反映社会经济活动的强度, 而停车和噪声等问题在经济强度较大时容易发生, 该结果符合实际情况。建设施工密度与 POI 密度的 R2为 0.2829, 在 5 类问题中最低, 表明建设施工活动不会在 POI 高度密集区域(城市核心繁华区域)进行。城市热点问题的总体密度与 POI 密度的 R2 为0.2093, 低于 5 类热点问题分别的回归结果。
表1 热线记录中的主要城市问题
Table 1 Major urban problems in hotline records
问题关键词举例记录条数 噪声噪声、噪音、大声、吵闹14199 建设施工施工、工地、工人、工程、工钱14086 通信与网络电话、电信、有限电视、网络、信号9617 城市用水停水、供水、污水、水源、水质、水管、水压、下水道、水井、自来水、水库9325 停车停车、停车位、停车场、停车费、车位、停放、停靠8323 城市用电供电、停电、电费、电线杆、电缆、电网、电线3779 机动车汽车、摩托车、拖车、货车、小车3558 非机动车电动车、三轮车3443 垃圾垃圾、垃圾桶3136 交通场所车站、火车站、机场2439 拥堵拥堵、堵塞、堵住1991 消防消防、消防栓1587 环境污染污染、环境、排放782 城市用气天然气、燃气721 空气空气、臭味575 黑车黑车348 积水积水214
图6 5类热点问题的逐日分布
Fig. 6 Daily distribution of the number of five hot problems
图7 5类热点问题按小时统计的数量分布
Fig. 7 Distribution of hourly statistic number of five hot problems
2.4.2 热点问题与不同类别 POI 的关系
将 5 类热点问题的单个密度和整体密度与各类型 POI 密度进行回归分析, 结果如表 2 所示。可以看出, 产生噪声问题的 POI 类型有交通设施、科教文化、商务住宅和生活服务, 抑制噪声产生的类型有金融保险、政府机构及社会团体和住宿服务。建设施工问题在交通设施和科教文化集中的区域最突出, 在金融保险和政府机构集中区域最少。通信网络问题在科教文化和政府机构集中区域最多, 在体育休闲区域较少。城市用水问题在公共设施、科教文化和商务住宅集中的区域最多, 在政府机构集中区域较少。城市停车相关问题在风景名胜、体育医疗和政府机构等区域较少。整体而言, 公共设施、交通设施和科教文化集中区域最易引发城市问题, 风景名胜、体育休闲和政府机构及社会团体所在区域引发的城市问题较少。值得注意的是, 政府机构和团体类型的 POI 密度在所有回归结果中都在 0.01 水平上显著, 除与通信网络的回归系数为正值外, 与其余城市问题的回归系数均为负值。
图8 5类热点问题中具有位置信息热线记录空间分布
Fig. 8 Spatial distribution of hotline records with location information in five problems
图9 热点问题密度与POI密度的回归分析
Fig. 9 Regression analysis of hot problem density and POI density
表2 各类热点问题与POI类型的回归结果
Table 2 Regression results of various hot problems and POI types
POI类型噪声建设施工通信网络城市用水停车整体问题 餐饮服务0.211*–0.320*0.086*0.058*0.102*–0.212* 公共设施2.838*3.275*2.337*4.609***4.399*60.176*** 购物服务0.046*0.316***0.037*0.094**0.070**0.955* 交通设施2.622***4.100***0.320*1.116*1.233*18.522*** 科教文化4.964***4.266***2.065***2.726***2.492*39.878*** 金融保险–5.526***–6.562***0.645*–2.774**1.220*–2.902* 风景名胜–1.854*–2.332*–0.799*–1.352*–1.189***–20.667** 商务住宅1.860***0.255*–0.060*1.370***1.122*7.412* 生活服务1.174***1.324***–0.167*0.168*0.165*1.856* 体育休闲–0.987*–2.159**–1.062***–0.787*–1.296***–16.084*** 医疗保健0.612*0.111*–0.038*1.258*–0.703***7.386* 政府机构及社会团体–4.500***–4.280***1.575***–2.104***–0.706***–14.366*** 住宿服务–0.352***–0.304**–0.065*–0.154**–0.164***–1.391* 截距5.108*7.850**0.981*4.523***–0.353***44.414** R20.5870.3490.4860.4980.6940.538
注:*表示显著性水平为0.1, **表示显著性水平为0.05, ***表示显著性水平为0.01。
城市中有大量的数据, 除“12345”热线记录外, 通过布设摄像头和传感器等, 可以收集与城市有关的人流、车流、气候、污染等各方面数据, 实时监测城市的运行体征, 刻画城市各类活动的时空模式。
通过积累这些数据, 可以分析并持续跟踪城市发生的主要问题, 获取不同类别城市问题的时空分布特征, 进而对城市空间和功能进行调整, 优化政府的资源投入配置。比如, 三亚市“12345”热线中反映问题最多的类别为建设交通类, 因此可倾斜对建设交通的投入, 优化政府资源的配置。Wang 等[17]利用社交媒体数据中反映的内涝信息, 进行城市内涝风险制图。同样地, 市民热线中也有反映城市积水问题的记录, 并有对积水点位置的描述, 因此可以通过内涝风险分析, 对易积水位置的市政设施和用地属性等进行调整。
重视对城市中产生的多源异构数据的积累和整合[18], 构建统一的数据平台。以空间位置为纽带, 整合“12345”市民服务热线、街景图片、房价、土地利用类型等不同来源、不同类型的城市特征数据, 形成城市数据的统一分析和管理平台。
利用多源的城市特征数据, 分析城市问题发生的影响因素。在明确各种因素作用机制的基础上, 结合城市中历史问题的发生情况、基础地理数据、社会经济和人口数据等, 采用张量分解、卷积神经网络和长短期记忆模型等时空推断技术, 预测城市未来问题发生的区域和可能性, 有助于对城市问题进行预警和提前应对。
“12345”市民热线中反映出一些影响范围较大的事件, 会在一段时间内引发市民的普遍关注和投诉, 在停水、停电和停气等事件上, 可以通过手机短信和网络发布等渠道, 提前向特定区域的市民发布通知, 避免大面积的投诉和询问, 改进沟通服务水平。
利用大数据和人工智能技术, 建立城市各个部门的沟通与合作机制, 减少部门条块化分割带来的信息封闭与重复行动。在某类具体城市问题发生后, 各部门能根据明确的权属和职责, 高效地协调解决问题。如建设施工管理部门和城市规划部门可以根据城市功能区域的不同, 差异化地制定夜间建设施工的时间, 避免噪声对周边市民生活的干扰。
逐步提高城市数据的开放和共享程度, 赋能城市管理和公共服务供给市场, 利用大数据的信息开放, 为政府由管理向服务转型提供平台与保障。同时, 需要注意数据开放可能发生的个人隐私泄露等问题[19], 塑造开放、共享、公平和高效的新型城市治理体系。
本文通过对海南省三亚市“12345”热线记录数据的分析, 验证了“12345”数据用于城市公共管理问题挖掘方面的有效性, 能够从城市问题谱系形成、时空模式刻画及影响因素分析等方面, 促进对城市问题的认识与城市的精细化管理。进一步地结合城市中的多源数据, 推断城市问题发生的可能区域和概率。在统一的数据共享平台上逐步提升数据开放程度, 完善城市功能, 提高定向服务水平, 推动城市治理体系的优化。
城市是一个复杂的系统, 在时间上具有随机性和即时性特征。城市问题的发生受多种因素的综合影响, 所以仅使用路网和 POI 数据还不能充分反映问题发生的机制, 总体解释程度偏低。未来的研究需要结合土地利用、城市功能、社会经济和人口数据等, 通过多种途径对城市问题进行刻画, 对基于大数据等技术方法得到的城市时空模式进行验证和评估, 从而更周密地探究城市问题的影响机制。
致谢 北京大学建筑与景观设计学院研究生司雨田参与数据处理, 在此表示感谢。
参考文献
[1] 施雪华. “服务型政府”的基本涵义、理论基础和建构条件. 社会科学, 2010(2): 3–11
[2] 安体富, 任强. 公共服务均等化: 理论、问题与对策. 财贸经济, 2007(8): 48–53
[3] 邬伦, 宋刚, 王连峰, 等. 从数字城管到智慧城管: 系统建模与实现路径. 城市发展研究, 2017, 24(6): 114–121
[4] 宋刚, 张楠, 朱慧, 等. 城市管理复杂性与基于大数据的应对策略研究. 城市发展研究, 2014, 21(8): 95–102
[5] Tsakalozos K, Johns C, Monroe K, et al. Open big data infrastructures to everyone // IEEE International Conference on Big Data. Washington, DC, 2016: 2127–2129
[6] 龙瀛. 城市大数据与定量城市研究. 上海城市规划, 2014(5): 13–15
[7] 钟少颖, 岳未祯, 张耘. 基于公交刷卡数据和兴趣点数据的城市街区功能类型识别研究——以北京市朝阳区为例. 城市与环境研究, 2016(3): 67–85
[8] 王忠, 安智慧. 国外城市管理大数据应用典型案例及启示. 现代情报, 2016, 36(9): 168–172
[9] Zanella A, Bui N, Castellani A, et al. Internet of things for smart cities. IEEE Internet of Things Journal, 2014, 1(1): 22–32
[10] Debnath A K, Chin H C, Haque M M, et al. A methodological framework for benchmarking smart transport cities. Cities, 2014, 37(2): 47–56
[11] Zheng Y, Liu T, Wang Y, et al. Diagnosing New York City’s noises with ubiquitous data // Proceedings of the 16th ACM International Conference on Ubiquitous Computing. Seattle, 2014: 715–725
[12] 熊竞. 大数据时代的理念创新与城市精细化管理. 上海城市管理, 2014, 23(4): 23–26
[13] 简逢敏, 王剑. 数字城市群若干问题的思考——以长三角城市群发展为例. 上海城市规划, 2011(5): 95–102
[14] 吴国玖, 金世斌, 甘继勇. 政务热线: 提升城市政府治理能力的有力杠杆——以南京市“12345”政府公共服务平台为例. 现代城市研究, 2014(7): 98–102
[15] 曹现强, 顾伟先. 政府服务热线标准化与整体性政府的构建——以济南市 12345 热线为例. 公共管理与政策评论, 2014, 3(3): 36–45
[16] 雷望红. 被围困的社会: 国家基层治理中主体互动与服务异化——来自江苏省 N 市 L 区 12345 政府热线的乡村实践经验. 公共管理学报, 2018,15(2): 43–55
[17] Wang R Q, Mao H, Wang Y, et al. Hyper-resolution monitoring of urban flooding with social media and crowdsourcing data. Computers & Geosciences, 2018, 111(2): 139–147
[18] Zheng, Y. Methodologies for cross-domain data fu-sion: an overview. IEEE Transactions on Big Data, 2015, 1(1): 16–34
[19] 薛孚, 陈红兵. 大数据隐私伦理问题探究. 自然辩证法研究, 2015, 31(2): 44–48
An Approach for Discovering Urban Public Management Problem and Optimizing Urban Governance Based on “12345” Citizen Service Hotline
Abstract This paper puts forward a new approach for analyzing the problems of urban public management based on the data collected from “12345” citizen service hotline. The research sets up the geocoding by the extraction of the spatial information from the call logs of Sanya City, Hainan Province. Meanwhile, the characteristics of time, space and categories of inquiries are documented and depicted by combining the original information of hotline records with the geocodes. By using high frequency word distribution and correlation network, the research reveals the major problems of cities, and analyzes the featured spatial-temporal distribution patterns of corresponding problems. The factors which affect the occurrence of urban problems are discussed with the combination of other urban characteristics including various types of point of interest (POI) representing urban functions and road network representing urban structure.The results are as follows. 1) The frequency of calls fluctuates on a weekly basis, and the total number of records in midweeks is larger than that of the weekends. 2) The hottest five categories of urban problems are noise, construction, communication and network, urban water use and parking issues, among which the noise and construction problems are closely correlated. 3) Different urban problems undergo distinct temporal patterns, while all of them are distributed in urban activity-intensive areas. 4) The occurrence of urban problems is not significantly relative with the density of road network, but positively relative with the POI densities of public facilities, transportation facilities, and educational and academic facilities, and significantly negative with the POI densities of scenic spots, sports and entertaining utilities, and administrative offices. The results demonstrate the effectiveness of “12345” citizen service hotline in urban problem discovery and depiction. Furthermore, this paper proposes several pathways for the optimization of urban governance using big data. For instance, the accumulation and analysis of urban data, the integration of multi-source data, and the enhancement of the degree of data share should be seriously appreciated. It’s necessary to utilize these data to support the fine urban governance and promote the construction of smart city.
Key words “12345” citizen service hotline; urban problem; text mining; spatial analysis; urban public manage-ment
doi: 10.13209/j.0479-8023.2020.041
收稿日期: 2019–08–03;
修回日期: 2019–09–19