基于多源地理大数据与机器学习

2021-10-20 11:00:02

交通出行是居民为特定目的或活动转换到对应位置或场所而产生的在空间上的位移需求[1]。城市交通出行的空间分布,与人口、设施的空间分布密切相关[2]。分析城市不同类型出行需求的空间分布规律,并探讨其与城市空间结构[3]、城市土地利用[4]的关系,是城市交通与土地利用一体化发展的基础[5]。交通大数据具有样本量大、时效性强的特征[6],能够弥补传统交通调查数据样本量相对不足的局限性,已逐渐成为智能交通规划与管理的关键技术之一。随着各国“公交都市”等绿色交通理念的普及和政策实施,基于智能卡数据(Smart Card Data, SCD)的居民出行监测与管控技术体系正在受到普遍关注[7,8,9,10,11,12],被广泛应用于城市交通流时空分布[13,14,15]、居民出行规律[16,17]等相关研究中。然而,SCD缺乏出行目的、持卡人社会经济属性等详细信息,使得SCD在信息挖掘方面受到限制。相关研究针对SCD技术的这一缺陷,探索出2种SCD出行目的的识别方法。① 依据对每次出行终点的土地利用特征、在终点驻留时间等设定的假定条件判断每个持卡人每一次出行的出行目的地是属于工作地、居住地或其他地点。接下来通过计数或聚类方法,筛选出每个持卡人的居住地和就业地[14-15,17]。在此基础上,可根据每个持卡人每次出行的目的地识别该次出行的出行目的。该方法简单有效,但没有真实值对假定条件进行检验,存在着基于主观经验、缺乏统一标准等问题。② 首先对某一地铁乘客进行出行调查,并基于调查数据,训练用于地铁出行目的识别的分类器。随后使用分类器对该地铁站SCD记录的每一次地铁出行进行分类,预测该次出行的出行目的[16]。相对于方法①,该方法可基于真实调查数据进行检验,更具说服力。然而仅采用一个地铁站的SCD与出行调查数据,会忽略城市内部来自不同区域乘客在社会经济属性、出行行为习惯等方面的差异。从规划管理与政策制定的角度,对整个市域或区域地铁出行目的识别方法的研究更具实践价值。

本文基于城市交通与土地利用交互作用理论,在方法② 基础上纳入对土地利用特征的考虑,进一步探索城市全域范围内地铁乘客出行目的的识别方法。根据城市交通与土地利用交互作用理论[5],地铁站周边的土地利用与地铁出行量息息相关[18,19,20,21],同时也会影响居民出行方式[22,23,24]以及出行目的地[25,26,27]的选择。本文以北京市作为研究区域,融合多源地理大数据进行随机森林(Random Forest,RF)分类器训练,在分类器训练过程中融入出行特征的同时纳入土地利用特征;随后使用RF分类器,对SCD记录的每一次地铁出行进行分类,识别对应地铁出行的出行目的,并对不同目的地铁出行时空间分布特征进行可视化。最后对比分类器①仅包括出行特征RF分类器,分类器②同时包括出行特征、土地利用特征的RF分类器效果,检验纳入土地利用特征对RF分类器效果是否有提升,以映证城市交通与土地利用交互作用理论。

2 研究理论基础、数据与方法

2.1 理论基础

研究基于城市交通与土地利用的时空互动理论。该理论表明,交通出行需求源于城市经济活动的空间分布,因而土地利用可以通过影响社会经济活动的空间分布来影响交通流的时空分布特征;交通需求时空分布与交通服务设施同时也会从城市土地价格方面影响城市土地利用,由此形成交通与土地利用的时空互动。

交通与土地利用时空互动同时体现在集计与非集计2个层面[5]: ① 在非集计(个体)层面,依据Alonso单中心城市模型,居民会在交通出行成本与住房成本中进行权衡、以实现自身效用最大化,由此形成微观个体层面交通出行与土地利用之间的互动[28]。② 在集计层面,依据Hansen“土地利用与交通系统之间存在动态循环”假设,不同土地利用类型的空间分离使得工作、居住、购物、休闲等活动在不同的城市区位进行。居民在日常活动区位切换过程中产生交通出行,交通出行汇总后形成不同区域之间的交通流,引发交通服务设施供给的变化,进一步影响区域可达性,并影响居民个体的出行决策,导致土地利用变化。因此,城市交通与土地利用之间存在时空间互动作用。

作者:赵鹏军 曹毓书来源:地球信息科学学报

地址:湖南省长沙市天心区新岭路66号天心软件产业园B栋10楼