第2章 空间移动的记录数据
2.1 移动数据科学的兴起
移动数据是指记录不同个体空间位置变化的数据集,反映了海量个体在空间上的移动。各种应用于个体尺度的空间定位技术、传感器技术和移动互联技术的广泛普及,使得各种要素在空间上的移动能够被监测和记录下来,其中蕴含的空间移动现象逐渐得到人们的普遍关注。例如在新冠病毒(COVID-19)感染全球流行时,为了抗击疫情,监测重点区域的人口移动,根据感染者的移动轨迹进行密切接触者排查和管控,对于疫情防控具有重要作用。随着各种类型空间移动监测数据的不断积累,移动数据科学(Moving Data Science)的概念开始兴起,移动数据被应用于各种领域,这对理解空间移动的模式和规律、指导现实管理和决策具有重要意义。
当前空间移动的行驶记录数据主要有两种类型,分别是轨迹数据和OD(Origin-Destination,起点-终点)数据。轨迹数据是空间移动的精确记录,主要连续记录移动个体的位置和时间,以形成一系列时间上连续的点,例如出租车的移动轨迹、共享单车的移动轨迹;此外,每一个点上除了时间信息外,还可以记录其他的信息,比如当前移动的方向和速度等。OD数据是空间移动的整体记录,主要记录空间移动的起点和终点,并没有包含中间过程的信息,例如乘坐飞机的起点站和终点站、乘坐火车的起点站和终点站。由此可见,移动数据中既包含空间位置信息,又包含时间信息,蕴含着丰富的空间分异信息和时间演变信息。挖掘不同类型移动数据中的时空分异规律对于现实问题的诊断和分析具有重要的意义。
轨迹数据能够说明车辆行驶过程中空间位置随时间变化的信息,因而轨迹数据一个最重要的应用就是探测并分析道路网络中的交通状态。例如,利用轨迹数据分析城市内部不同类型的交通拥堵,一种简单的思路就是根据轨迹数据中位置和时间的变化,计算出车辆的行驶速度。车辆正常行驶状态下的速度可以通过频率筛选或者规定限速等方式确定下来,高于和低于正常速度的状态都可能表明行驶的道路上出现了异常状况。当出现交通拥堵时,车辆的行驶速度将低于正常行驶速度,因而可以根据轨迹数据计算出的行驶速度,来说明拥堵发生与否。此外还可更进一步,根据计算出的速度低于正常速度的幅度和低速的持续时间,对交通拥堵的程度进行说明。虽然从轨迹数据中检测出的交通拥堵往往不具备较高的时效性,但是在城市尺度分析轨迹大数据,检测交通拥堵并分析交通拥堵的时空分布规律,并基于此进一步探讨城市内交通拥堵的驱动因素和产生的影响,对于促进城市内交通流管理、合理制定城市发展规划等方面具有重要的作用。还可基于轨迹数据检测出的交通拥堵的时空分布,研究不同方法实现对城市内交通拥堵出现规律的预测和模拟,以促进城市智慧交通建设。
OD数据着重强调空间移动的起点和终点,将OD数据的起点和终点在地图上进行展示,能够说明不同空间区域之间的关联,因而OD数据一种最重要的应用就是作为“流”数据,可以形象地称为“地理流”或者“空间流”,用于挖掘和分析空间关联模式和强度。空间关联模式的挖掘主要包含两个方面:一方面是进行大规模流数据的可视化,即通过几何形状合并、密度计算等操作,对海量个体OD数据直接进行空间展示时的相互遮蔽现象进行精简,实现主要流动模式和流动规律的可视化,从而从大规模OD数据中揭示主要的空间关联模式;另一方面是通过聚类的方法进行主要空间关联模式的挖掘,即对海量个体的OD连线按照几何分布形状进行聚类,相同类别表示具有相近起点和相近终点的OD连线,从而实现主要空间关联模式的揭示。基于可视化的空间关联模式揭示和基于聚类的空间关联模式揭示之间的区别在于,前者着重于流数据内在模式的空间展示,并不能充分支持定量的分析,而后者基于定量化的流特征进行聚类,可挖掘出主要的空间关联。
在当前技术发展的背景下,以轨迹数据和OD数据为代表的、表示个体空间位置变化的移动数据正快速累积。围绕着移动数据的特征,学者们提出了多种多样的理论和方法,以期实现移动数据中各种时空规律的挖掘,并将规律应用于现实问题的解决。各种移动数据相关的理论和方法蓬勃发展、相互补充,逐渐形成了独特的移动数据科学的内容体系。交通运输行业是移动数据产生的重要领域,通过对移动数据进行分析不仅可以挖掘出人的空间移动规律,还可以挖掘出货物的空间移动规律,因而在交通领域引入移动数据科学的相关理论与方法,对于促进交通管理、交通规划和交通经济发展,实现全方位的智慧交通具有重要的意义。