文献综述(或调研报告):
由于本文所研究课题是较为前沿的方向,目前现有的深度学习方法应用于网约车供需预测问题的较少,且几乎以外文文献为主,所以在进行文献综述工作时,全部阅读外文文献,且在广泛阅读与本课题相关性较高的为数不多的文献后,还涉猎了多任务学习框架在旅行时间预测、公共交通需求预测、自然语言处理等方面的处理思路,以及多模态机器学习、深度网络在交通领域的应用、深度时空残差网络在行人流预测等方面文献。
下面就与本课题紧密相关的文献做综述:
(1)Wang,Dong等人是最早一批利用深度神经网络进行网约车供需预测研究的,提出了名为“深度供需(Deep Supply-Demend,DeepSD)”的端到端深度神经网络学习框架[1],用于短时城市级网约车供需缺口预测。该模型可以自动从打车服务数据中发现复杂的供需模式,而只需要很少的手工设置功能。并且该框架具有高度的灵活性和可拓展性,可以利用多个数据源数据进行高精度预测。主要工作包括(1)提出基于深度学习的端到端学习框架,可以自动学习不同时空特征的模式;(2)受残差网络(ResNet)的启发,提出了一种新的神经网络结构用于图像分类,可以将环境等外部因素纳入模型;(3)使用嵌挤方法(embedding)进行高维到低维的投影,降低计算复杂度并自动挖掘供需模式之间的相关性,提高预测精度;(4)提高模型的可拓展性,通过残差学习组分,通过“微调”(fine tuning)策略利用已训练部分加快模型收敛;(5)在真实数据集上进行实验,得出结论比当时最好的现有方法降低11.9%的误差。
但是,该方法由于是早期研究之一,所以存在以下几个问题:(1)与之进行对比的算法仅是经典算法和早期传统机器学习算法,说服力欠缺;(2)未对计算性能做说明与研究;(3)未考虑多步预测,仅局限于下一个时间片;(4)依赖于通过网格状进行划分的城市区域。
(2)Ke,Jintao等人也是最早的一批针对网约车乘客需求短期预测进行研究的,提出了“融合卷积长短时记忆网络”模型(fusion convolutional long short-term memory network,FCL-Net),这是一种同时考虑时间、空间和外部因素的端到端学习框架[2],该模型堆叠并融合了多层卷积长短时记忆层、标准LSTM层和标准卷积层,该结构能够更好地捕捉时空特性和解释变量之间的相关性。主要工作包括:(1)在模型中同时纳入时空变量(如需求强度和旅行时间速率)和非空间的时间序列变量两类变量,提高预测性能;(2)设计了一种空间集聚随机森林模型用于进行解释变量重要性排序,从而进行特征选择而保留大部分有用信息去除冗余信息而提高性能;(3)在模型性能评价中,增加了一个确定系数R方的评估指标。但是同样由于是早期研究存在以下问题:(1)虽然与五类benchmark算法进行了比较,包括3种卷积时间序列和2种经典深度学习算法,但这些算法都是基础算法说服力欠缺;(2)依赖网格状划分方法(3)计算性能分析上,仅是理论分析了利用空间集聚随机森林进行特征选择后降低了计算复杂度,但是未从实验上进行验证。
(3)Zhang,Zheng,Qi等人提出一种深度时空残差网络(ST-ResNet)用于城市拥堵地区的行人流预测[3],该方法虽然不是应用于本课题的研究领域,但是残差网络近两年方法广泛被用于网约车乘客需求预测问题,并作为基准算法用于比较。本文的主要工作包含:(1)基于卷积的残差网络对城市中任意两个区域之间的远近空间依赖关系进行建模,并可以保证预测精度与神经网络结构无关;(2)分别使用三个残差网络对时间序列数据的封闭性、周期性和趋势性三个特征分别建模,并动态地聚合三个网络的输出,为不同的分支和区域分配不同的权重并与外部因素结合,进一步提高预测性能。由于早期不是应用于本研究课题,所以到目前为止发展较少,预测性能由于网络设计简单,只使用单一任务进行预测,存在预测性能的天花板,一般作为基准比较方法。
(4)Yao等人针对出租车需求预测问题,提出了一种新的深度多视点时空网络模型(Deep Multi-View Spatial-Temporal Network,DMVST-Net)[4],该模型集成了空间、时间和语义视点,分别采用局部CNN(local CNN)、LSTM和语义图嵌入法(graph embedding)分别建模,从而考虑空间相邻、时间相邻、空间不相邻但需求模式类似各类型区域数据之间的相关性,提高预测性能。主要工作包括:(1)提出统一的模型,将以前研究中分别考虑的时间、空间和需求模式相关性同时考虑,提高预测性能;(2)提出的局部CNN模型,可以过滤掉空间相关性不高的区域,去除冗余信息从而提高性能;(3)通过语义视点,补充局部CNN中过滤掉的空间相关性不高但是需求模式相似的区域。但由于是第一批将三个因素同时纳入一个统一模型的研究,存在以下问题:(1)对于三个独立方法得到的输出,通过一层全连接层简单地进行连接后直接使用,并没有融合特征之后再加以利用,可能降低预测性能;(2)对于语义图的解释比较含蓄,缺少一些显式信息进行说明;(3)在对三个图的不同组合情况下进行性能对比时,无法说明三个图组合的效果有较大提升。
(5)Kuang等人提出了一种基于多任务学习框架的出租车供需预测的3D卷积神经网络方法(Taxi3D)[5],该方法首先从历史数据中为一个时间片选择三个高度相关的部分,即时间封闭性、时效性和趋势性,然后将供需双边预测视为相关任务构造多任务学习框架,引入基于注意的LSTM实现功能嵌入,并用3D ResNet捕获出租车上下客之间的相关性,最后结合外部因素来共同预测。主要工作:(1)将上下车视为相关任务,提出基于多任务学习和3D CNN模型的特征挖掘组分,用于同时获取时空特征;(2)通过基于注意的LSTM将时空特征转换为张量,然后将张量视为一个包含了半小时内需求状态的帧组成的视频,使用3D ResNet来捕捉时空相关性和上下车之间的复杂相关性;(3)结合外部因素,如天气、周末和公共交通交通,同时预测上下车。该方法相比早期的模型以及上文提到的ST-ResNet残差网络基准方法已经有了大幅度的提高,尚不完善的地方有:(1)尚未利用时间序列异常检测算法提高热点地区的预测性能;热点地区倾向于离群数据,对于模型训练和预测性能有较大影响;(2)未对多步预测进行研究,还是只能预测下一个时间片的出租车需求预测。
(6)Bai等人提出了一种基于多任务卷积递归神经网络(MT-CRNN)的乘客需求预测模型[6]。为了解决现有方法中存在的局限性,如对于相关区域的选择和解决外部因素直接利用导致的误差偏大等问题,该模型首先根据目标区域的兴趣点(POI)信息或历史需求数据为每个区域选择相似区域,利用CNN提取其空间相关性,其次将外部因素映射到未来的需求水平,作为多任务学习框架的一部分以提供预测性能。并且该算法,是第一批可以不借助网格状划分城市区域的算法,这更符合现实城市格局分布。主要工作包含:(1)提出基于多任务深度学习的乘客需求预测,利用多任务之间共享的信息提高性能;(2)提出基于相似度的CNN毛小姑娘来捕捉只与相似区域相关的空间相关性,滤除弱相关区域的影响;(3)将未来乘客需求水平(level)作为辅助任务进行预测和分类,以更好地利用外部特征,提高性能。该模型已经是逐步完善的用于乘客需求预测的深度学习算法,相比与第二代算法(如DMVST-Net)在误差上又降低了5%左右,稍显不完美的地方在于:(1)在考虑区域相关性时,从POI数据中仅能得到空间相关性,而历史数据仅能得到时间相关性,在时空相关性的共同挖掘方面存在瑕疵;(2)本算法在文中数据集下的误差与其他文献中展示的误差相比偏大, 没有进行原因分析。
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。