4月7日下午,“统计大讲堂”系列讲座第148讲举行。本次讲座采取在线会议的方式,邀请中国科学院数学与系统科学研究院副研究员,实验设计与不确定性量化研究中心主任熊世峰作题为“基于刷卡数据的地铁客流统计分析”的报告。统计学院副院长尹建鑫主持本次讲座。
尹建鑫首先介绍了主讲人的相关信息。熊世峰是中国科学院数学与系统科学研究院副研究员,实验设计与不确定性量化研究中心主任。研究方向包括计算机实验与不确定性量化、高维数据分析、统计推断、机器学习等,统计应用方面的研究主要是数字孪生、交通大数据分析、质量与可靠性等。在Biometrika, Technometrics, IISE Transactions等统计学、工业统计、工业工程期刊发表论文 50 余篇,在质量特性统计建模与分析方面的工作曾获科技进步二等奖。
熊世峰首先回顾了课题的背景。如今地铁是北京等大城市最重要的出行方法之一,地铁系统的控制与安全成为了打造城市智能交通的重要方面。乘客流的估计与预测对地铁管理部门非常重要,尤其在早晚高峰和极端天气、突发事件时。地铁数据通常只有AFC(记录乘客进出站刷卡信息)和AVL(记录车次信息)数据,而乘客在地铁系统中的活动轨迹完全未知,相当于一个黑箱。
基于此背景,熊世峰团队建立了乘客刷卡时间数据的动态统计模型,并给出了模型中参数的估计方法,完全由数据驱动,不同于文献中的已有推断方法都需要其它辅助信息。此外,该模型可以用于推断乘客流的各类指标,包括总体指标(如乘车概率和出站走行时间分布等)和个体指标(如个体最大可能乘坐的车次等),以及用于乘客出站时间的实时(区间)预测。熊世峰与其团队应用该方法分析了北京地铁6号线的客流,比较了高峰期和非高峰期客流的不同特点。
熊世峰接着阐述了该模型在交通客流方面的应用,以及运用到北京地铁的实际数据分析。以北京地铁6号线为例,对高峰期和平峰期分别进行数据的统计和研究,共采集两万多份数据,结合生活实际,以模型为基础,通过统计分析进站和出站时间,建立了动态统计模型,预测了高峰期和平峰期的车次概率变化和乘客乘车特征。
最后,熊世峰进行了总结,指出该模型未来仍有许多发展方向。实际情况中存在许多不确定性,无法确定具体路线,乘客个体行动具有非独立性,二次函数建模可继续转向非参数建模。同时,将整体交通网络的客流特征用统计方法描述清楚,还有许多工作值得去做。
提问交流环节,同学积极参与讨论,熊世峰耐心解答了许多疑问,深入探讨了模型参数方面的问题。
本次讲座介绍了基于刷卡数据的地铁客流统计分析,阐释了研究模型以及相关参数,建立了用大数据研究交通客流的统计思想。此后“统计大讲堂”系列将陆续推出更多精彩讲座,敬请关注。