多元函数型时间序列数据在大气科学、环境健康、空间流行病等领域是一种常见的数据类型。这类函数型数据在多元和时序层面存在双重相依性,其协方差结构同时受到多元、时序以及随机曲线自身维度上变异性的共同影响。复杂的相依结构降低了传统函数型主成分分析的统计推断效率与可解释性。针对这一问题,黄辉教授及其合作者引入图模型刻画数据的多元结构,并基于傅立叶变换提出一类定义在频率域上的动态弱可分条件,用于捕捉多元函数型时间序列的双重相依性。在此条件下,可将图结信息内嵌于函数型主成分分析当中,提高函数特征提取和信号重构的效率。论文从大样本理论以及数值模拟的层面论证了新方法的有效性,并将该方法应用于京津冀地区PM2.5空气质量的监测网络数据分析当中。除此以外,该方法可以广泛应用于人群的多污染物暴露计算、医学图谱多元信号提取、疾病地图绘制等方面的研究当中。
论文题目
Graphical Principal Component Analysis of Multivariate Functional Time Series
论文摘要
In this article, we consider multivariate functional time series with a two-way dependence structure: a serial dependence across time points and a graphical interaction among the multiple functions within each time point. We develop the notion of dynamic weak separability, a more general condition than those assumed in literature, and use it to characterize the two-way structure in multivariate functional time series. Based on the proposed weak separability, we develop a unified framework for functional graphical models and dynamic principal component analysis, and further extend it to optimally reconstruct signals from contaminated functional data using graphical-level information. We investigate asymptotic properties of the resulting estimators and illustrate the effectiveness of our proposed approach through extensive simulations. We apply our method to hourly air pollution data that were collected from a monitoring network in China.
作者介绍
谭键滨,杜克大学生物统计与生物信息学系博士后,主要研究具有函数型结构的数据对象,包括动态数据、时空数据和高维纵向/函数型数据的统计学习理论与算法。相关成果发表在JASA、JRSSB、Biometrics 等,并应用于大气污染、流行病建模等领域。谭键滨2023年博士毕业于中山大学数学学院,获中大优秀博士论文奖,导师为黄辉教授。
梁德才(共同第一作者),南开大学统计科学学院助理教授,北京大学统计学博士,主要研究领域为函数型数据分析、时空统计等。在统计学期刊JASA,Statistica Sinica等发表多篇论文。入选中国科协青年人才托举工程,主持国家自然科学基金青年项目。
官永涛,香港中文大学(深圳)校长讲座教授,美国统计协会会士。曾任美国迈阿密大学赫伯特商学院莱斯利·巴恩斯讲席教授,管理科学系系主任,德勤研究与实践分析所主任。其主要研究方向为时空数据分析及其在金融 、社交网络、 流行病学等领域中的应用。
黄辉(通讯作者),中国人民大学统计学院教授、博士生导师,2015年入选海外高层次人才引进计划(青年项目),主要从事时空数据分析、函数型数据分析等领域的方法学研究及其在大气科学、环境健康、流行病等交叉学科的应用。先后主持或参与国自科青年项目、面上项目和科技部国家重点研发计划子课题,自科重点项目子课题等国家级科研项目。
论文发表截图