2019年6月5日,我院举办的“统计大讲堂”第八十一讲在明德主楼1016举行。本次报告邀请了美国威斯康辛-麦迪逊大学统计系张安如助理教授分享了他的研究成果。我院尹建鑫副教授主持了此次报告会,参加此次报告的还有孙怡帆副教授、王星副教授。
尹建鑫副教授首先介绍了报告人。
张安如助理教授本科毕业于北京大学数学系,在宾夕法尼亚大学获得统计学博士学位,之后加入威斯康辛-麦迪逊大学统计系及数据科学基础研究中心。张安如助理教授的科研方向主要包括高维统计推断、张量数据分析、统计学习理论。
张安如助理教授的报告题目是:Optimal Tensor Singular Value Decomposition。张安如助理教授首先介绍了研究问题的背景。在大数据时代随着数据获取技术的提高,数据的维度也随之增大,传统的矩阵形式已经不能有效反映数据间的结构信息,张量型数据也应运而生。例如人类微生物组数据,不同个体、不同器官、不同微生物种类分别构成了数据的三个维度,从而生成了一个三阶张量。除此之外,经典统计模型如回归中若要考虑变量间的高阶交互效应也会产生张量型数据。目前对张量型数据进行奇异值分解(SVD)已经有很多算法,但还没有建立起一个统计框架。张安如助理教授将其建模为张量低秩结构恢复问题,在此框架下分析了已有算法在统计和计算上的估计误差上下界。除此之外,张安如助理教授还提出了一种稀疏张量SVD算法,通过把张量分别朝各个维度矩阵化后做SVD,取阈值降噪,迭代收敛到原张量的最优稀疏估计。在一定的信噪比条件下该算法不仅可以达到估计误差的最优下界,同时计算复杂度低于现有算法。
报告结束后在场师生与张安如助理教授关于张量SVD中核心张量(core tensor)与矩阵化奇异值的关系、估计误差的度量以及张量SVD与函数型数据的结合进行了热烈讨论。