新闻

新闻

您当前的位置: 新闻
“统计大讲堂”系列讲座第五十讲
时间:2018-09-06

8月6日,我院举办的“统计大讲堂”系列讲座第五十讲在明德主楼1016举行。本次讲座,我院有幸邀请到匹兹堡大学的任钊博士来分享他的最新研究成果。任钊博士本次报告的题目是《Minimax Estimation of Large Precision Matrices with Bandable Cholesky Factor》。

讲座开始前,我院副院长尹建鑫老师对任钊博士的到来表示欢迎。任钊博士于2014年毕业于耶鲁大学统计系,其主要研究方向为高维统计推断、协方差/精度矩阵估计、图模型及统计机器学习等等。

讲座开始后,任钊博士首先介绍到今天他所报告的主题是关于具有带状(bandable)结构的精度矩阵(precision matrix)的最小最大估计问题。在大数据时代,高维数据,即变量个数多于样本量的数据,十分常见。而在现代生物、天文、医疗等领域,许多高维统计分析方法中需要计算精度矩阵。面对高维数据的问题,常用的应对方法便是对数据中引入某些合理的结构性假设,稀疏性便是一种常见的结构假设。任钊博士介绍到,在矩阵估计的问题中,稀疏性分为无序和有序两种情况,无序的稀疏性假设矩阵中非零元素的个数较少,但非零元素所在的位置并不做要求;而有序的稀疏性假设中,除了对非零元素的个数有所要求外,还对元素所在的位置有所要求。而带状结构,就是一种有序的稀疏性结构,它假设非零元素在矩阵中的位置呈现一种以对角线为起点逐渐衰减的带状结构。任钊博士说,如果对时间序列中的自回归模型的精度矩阵进行Cholesky分解,则其分解后的Cholesky因子便具有这种带状结构。所以,研究具有带状结构Cholesky因子的精度矩阵便具有相当的意义。


在此之前,对于协方差矩阵和精度矩阵的估计,已有不少结果。任钊博士说,对于协方差矩阵和精度矩阵在无序稀疏性的假设下和协方差矩阵在带状假设下的最小最大估计问题,已经Tony Cai等人完成。而对于具有带状假设的精度矩阵的最小最大估计问题,一直未被解决。为此,任钊博士提出了一种新方法,局部修剪估计(local cropping estimator),来对该问题进行研究。并且证明了该方法在常见的两个估计类中,在不同的范数准则下,都能够达到最小最大下界,从而说明了该估计方法具有最优收敛速度。任钊博士介绍说,以前的研究证明了,以矩阵特的谱范数作为损失,并将无序稀疏性假设加在矩阵的行和(或矩阵的元素)上,则精度矩阵和协方差矩阵的最优收敛速度是相同的。而任钊博士的研究则表明,对于将带状假设加在矩阵的行和上时,精度矩阵和协方差矩阵的最优收敛速度并不相同,而这一结论与人们的直观稍有不符。任钊博士解释说,这个情况主要是由精度矩阵的带状Cholesky因子并非对称所造成的。

然后,任钊博士进一步介绍了将他的方法推广到自适应和非正态变量的情况,并通过模拟结果展示了其方法的有效性和优势。

最后,任钊博士与参加讲座的老师和同学们进行了积极地讨论。大家对任钊博士的新方法表现出了浓厚的兴趣,任钊博士也表示希望自己的新方法能够作为敲门砖,为大家进行理论和应用研究提供一些新的思路。