2019年12月6日,“统计大讲堂”系列讲座第一百零三讲在明德主楼1016会议室顺利举行。本次讲座厦门经济学院统计系和王亚南经济研究院副教授、博士生导师张庆昭分享了他在图模型领域的最新研究成果。会议由统计学院副教授孙怡帆主持。
孙怡帆副教授首先介绍了报告人。
张庆昭现为厦门大学经济学院统计系和王亚南经济研究院副教授、博士生导师。2013年获得中国科学院数学与系统科学研究院概率论与数理统计博士学位,先后在中国科学院大学和美国耶鲁大学进行博士后研究。主要研究方向为高维数据分析、多源数据融合、函数数据分析、统计学习等,在JASA、Biometrics、Statistica Sinica、Statistics in Medicine等期刊发表论文30余篇。国际统计学会推选会员,主持国家自科面上、青年各1项,教育部基金1项。
张庆昭老师的报告题目是:Assisted Estimation of Gene Expression Graphical Models。张庆昭老师首先就基因表达类型的数据做了简要说明,简述了我们在处理此类数据时所面临的机遇与挑战。随后,张老师简练但全面的介绍了图模型的相关知识,图模型是为了挖掘数据之间的网状关系结构而产生的一种模型,在基因表达类型的数据中有着广泛的应用。在统计学领域较为常见的两种图模型为:Gaussian graphical models(GGMs)和 Conditional Gaussian graphical models(cGGMs),后者可以理解为前者在获得除样本本身以外的其它辅助约束信息时的模型。由此可见,二者之间是存在一定的联系的,而本研究的目的正是期望将两种模型有机地结合在一起,从而对数据间的网络结构给出一个联合估计。
由于基因表达等其它类型数据的复杂性,其往往不能完全满足GGMs或cGGMs模型的条件,即只有部分数据存在辅助约束信息。为了充分利用此类数据所提供的信息,张老师提出了一种使用GGMs来辅助建立cGGMs的联合模型,它很好地保证了两模型之间的遗传关系,即GGMs中独立的变量在cGGMs中也应当独立。他们证明了此模型估计的一致性, 并基于近端方法给出了一套高效的解决算法。模拟及实际数据的实验结果也验证了此联合模型的估计效果要优于GGMs或cGGMs本身,并且保证了模型之间的遗传性。
讲座结束后,在场师生与张庆昭老师就罚函数的选取依据、图模型的后续应用等问题进行了热烈讨论。