新闻

新闻

您当前的位置: 新闻
“统计大讲堂”系列讲座第五十五讲
时间:2018-11-05

10月24日,我院举办的“统计大讲堂”系列学术报告会第55讲在明德主楼1016举行。本次报告邀请了北京大学艾明要教授分享他的研究成果,我院许王莉教授主持了本次学术报告会,张景肖教授、吕晓玲教授、尹建鑫教授以及我院部分本、硕、博学生参加了本次学术报告活动。


艾明要教授是北京大学数学科学学院统计学教研室主任、博士生导师,兼任中国现场统计研究会常务理事,中国现场统计研究会试验设计分会理事长、高维数据统计分会副理事长、空间统计分会秘书长,任《Statistica Sinica》、《Journal of Statistical Planning and Inference》等多个国际统计期刊的副主编,国内数学期刊 《系统科学与数学》编委。艾老师主要从事试验设计与分析、计算机试验、大数据分析和应用统计的教学和研究工作,在Ann Statist、JASA、Biometrika等国内外顶尖期刊发表学术论文六十余篇,主持完成国家自然科学基金面上项目5项、重点项目子课题1项,参与完成国家科技部973课题2项。



艾明要教授报告的题目是“Optimal Subsampling Algorithm for Big Data Generalized Linear Models”。艾老师首先基于大数据集的计算、储存及可视化问题,介绍了最优抽样方案的背景,简要回顾了广义线性模型的基本知识。其次总结了前人就这一问题提出的最优抽样方案。例如针对线性模型,前人提出以与杠杆值成比例的抽样概率,采用逆概率加权的方法估计解释变量的系数。针对二元响应变量,前人在logistic回归模型中提出A-最优性准则(OSMAC)下的最优抽样方法。艾老师将这一方法推广到具有典范链接函数的广义线性模型中,在大样本下证明了估计系数的收敛性和渐近正态性,并基于A-最优准则推导出最优抽样概率,相应地证明了最优抽样概率先估计系数的收敛性和渐进正态性。然后展示了不同模型设置下的模拟结果,与已有的方法相比,新方法的均方误差更小,且抽样用时更短。最后艾老师展示了两个实际数据的分析结果,也说明新方法的表现更好。



报告结束后,在场师生们就报告中的相关问题,与艾老师进行了热切的讨论。