新闻 - 中国人民大学统计学院

新闻

您当前的位置：首页> 新闻

“统计大讲堂”210讲回顾：实现特征自动分组和降维的有监督多变量机器学习

时间：2023-04-21

3月23日上午9:00，由中国人民大学统计学院和教育部人文社科重点研究基地应用统计研究中心共同举办的“统计大讲堂”系列讲座第210讲举行。

本次讲座邀请佛罗里达州立大学统计系教授Yiyuan She作了题为“实现特征自动分组和降维的有监督多变量机器学习”的报告。讲座由中国人民大学统计学院孙怡帆教授主持，采用线上线下相结合的方式，吸引了校内外师生近百人参加。

首先，Yiyuan She教授从有监督多变量学习中所面临的带有大量非零系数的“密集”问题出发，介绍了用于解决这类问题的聚类降秩学习（CRL）框架的背景与动机，从而引出了CRL框架的数理化定义。接着，Yiyuan She教授阐释了该框架中涉及到的SV形式与稀疏化成对差异的方法，并对单位秩、加权、无监督等特殊情形下的CRL框架变化进行了详细讨论。CRL框架在构建预测因子时施加了两个正则化联合矩阵，因而能够通过特征进行自动分组，它比低秩模型更容易解释，并且放宽了变量选择中严格的稀疏性假设。Yiyuan She教授还提到一种高效的优化算法，该算法能在保证收敛性的前提下对子空间进行学习和聚类。此外，Yiyuan She教授展示了其团队创造的一种无标度的预测性信息准则（PIC），并使用真实的实验数据对PIC的统计准确性和可解释性加以佐证。

最后，Yiyuan She教授在提问环节认真细致地回答了师生们有关CRL框架应用方面的问题，就CRL框架对模型初值的敏感性等相关话题进行了深入探讨。

此后“统计大讲堂”系列将陆续推出更多精彩讲座，敬请关注。