2019年2月25日下午,中国人民大学通识教育大讲堂——数据科学讲坛第四期在明德主楼1030会议室顺利举办。发展中国家科学院院士、世界计量经济学学会会士、美国康奈尔大学经济学与国际研究讲席教授洪永淼受邀作题为“Big Data, Machine Learning and Statistics”的主题报告。中国人民大学统计学院院长王晓军,副院长尹建鑫、李静萍,经济与社会统计教研室主任甄峰,风险管理与精算教研室主任肖争艳,统计学院教授张波、公共管理学院教师余华义出席讲坛。本次讲坛由统计学院副院长李扬主持。
统计学院院长王晓军代表学院向洪永淼教授的到来表示由衷的欢迎和诚挚的感谢,并为他颁发了本次讲座的纪念证书。
洪永淼教授表示,大数据容量巨大,潜在的解释变量繁多,而且数据类型多样,这都给统计学带来了挑战,但也带来了机遇。
洪永淼教授认为挑战主要体现在三个方面:第一,当大数据的样本容量特别大时,一个变量或参数在统计学上是否显著可能将失去意义,参数估计的不确定性将被模型选择的不确定性所替代,但当前研究者尚未提出新的方法;第二,样本容量小于解释变量的数量时需要降维分析,但不同降维方法得到的模型结果可能不同,以预测为目的时可使用模型平均等技术,但是如果是以模型或者参数解释为目的的话,研究者目前还缺乏必要的统计理论与方法;第三,当解释变量较多且存在较高线性相关性时,模型的不确定性进一步增大,与唯一性假设存在悖离,需要新的建模与推断理论。然而,大数据也给统计学带来了一些机遇。洪教授表示,以宏观经济与金融市场为例,宏观数据是低频的,而金融市场的数据是高频的,大数据将促进宏观数据的高频化,为研究实体经济和金融市场之间的互动关系提供极大的便利。
由教务处与统计学院联合主办的“中国人民大学通识教育大讲堂——数据科学讲坛”,定期邀请数据科学领域著名专家、领军人物来校为全校师生带来报告,旨在为全校师生普及科学知识,弘扬科学精神,解读专业相关的热点问题和前沿动态。