新闻

新闻

您当前的位置: 新闻
“统计大讲堂”系列讲座第五十一讲
时间:2018-09-28


9月19日,我院举办的“统计大讲堂”系列学术报告会第51讲在明德主楼1016举行。本次报告邀请了北京大学光华管理学院商务统计与经济计量系的王汉生教授分享他的研究成果,我院许王莉教授主持了本次学术报告会,肖争艳副教授以及我院部分本、硕、博学生参加了本次学术报告活动。

王汉生教授是北京大学光华管理学院商务统计与经济计量系主任,嘉茂荣聘讲席教授,北京大学商务智能研究中心、主任,美国统计学会Fellow(2014),国家杰出青年基金获得者(2016)。在理论研究方面,王汉生教授主要关注变量选择、数据降维、高维数据分析、以及复杂网络数据分析。所有这些研究都以大规模、复杂、超高维数据分析为核心。在业界实践方面,王汉生教授是国内较早从统计数据分析角度关注并研究搜索引擎营销,社交网络数据,以及位置轨迹数据分析的学者。曾担任博雅立方科技有限公司首席科学家(2009—2015),百分点首席统计学家(2015—现在)。此外,王汉生教授同量帮科技、考拉征信、彩虹无线、蓬景数字等众多企业有深度学术合作。涉及量化投资、互联网征信、车联网、移动设备RTB广告竞价、搜索引擎营销、电子商务等多个重要行业。




王老师今天报告的主题是“A Popularity Scaled Latent Space Model for Large-Scaled Directed Social Network”。首先,王老师从“什么是Network?”这一问题展开今天的报告。并说明网络结构由“节点(nodes)”和“边(edges)”共同组成,并会对个体行为产生影响,在股权结构以及社交网络分析中有广泛的应用,但目前针对网络结构分析的统计学模型较少。此外,在实际中大量个体通过社交网络相连而产生相关性,因此传统的“独立性”假定不适用,而合理刻画相关性对于预测也有一定的帮助。基于以上两点,王老师向大家说明了目前已有的研究成果从两个方向展开:(1)网络结构如何产生网络相关性;(2)网络结构是如何形成的。




接着,王老师向大家介绍他的研究成果主要关注上述第二个问题,即对网络结构构建合理的概率模型。建立模型之前,首先要明确网络结构的特征。王老师以《甄嬛传》中的人物关系为例,形象地为大家介绍了网络结构的四个性质:(1)稀疏性(Sparsity);(2)互粉性(Reciprocity);(3)传递性(Transitivity);(4)幂律(Power-law)。基于以上四种性质,如何对网络结构结构进行建模呢?王老师首先介绍了已有的四种方法:ER Model,Exponential Random Graph Model,Stochastic Block Model 以及 Latent Space Model,指出已有方法对处理此类问题的不足与困难,介绍了基于已有的Latent Space Model 进行的改进。新的方法假设每个节点处于潜在空间中的某一位置,同时彼此接近(遥远)的节点相连接的概率应该更大(更小)。除此之外,还假设每个节点都有一个“魅力指数”(参数γ)。受欢迎程度越大的节点更有可能被其他节点关注。通过假设参数γ的不同分布,可以建立不同类型的程度异质性。在此基础上,进一步建立了链式预测的综合概率指数。最后,王老师展示了有限样本下,针对不同网络结构情形的模拟结果,并通过新浪微博数据集说明了新模型的预测效果较好。

报告结束后,在场师生就模拟中参数设置以及论文中的结果展示等问题,与王老师进行了热切的讨论。