3月16日下午,“统计大讲堂”系列讲座第144讲举行。本次讲座采取在线会议的方式,邀请东北师范大学刘秉辉教授作题为“Fast network community detection with profile-pseudo likelihood methods”的报告。讲座由统计学院李扬教授主持,统计学院吴奔等校内外师生参加。
李扬首先介绍了报告人的相关信息。刘秉辉是东北师范大学统计系主任、博士生导师;曾到美国明尼苏达大学进行博士后访问,合作导师是沈晓彤教授和潘伟教授。刘秉辉的主要研究方向为统计学习和网络数据分析,曾在Artificial Intelligence、Journal of Machine Learning Research、Annals of Applied Statistics、Journal of Business & Economic Statistics、Statistics in Medicine等期刊发表多篇学术论文;主持国家自然科学基金面上项目、青年项目、省级重点教改项目等;与中国联通公司合作,主持大数据培训、大数据分析项目若干。
刘秉辉首先介绍了研究的背景、数据和问题。在“互联网+”和“万物互联”的大背景下,关于网络方面的研究逐渐成为国家发展的需求和学界研究的前沿。同时在大数据时代,由网络结构和附着在网络结构上的相关数据组成的网络数据越来越多,其主要来源于社交网络、脑神经网络、交通网络等网络平台。刘秉辉及其合作者的研究问题之一是探测网络社区结构,旨在利用统计学方法从网络结构数据中发现潜在的聚类结构。
刘秉辉详细介绍了研究问题中图的表示、模型的建立和方法的选取。通过点集V和边集E,可以构成对称的或者不对称的网络N,该网络可以由一个|V|×|V|的邻接矩阵来表示。关于网络建模,他指出,当分析目的不同时,建立的模型和表述的结构就会不同。对于社区发现的问题,刘秉辉及其合作者主要研究随机块模型(SBM)。刘秉辉详细讲解了模型假设的过程,并对照形成似然的过程,简单介绍了通过EM算法来解决带潜变量的模型推断问题。
为了提出精度高、速度快且能处理大规模网络的社区探测方法,刘秉辉及其合作者建立了两种新的分析框架:轮廓伪似然法和分裂似然法,为处理基于随机块模型的社区发现问题提供了新的视角。通过数据分析和实例分析,刘秉辉进一步详细阐释了两种方法的思路和应用。
在提问交流环节,刘秉辉耐心解答了老师和同学们的提问,进一步阐释了在社区发现中的估计稳健性。
本次讲座介绍了轮廓伪似然法和分裂似然法,并就其中的方法思路和实际应用作了进一步阐释。此后“统计学大讲堂”系列将陆续推出更多精彩讲座,敬请关注。