我院范新妍副教授团队在期刊JASA发表论文
时间:2025-05-15网络数据在各类实际场景中普遍存在,并具有重要的研究价值。尽管传统的变系数模型(VCM)在处理时间序列和空间数据中系数的动态变化方面表现良好,但在应对网络数据时却面临明显的局限性。本文提出了一种新的网络变系数模型,将传统的变系数模型拓展至适用于网络数据的分析场景。该模型将回归系数看作是网络中各个节点“潜在位置”的函数,并假设这些潜在位置同时决定了网络的结构。在模型的估计过程中,本文先通过潜空间模型找出节点的潜在位置初始估计,然后基于迭代算法轮流更新网络参数和回归系数。本文还给出了系数估计误差的理论界限,并提出使用BIC准则来选择潜空间的维度。另外,本文进一步基于惩罚的方法来筛选出对响应变量具有显著影响的变量,并证明了这种筛选方法的理论可靠性。通过大量的数值模型和真实的金融案例,验证了模型的在有限样本上的有效性。
论文题目:Network Varying Coefficient Model
论文摘要
We propose a novel network-varying coefficient model that extends traditional varying coefficient models to accommodate network data. The main idea is to model the regression coefficients as the functions of the latent “locations” of network nodes that drive formation of the network. To estimate the model, we identify the latent “locations” via the latent space model and then develop an iterative projected gradient descent algorithm by optimizing the network parameters and regression coefficients alternately. The non- asymptotic bounds of the estimated coefficient matrix are obtained. In addition, a Bayesian information criterion is proposed to select the dimension of the latent space. Moreover, we employ a penalized method to select covariates with varying coefficients that are significant to the response variable, and demonstrate the theoretical properties of selection. The utility of the proposed model is illustrated via simulation studies and a real-world application in the field of finance by analyzing the relationship between stock returns and their corresponding financial ratios from a network perspective. Supplementary materials for this article are available online, including a standardized description of the materials available for reproducing the work.
发表截图
作者介绍
范新妍,中国人民大学统计学院副教授,研究方向为多源数据分析与网络数据分析等。
方匡南(共同一作),厦门大学经济学院教授,研究领域包括多源/多模态机器学习、高维数据分析、网络数据分析和深度学习等。
兰伟(通讯作者),西南财经大学统计学院教授,研究领域包括高维数据分析与建模、大型社交网络数据分析、风险管理和投资组合优化、消费金融反欺诈等。
蔡知令 (Chih-Ling Tsai),加州大学戴维斯分校教授,研究领域包括高维数据分析、回归分析、时间序列分析和商务统计分析等。