论文题目
基于整合治愈率模型的信贷违约时点预测
作者介绍
范新妍,中国人民大学统计学院博士后,主要研究方向为高维数据分析,多源数据分析,网络结构数据分析等。在Statistics in Medicine,Statistical Methods in Medical Research, Computational Statistics and Data Analysis, 统计研究等国内外核心期刊上累计发表论文11篇。主要担任复杂数据分析和概率论教学工作。
内容摘要
传统信用评分方法主要利用统计分类方法,只能预测借款人是否会发生违约,但不能预测违约发生的时点。治愈率模型是二分类和生存分析的混合模型,不仅可以预测是否会发生违约,而且可以预测违约发生的时点,比传统二分类方法可以提供更多的信息。另外,随着大数据的发展,数据源越来越多,针对相同或者相似任务,可以收集到多个数据集,本文提出了融合多源数据的整合治愈率模型,可以对多个数据集同时建模和估计参数,通过复合惩罚函数进行组间和组内双层变量选择,并通过促进两个子模型回归系数符号相同,提高模型的可解释性。通过数值模拟发现,所提方法在变量选择和参数估计上均有明显优势。最后,将所提方法应用于信用贷款的违约时点预测中,模型表现良好。
发表页面