科学研究

学术观点

您当前的位置: 首页> 科学研究> 学术观点
学术 | 我院研究团队针对问卷分割设计数据的建模问题在《Journal of Official Statistics》发表论文
时间:2023-12-22

我院李扬教授等在国际政府统计期刊《Journal of Official Statistics》发表论文,就大规模调查中的问卷分割设计技术以及数据建模分析方法展开研究。在信息时代,大规模调查被广泛应用于社会学研究、政府统计、经济决策和市场调研等诸多领域。然而,问卷长度的增加导致受访者负担加重、拒访率增加,从而引起调查工作执行难度加大、调查成本升高以及数据质量下滑等问题。本研究提出一种基于优化非线性成本函数的矩阵采样技术,实现大规模长问卷的分割设计,该方法能够有效较低调查成本和受访者负担,达到降低拒访率、提升数据质量的效果。研究者针对问卷分割设计所得到的分块缺失数据提出线性回归模型的加权最小二乘估计,在估计和预测的准确性方面均具有明显优势。

论文题目

Block weighted least squares estimation for nonlinear cost-based split questionnaire design

文章摘要

In this study, we advocate a two-stage framework to deal with the issues encountered in surveys with long questionnaires. In Stage I, we propose a split questionnaire design (SQD) developed by minimizing a quadratic cost function while achieving reliability constraints on estimates of means, which effectively reduces the survey cost, alleviates the burden on the respondents, and potentially improves data quality. In Stage II, we develop a block weighted least squares (BWLS) estimator of linear regression coefficients that can be used with data obtained from the SQD obtained in Stage I. Numerical studies comparing existing methods strongly favor the proposed estimator in terms of prediction and estimation accuracy. Using the European Social Survey (ESS) data, we demonstrate that the proposed SQD can substantially reduce the survey cost and the number of questions answered by each respondent, and the proposed estimator is much more interpretable and efficient than present alternatives for the SQD data.

作者介绍

李扬,中国人民大学统计学院教授、博士生导师,研究生院副院长、统计咨询研究中心主任;入选国家级青年人才项目,担任国际统计学会推选会员、中国商业统计学会副会长、中国统计学会常务理事、中国现场统计研究会常务理事、北京生物医学统计与数据管理研究会监事长等;主要从事相关型数据分析, 模型选择与不确定性评价, 潜变量建模, 临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,发表Genome Biology、JAMA IM、AOAS、Biometrics、Biostatistics、统计研究等期刊论文七十余篇。



祁乐,中国人民大学2023届博士研究生,在读期间研究方向为预测模型与调查设计,现就职于财政部。



秦祎辰,美国辛辛那提大学商学院副教授、博士生导师;主要从事网络数据、高维数据等复杂数据分析,模型不确定性评价与可视化,临床试验设计等领域研究;发表JASA、JMLR、Biometrics、Statistica Sinica等期刊论文二十余篇。



林存洁(通讯作者),中国人民大学统计学院副教授,主要研究方向为生物统计、生存分析、个性化医疗、大数据建模与分析、复杂数据分析等。目前在Biometrics, Journal of Computational and Graphical Statistics, Statistica Sinica, Statistics in Medicine等期刊发表多篇学术论文,主持国家自然科学基金项目、全国统计科学研究重点项目等。



杨宇红,1996 年在耶鲁大学获得统计学博士学位。随后加入爱荷华州立大学统计系,2004 年前往明尼苏达大学。他的研究兴趣包括模型选择、多臂老虎机问题、预测、高维数据分析和机器学习。他在多个领域的顶级期刊上发表过文章,包括 Annals of Statistics、JASA、JRSSB、Biometrika、IEEE Transaction on Information Theory、Journal of Econometrics、Proceedings of AMS、Journal of Machine Leaning Research 和 International Journal of Forecasting。他是Institute of Mathematical Statistics 的会员,并且曾获美国 NSF CAREER 奖。



论文发表截图