2022年12月23日下午14时,由中国人民大学智能数据云及全面量化开发跨学科交叉平台推出的第三期统计咨询案例线上分享会顺利举行。中国人民大学统计学院副教授蒋妍以““四下”单位抽样调查制度研究”为题作了精彩分享,本期分享会由中国人民大学统计学院副教授王菲菲主持。
蒋妍是中国人民大学统计学院副教授,中国人民大学统计调查技术研究所所长,中国人民大学应用统计科学研究中心副主任,中国商业统计学会副秘书长。注重抽样技术、非抽样误差、应用计量经济等领域的研究。主持了国家统计局、国家外汇管理局、中华全国供销合作总社、海关总署、亚洲开发银行等20余项科研项目。在《经济研究》《管理世界》《Journal of Official Statistics》《Land Use Policy》《中国环境科学》《中国土地科学》等期刊发表了论文30余篇。合著了《抽样技术》《市场调查方法与技术》等教材。
蒋妍首先介绍了报告的背景。“四下”单位是指规模、限额和资质等方面在一定标准之下的企业、产业活动单位、个体经营户等,是我国经济的重要组成部分。不同于“四上”单位采用的全面报表制度,“四下”单位分行业类别采用相应的抽样方案。
随后,蒋妍对我国针对“四下”单位的现行抽样制度进行了分析。我国针对“四下”单位的现行抽样方案是按工业、建筑业、批零住餐和服务业等分行业抽样和数据采集的抽样调查制度。各行业抽样设计不一致,分行业调查针对性较强,但也存在调查成本高、抽样框维护成本高、难以满足市县级地方行政单位估计需求等问题。
接着,基于对“十四五”时期顶层设计的响应、对相关文献的研究以及对国外经验的批判吸收,蒋妍团队提出了基于MPPS地域抽样的全行业抽样设计方案,以地域(例如村、居委会)为最终抽样单元,用一套方案实施调查、一套样本实现对各行业目标变量的推估,并采用基于分层贝叶斯模型的小域估计方法实现对国家、省、市县级单位的多层次推估与小域估计。
介绍了方案之后,蒋妍使用了一组经过简化与合并处理的具体地区数据向大家进行实证并从四个方面评价了全行业抽样效果。单行业抽样400×7初级单元样本量的估计精度得以实现;两种引入权重的分层贝叶斯模型仍然取得出色的估计效果;改进后的比估计量精度显著提升,与分层贝叶斯效果相近且计算成本更低;入样概率与各行业相关性降低时,两种分层贝叶斯基础模型的底层假设受到影响,估计精度降低。
报告的最后,蒋妍对研究结论与不足进行了简要介绍,并对本次报告作了总结与展望。研究显示,分层贝叶斯模型可有效解决多层次推估问题;全行业抽样可达到理想精度,整合调查以节约成本切实可行;将抽样设计信息与基于模型的方法结合,可最大化估计效率;估计效果受行业自身特点影响,但各行业估计需求基本均可得到满足。此外,研究可以从初始样本量设定、估计效果与行业自身特点之间的关系、权重调整三个方面进行改进,以取得更好的效果。
提问环节中,蒋妍就行业间样本量差异对估计精度的影响、小域估计中缺失值的处理等问题作了认真细致的解答,与师生们进行了更进一步的探讨。
此后统计咨询案例线上分享会还将持续推出更多系列活动,敬请关注。