大数据统计的发展与三个问题有关: 大数据发展趋向极限无穷时,人类社会数据信息发展的最终目标仍应是使社会资源得到最优配置和利用;个性单位最小化和社交网络数据上的大数据网络结点有效连接的最大化与个性单位和社交网络的时间连续条件满足的话,大数据发展就不会产生危害社会进步的数据垃圾; 大数据将是一场革命,统计学要继承与发展,当今统计必须充分考虑在强大的计算机网络及云计算等能力上的条件,继承样本总体、统计分布、统计描述、统计探索发现、统计推断、统计降维等论方法,发展宏观与微观一体化、降维与增维并举、最小样本唯一码统计动态标准及智能自动化等新理论和新方法。
大数据发展的统计设计观点,具体为大数据 = ( 计算机 + 互联网) + 统计,统计=可无限内部组合的最大统计总体+ 最小现实样本,探索统计大数据中的空间: 发展广义统计设计及其统计分析理论方法。
从大数据发展的现实趋势中寻找大数据统计发展灵感是非常必要的。大数据统计,属性上应用性质突出。中国应用统计相比发达国家而言有自己的特色,从学科上看经济社会统计与概率数理统计平行发展,形成竞争与合作的发展格局; 从应用上看,我们善于宏观经济系统与社会系统的统计设计,因此对统计在宏观问题上的应用比较重视,有利于统计应用发展解决复杂系统的能力建设。将从理论和实践上做出论证分析,并联系我国实际,探讨了我国大数据发展中的统计设计理论和内容要点,包括大数据统计发展的现实基础与融合、统计交叉学科的重要作用、探索增维与降维的双向发展、加强公共统计简约化标准建设四个方面,同时针对政府大数据统计设计指出我们面对互联网、云计算 、大数据的迅猛发展, 应该全面系统地分析研究,针对不同发展阶段,提出全面改进、 完善统计设计和统计工作设计的方式方法,通过基础设计、核心设计、流程设计等方式,迎接各种发展的挑战。
该文载于《统计研究》,2015年6月,点击全文下载。