大家谈统计

统计观点

您当前的位置: 首页> 大家谈统计> 统计观点
赵彦云:疫情下的数字化发展与广义统计
时间:2020-05-23

2020年初,新冠疫情来势汹汹,给人民健康带来了极大威胁,给国际经济造成了巨大损失,但不得不承认新冠疫情为数字化的深化发展带来了新机会。从在线文化旅游产品、网上教学课堂等数字化服务业的快速发展,到针对疫情防控的互联网统计数据体系的高效建立,数字化在科学有效防疫、保障人民生活方面表现亮眼。在抗击疫情的过程中,多领域、多学科的学者专家们各施其能,通力合作,效果是突出的,影响是深远的,其中统计学科更是逐渐走进了大众视野。一方面,借助于统计学,疫情的实时数据得以展现,一些根本性的问题得以解答;另一方面,疫情数据的多样性、非结构化也对统计学的未来发展提出了挑战。为此,中国人民大学统计学院赵彦云教授为我们带来了他的思考与认识。


1、在疫情期间,互联网平台服务发展迅速,各项业务多点开花。如今,疫情日趋平稳,在您看来,拥抱数字化将继续成为新常态吗?经历疫情考验,数字化发展又将有哪些新思路?


互联网技术革命的作用不断深化,当前集中表现在互联网数字化、数字经济的强劲发展。冠病毒肺炎疫情进一步激发了数字化和数字经济的服务业快速发展,包括文化产业旅游产业网上直播、网上电影首播等新形式、新内容、新商业模式的互联网数字化文化产品、旅游产品服务业的大发展,在线教育、各种各样的网上教学课堂、学术研讨会,以及硕士生、博士生、博士后的网上指导、交流、合作研究等从无到有的规模发展,不知不觉积极推动了教育方式的网络创新发展。除此之外,在线医疗、在线专家会诊、在线手术合作等医院服务的互联网服务业也获得了长足的发展。电子商务、快递服务业、网络点餐服务业等等,在原来的电商平台基础上也获得了更快更好的产业发展。

我认为拥抱数字化将继续成为新常态,数字化将大大深化服务业发展,除了上面提到的文化、旅游、教育、电商、餐饮、会展、博物馆等服务业创新发展外,还将推动金融保险业、科技咨询服务业、居民服务业、交通运输业、政府服务业等的大发展。智慧农业、智慧城市、智能制造、智慧建筑等,也将大大推动数字化和数字经济在农业(包括种植业、林业、畜牧业、渔业)、资源环境、采掘业、制造业、建筑业、房地产业、水电供应业、园林的全面数字化和数字经济的快速发展。


2、在此次疫情防控中,数字化防疫措施表现亮眼,其中尤以健康码为代表。然而在健康码的推行过程中依然涌现出了很多问题。一方面,健康码在各地存在“各自为政”的现象,这种数据孤岛的存在极大地浪费了现有的数据资源。另一方面,健康码是基于算法做出的自动决策,决策过程是否科学合理、数据是否能如实反映情况也令人担忧,这背后反映了多学科交叉的科学性问题。以上两点也是如今所有数字化产物面临的共同问题,您是如何看待的呢?


我国在新冠病毒肺炎疫情防控工作上,展现出了杰出的工作效率,其中积极运用互联网大数据并快速发展为疫情防控及应急管理全面服务的互联网统计数据体系这一项举措,不仅保证了高效率、高质量,而且包含了巨大的技术创新和组织创新,以及互联网技术应用和统计大数据应用的创新。以健康码为例,其充分运用了互联网和统计大数据,对检测、监测、治疗、防控、人流管理、复工复产、新兴数字服务业发展等方面产生了重要的作用。健康码虽然实现了互联网统计大数据的运行模式,但是各地政府之间还是存在数据孤岛的问题,显然增加了应用的成本,降低了优化水平,与新基建、数字化、智能化发展的新基础设施支撑不相称。

健康码并不是简单的互联网统计大数据,而是蕴涵着一场深刻的统计及应用革命,即建立以人为基本对象的互联网实时统计,支撑“全面服务个人”目标的实现,并且保证了其全面性、精准性和实时性。进一步讲,要实现个性化的全面精准服务,那么必须要发展一系列配套的服务行业即每项服务行业下一大批竞争性企业,而且服务业之间形成紧密的产业技术链和产业价值链新体系,保证人类服务业的精密分工和无缝协同,这就是互联网数字化和数字经济下的新服务业创新发展的方向,一句话就是互联网数字化技术可以裂变更加全面的人类服务业,由此,服务业才能超越发展,在产业结构中的比例越来越大,构建新时代发展的产业新格局。


3、从疫情初期开始,统计学对疫情数据的收集、描述和分析显著提升了全球疫情防控的凝聚力和共识。一些疫情的根本性问题例如什么时候出现拐点等也通过统计学模型给出了解答。经历本次疫情考验,您认为人们会对统计学有哪些新的认识?


这次疫情防控期间,首先实现了互联网互联、互通、互动目标应用的普及推广,其中包含着多学科知识交叉与协同创新应用。例如流行病学调查和相关生物模型的预测分析,以及疾控统计指标和数据及运用等医学与传染病统计知识深度普及和应用推广,流行病学专家、统计学专家、数学专家、计算机专家等都展示各学科的潜力,力争解决新冠病毒肺炎疫情传播与防控和治疗上的问题,这可能是前所未有的一次多学科深度互动学习认知的研究过程,效果是突出的,影响是深远的。发达的互联网技术,保障了统计大数据、社交网络、人口流动、疾病传播、西医学、中医学和数学、统计学专家实现了互联、互通、互动的实际应用过程。以消除疫情为目标的全社会动员包括相关的各行各业例如解放军、医生、护士、公安、快递、交通、社区、新闻、疫情物资生产、政府应急管理等等,会同人财物和百姓生活,快速形成了社会生态组织的流畅体系。

其中,疫情防控为核心的信息数据统计体系、发布体系、分析决策成为了非常关键基础和保障。统计基础、统计思维、统计数据、统计模型方法,以及传播流程、传播机制、因果关系、疫情变化、规模走势、时间拐点、治疗效果、医护人员分工配置、方舱医院、物资供应、组织协调、有效分配等等的统计模型分析、复杂系统的优化计算,以及大数据网络实时决策应用,都成为面向解决重大实际问题的挑战,也印证了华为总裁任正非先生反复强调的互联网时代统计学及相关学科发展的绝对重要性。


4、当代统计学的内涵正在被逐渐扩充,统计条件在放宽,数据形式在更新,不断朝着广义统计的方向前进,在此次疫情防控中体现了哪些统计新思路?统计学面向互联网技术又有哪些新挑战?


当前正处于互联网数字化、数字经济、智能化的深入快速发展阶段,计算机科学、计算机网络技术、数学、数据科学与大数据技术成为社会生产力发展的集中代表,在智能化、数字孪生、智慧城市、智慧农业、智能制造、体验新消费的产业升级大路上迅跑,已经成为全社会高度认可的事实。但是,为什么华为总裁任正非先生多次强调统计学的重要作用,这确实是一个值得解析的重要发展问题。

从这次新冠病毒肺炎疫情看,大量的统计基础工作是必需的,但并非一切都从数据出发。人们在获取数据之前,还要建立一套科学的统计体系以保障之后所有运用数据的流程环节。在复杂紧张的疫情期间,疫情防控头绪万千,但是所有工作都指向完备、完整系统、科学有效、及时准确的统计数据信息,显然,这已经不仅仅是传统统计工作和结构化统计数据生产所能覆盖的,其中还包括了大量的文本信息、音频图像信息、行政记录信息、物联网、传感器实时监控信息等等大量非结构化数据生产(及时跟踪和系统处理),统计工作从传统结构化数据向广义统计的结构化与非结构化数据的融合发展成为做好疫情防控必须的事情。互联网大数据之前必然有广义统计体系设计和广义统计生产,这是进入数据科学和大数据技术应用的一项重要基础工作。

当今互联网时代,数字化、数字技术、数字经济是广义统计的技术基础,海量数据是由广义统计生产产生,互联网统计大数据存储向云设施方式转变,海量数据与复杂网络系统的云计算相互匹配也提到互联网技术之上,而且还要从大数据与信息采集的物联网、智联网等多种方式的统计过程到云存储、云计算和云平台服务,成为一个由互联网技术设施支撑的完整的互联、互通、互动的巨系统,这个巨系统的使命就是消除一切孤岛的存在,包括数据孤岛、知识孤岛、学科孤岛。事实上,这次疫情防控应急管理和政策精准狠、时效高、质量突出、全局优化一盘棋的浙江省等发达地区的政务大数据中心和部门数据共享的科学落实,已经在向这个新时代的伟大目标迈进。进一步解析可以看出,保障疫情防控这个巨系统的良好运营服务,实际上就是要在互联网技术下将其建设成为与社会组织生态系统无缝对接的数据信息灵魂及能力执行实现的科学手段工具,其中计算机网络技术系统架构、统计系统体系架构、应用的存储、计算、社会服务平台架构非常重要。计算机网络技术专家可能从来不讲“统计系统体系架构”,他们更习惯称为中台架构,而且认为是最重要的部分,在智能化发展中发挥着决定性的重要作用。所谓“中台”就是数据层技术包括数据来源、数据存储、数据处理、模型计算、数字孪生等的统计分析、统计模拟、统计决策和统计预测等服务。显然,统计学家能够更好地完成这些所谓“中台”的目标任务的伟大使命。


            广义统计学的结构示意图

                                 广义统计学的结构示意图


数字化、广义统计、数族协同是互联网技术革命深入发展的重要发展对象,而这些都是统计学科挑战未来发展的重要内容。统计学仅局限于随机不确定性,可能是远远不够的,统计设计在互联网时代如何发挥作用,如同数字地球发展起点一样,要包括最大总体的确定性问题和不确定性问题,统计优化在解决确定性问题上发挥着重要用,也是与数学、计算机网络技术在数族协同上发展的重要根基,最大总体、最小统计颗粒标准、不产生数据垃圾等都是数字孪生和消除一切孤岛问题的根本。也应看到,在认知数字化、广义统计、数族协同的发展上,统计学科有许多来自传统统计学思维的阻力,例如统计描述分析,如果局限于传统统计学,可能就是一个简单的配角或者像个辅助性统计学工作,但是,互联网技术走向全面量化、实时复杂巨系统量化的广义统计之下,就目前的数字化、智能化、数字孪生的研究发展目标,需要充分考虑互联、互通、互动的充分统计,而且网络因素关系无论不断细分还是在无限边界的条件下,广义统计生产、广义统计体系设计、广义统计模型可能都有无限的发展空间,要让统计学科从十年河东走向十年河西,也不是不可能的事情。