2019年6月7日,我院举办的“统计大讲堂”第八十二讲在明德主楼1001举行。本次报告邀请美国沃顿商学院统计系的苏炜杰助理教授分享了他最新的研究成果。报告会由我院尹建鑫副教授主持。
尹老师首先介绍了报告人的基本信息。苏炜杰博士本科毕业于北京大学数学系,在斯坦福大学获得统计学博士学位,之后加入沃顿商学院统计系。苏博士的科研方向主要包括机器学习、高维推断、多重测试、优化问题以及隐私保护数据分析,获得2019年美国国家科学基金会杰出青年教授奖(NSF CAREER Award)。
苏博士的报告题目是高斯差分隐私Gaussian Differential Privacy。首先介绍了差分隐私问题的背景,现代统计分析和机器学习主要应用于与人有关的数据。除了传统敏感数据(包括医院、学校和人口普查收集的数据),大数据的发展更是让企业和政府可以通过个人设备和在线行为收集到包含位置、网络搜索历史、媒体消费、体育活动、社交网络等各方面的宝贵数据。如此大规模的数据无不涉及每个人的隐私,这一情况需要有新的开发工具来执行大规模的数据分析的同时保护数据中所代表的个人隐私。比较经典的一种隐私算法是06年提出的(ε,δ)-Differential Privacy(DP),这种方法把隐私和假设检验相结合,可以根据原假设和备择假设的区分难度来判断隐私大小。但是(ε,δ)-DP只用了2个参数来定义假设检验,信息损失太多,于是苏博士提出用一类错误和二类错误的权衡来描述隐私,进而提出f-DP。由于f-DP是函数形式,能提供更多信息(informative),f-DP还允许以代数方式对算法进行无损复合(composition),此外,f-DP的子抽样(subsampling)可以保护更大的隐私。f-DP还被证明具有中心极限定理,由此也引出了更简洁的GDP(Gaussian Differential Privacy)。最后,f-DP被用于SGD以验证其实用性。
报告结束后在场师生与苏博士关于差分隐私问题,包括f-DP的中心极限定理的细节等进行了热烈讨论。