通知:2018年,第十一届中国R会议(北京)将于5月25-27日举办。由于场地因素,本届R会场地紧急更换:25日为海淀区紫竹院路29号香格里拉酒店2层宴会厅,26-27日为中国人民大学教一和教三,请各位参会者务必注意。
本次会议由中国人民大学统计学院、北京大学光华管理学院与统计之都联合主办,狗熊会和中国人民大学应用统计科学研究中心协办,并得到了战略合作伙伴--派生集团的鼎力支持,以及星通联华,中国人民大学出版社、天启智创、RStudio、Elastic、图灵教育和MERKLE等友情合作伙伴的大力支持,届时将由IT大咖说提供独家视频技术支持。本届会议涵盖了多个学科领域,我们真诚地期待您的到来,一同感受数据科学为这个时代带来的惊喜与挑战。
下面为您奉上本次R会议主会场演讲嘉宾介绍:
【主会场】
1. Farming Big Data in R Environment 范剑青 普林斯顿大学
嘉宾介绍:范剑青(Jianqing Fan),现为复旦大学大数据学院教授、院长,以及普林斯顿大学Frederick L. Moore`18金融学讲座教授,2000年荣获COPSS总统奖(国际统计学领域最高奖项),2006年荣获洪堡基金会终身成就奖,2007年荣获晨兴华人数学家大会应用数学金奖,2009年荣获在美国文理与艺术界著名的GUGGENHEIM 学者(Fellow), 2012年当选台湾”中央研究院”院士,2013 年获泛华统计学会 (International Chinese Association)的“许宝禄奖, 2014年荣获英国皇家统计学会授予的“Guy Medal”银质奖章,现为国际统计学会(International Statistical Institute)会士、国际数理统计学会(Institute of Mathematical Statistics)会士、美国统计学会(American Statistical Association)会士、美国科学促进会(American Association for the Advancement of Science)会士、计量金融学会(The Society for Financial Econometrics)会士。主要研究领域为高维统计、机器学习、大数据科学、经济学、金融学、生物信息等。学术成果发表在Annals of Statistics, Journal of American Statistical Association,Journal of Machine Learning Research, Econometrica, Journal of Econometrics, Journal of Financial Economics等国际一流期刊上。目前为国际一流期刊 Journal of Econometrics的联合主编,Journal of American Statistical Association的副主编。
演讲摘要:Correlated and heavy-tailed data arise frequently in a wide range of scientific and engineering problems: from genomics, medical imaging to neuroscience and finance. This talks introduce Factor-Adjusted Robust Multiple testing (FARM-test) and Factor-Adjusted Robust Model Selection (FARM-select). The former is introduced to control the false discovery proportion for large-scale simultaneous inference when variables are highly correlated and the latter deals the variable selection problems when covariates are highly correlated. We demonstrate that robust factor adjustments are extremely important in both improving the power of the tests and controlling FDP and improving model selection consistency rates. These will be demonstrated through newly developed R packages. We identify general conditions under which the proposed method produces a consistent estimate of the FDP. We also proved that factor adjustments significantly reduce the conditions needed for selection consistency. The results will be illustrated by numerical experiments.
2. 摸眼盲人管窥AI之ABCDE 山世光 中科院智能信息处理重点实验室
嘉宾介绍:山世光,中科院计算所研究员、博导,现任中科院智能信息处理重点实验室常务副主任。他是第三批国家“万人计划”入选者,国家基金委优青,国家百千万人才工程入选者,中国计算机学会青年科学家奖获得者,科技部中青年科技创新领军人才。他的专业领域为计算机视觉和机器学习,在人脸识别等图像识别技术上有超过20年的研发经验,带领团队获得过十余次国内外学术竞赛冠亚军,所研发的人脸识别技术成功应用于公安部出入境管理局、十几省公安厅、华为手机等。已在国内外刊物和学术会议上发表论文200余篇,其中计算机学会认定的A类刊物和会议论文70余篇,论文被谷歌学术引用13000余次。曾应邀担任过ICCV,ACCV,ICPR,FG,ICASSP等10+次领域主流国际会议的领域主席,现/曾任IEEE TIP, CVIU, PRL, Neurocomputing, FCS等国际学术刊物的编委(AE)。研究成果获2005年度国家科技进步二等奖,2015年度国家自然科学二等奖。
演讲摘要:AI热潮持续发酵,人类社会似乎正在快速进入所谓AI时代。那么,AI时代真的指日可待了吗?本报告将在回顾AI领域近期部分重要进展的基础上,对此次AI热潮背后的最大推手——深度学习技术的源起和原理做介绍,然后将探讨深度学习给计算机视觉技术和系统的研发带来的方法论上的变迁,以及它最适用的领域和问题类型。最后,将对比人类智能,分析深度学习对全面实现AI时代的不足,以及未来需要继续努力的方向。
3. 统计学与健康中国 邓柯 清华大学
嘉宾介绍:邓柯,清华大学统计学研究中心副教授、副主任,博士生导师。2008年获北京大学统计学博士学位,同年进入哈佛大学统计系从事研究工作,历任博士后、副研究员,2013年加入清华大学。2014年入选“青年千人计划”并当选中国数学会概率统计学会第十届理事会理事,2015年当选中国医疗保健国际交流促进会医学数据与医学计量分会常务委员,2017年当选中国现场统计研究会计算统计分会首任理事长、中国现场统计研究会环境与资源分会常务理事,2018年当选国际计算统计学会亚太地区分会理事。他还获得了“科学中国人(2016)年度人物”的荣誉称号。邓柯的研究兴趣包括统计建模、统计计算、生物信息、文本分析、医疗大数据分析、政府大数据分析等领域。他的一系列研究成果发表在统计学和其他学科的顶级期刊上。
演讲摘要:习近平主席在党的《十九大报告》中明确提出了“健康中国”战略,指出“要把人民健康放在优先发展的战略地位”,“切实解决影响人民群众健康的突出环境问题”、“加强食品安全监管”、“努力减少公共安全事件对人民生命健康的威胁”、“提供连续的健康管理服务和医疗服务”,从而“全方位、全周期保障人民健康,大幅提高健康水平,显著改善健康公平”。在这一重大系统工程的许多方面,都需要统计学发挥不可替代的关键作用。在本报告中,我将结合我们近年来在医疗大数据分析、食品安全监管、卫生技术评估等领域的研究和实践,探讨统计学在实施“健康中国”战略中的巨大机遇与挑战。我们也非常希望越来越多的统计届同仁关注相关的统计学研究与应用,与我们一道共同推动统计学在落实国家重大战略中发挥关键作用。
4. 空气质量评估的气象调整方法 陈松蹊 北京大学
嘉宾介绍:陈松蹊,国家特聘专家, 北京大学讲席教授,商务统计与经济计量系联合系主任、北京大学统计科学中心联席主任 国家首批“千人计划”入选者,加盟北大后主要致力于商务统计与经济计量学学科建设及北大统计学研究队伍的建设工作。他是数理统计学会(Institute of Mathematical Statistics) 资深会员(fellow),美国统计学会会士(fellow),国际统计学会 (International Statistics Institute) 当选会员 (elected member),国际数理统计学会 (IMS) 理事会常务理事( Council member)。他现在是The Annals of Statistics(统计年鉴) 副主编 (自2010年);Journal of Business and Economic Statistics 副主编 (自2013年);曾任Statistics and Its Interface 的联席主编 (2010-2013)。
演讲摘要:Although air pollution is caused by emission of pollutants to the atmosphere, the observed pollution levels are largely affected by meteorological conditions which determine the dispersion condition of the pollutants. Effective air quality management requires statistical measures that are immune to the meteorological confounding in order to evaluate {spatial and temporal} changes of the pollution concentration objectively. Motivated by a challenging task of assessing changes and trends in the underlying pollution concentration in a region near Beijing, we propose a spatial and temporal adjustment approach for the PM$_{2.5}$ and other five pollutants with respect to the meteorological conditions by constructing a spatial and temporal baseline weather condition based on historic data to remove the meteorological confounding.
The adjusted mean pollution concentration is shown to be able to capture changes in the underlying emission while being able to control the meteorological variation. Estimation of the adjusted average is proposed together with asymptotic and numerical analyzes. We apply the approach to conduct assessments on six pollutants in the Beijing region from Year 2013 to Year 2016, which reveal some intriguing patterns and trends that are useful for the air quality management.
5. 大规模深度学习的并行优化以及加速策略 刘霁 美国罗切斯特大学
嘉宾介绍:刘霁博士毕业于威斯康星大学麦迪逊分校计算机系,本科毕业于中国科大自动化系。当前是美国罗切斯特大学助理教授以及腾讯AI lab专家研究员。他的研究涉猎于诸多理论和应用方向,包括机器学习,并行算法,优化方法,强化学习,计算机视觉,游戏AI设计,生物信息学,多媒体,图形学等等。他在顶级的人工智能相关会议以及期刊上发表超过40篇论文,包括NIPS, ICML,KDD,CVPR,ICCV,UAI,JMLR, PAMI等。他曾获得2010数据挖掘顶级会议KDD最优论文提名奖和2015顶级人工智能会议UAI Facebook最优学生论文奖,他的论文曾入选2017机器学习顶级会议NIPS大会宣讲(比例1%)。同时他还荣获2017 IBM最优教职奖和2017 MIT TR35(China)。
演讲摘要:计算效率是大规模深度学习的重要瓶颈之一,同时也是人工智能技术落地的关键性因素之一。该报告将以个人的科研和实践为基础从多个层面和角度(比如,异步并行计算,区中心化的计算体系结构,硬件算法联合设计等等),介绍当前深度学习重要的并行框架,算法,和理论,并将展望未来的发展方向。另外还将探讨数据隐私保护和分布式学习算法结合。
6. 数据交易与治理 王汉生 北京大学
嘉宾介绍:王汉生,北京大学光华管理学院商务统计与经济计量系,嘉茂荣聘讲席教授,博导;北京大学商务智能研究中心主任;光华管理学院MBA,EMBA,ExEd,本硕博教学指导委员会成员;美国统计学会(American Statistical Association)会士(Fellow, 2014)。1998年北京大学数学学院概率统计系本科毕业,2001年美国威斯康星大学麦迪逊分校统计系博士毕业。2003年加入光华至今。国内外各种专业杂志上发表文章逾80篇,并合著英文专著1本,中文教材2本。国际统计协会(International Statistical Institute)、英国皇家统计协会(Royal Statistical Society)、美国统计协会(American Statistical Association)、美国数理统计协会(Institute of Mathematical Statistics)、泛华国际统计协会(International Chinese Statistical Association)的会员。先后历任以下国际学术刊物副主编(Associate Editor):The Annals of Statistics (2008—2009), Computational Statistics & Data Analysis (2008—现在),Statistics and its Interface (2010—现在),Journal of the American Statistical Association (2011—现在),Statistica Sinica (2011—现在),Journal of Business and Economics Statistics (2012--现在),中国科学数学(2013—现在)。在理论研究方面,关注高维数据分析。具体内容有:变量选择、收缩估计、数据降维等。在应用方面,关注统计学方法在电子商务领域的应用,尤其关注中文文本分析、社会关系网络、以及位置轨迹数据。
演讲摘要:数据交易势不可挡。该趋势同任何组织或者个体,之于数据交易的观点和态度无关,这是一个基本的不可阻挡的趋势。就如同山洪一样,它一定从高处往下流,跟任何人的喜好无关。对山洪不管不顾,或者刻意阻挡,都有可能酿成洪灾。但是,如果加以合理的规范治理,它可以用于发电提供能源。对于数据交易一样,无论是不负责任的放任自流,还是不切实际的严苛管制,都不是值得推崇的建设性方案。一个更具建设性的方案是,集合更多的智慧,为数据交易发展一套尽可能完备的理论框架。尽可能发挥数据交易的社会价值,而极小化它所带来的伤害。该理论框架应该包括,但不局限于,数据治理(含:数据确权与合规),交易标的与形态,和数据定价理论。这是本次分享的核心内容。