2015年12月23日下午,数据科学主题研讨会在我院成功举办。研讨会由院长赵彦云教授主持。来自北京大学发展研究院的沈艳教授、我院王星副教授和黄向阳副教授分别就“关于P2P问题平台的大数据分析与初探”、“数据科学中的预测文化”和“数据科学时代的统计科学:一个设计科学的视角”等话题做了精彩的报告。
1、关于P2P问题平台的大数据分析与初探
“P2P”全称是“peer-to-peer”,指借贷双方借助电子商务网络平台确立借贷关系并完成的交易。近几年来,随着“互联网+”的持续升温,P2P网贷平台以近乎野蛮的速度快速增长着,以其“回报率高、方便、快捷”等优点,吸引了大量普通民众的投资。但近期以“e租宝”为代表的问题平台也并不少见。作为普通民众,该如何辨别问题网站?相关监管部门的监管措施又有着怎样的问题?沈艳教授分别从P2P问题平台的背景、研究意义、数据来源与数据的描述、平台风险与各因素的联系的分析以及政策与建议等方面进行阐述。通过对“网贷天眼”、“网贷之家”等四家主流P2P网贷门户网站数据的清理,沈教授发现八成的问题平台活不到一岁,逾六成正常平台比半岁大;利率低于8%或高于20%区间的平台和对于投资者极具诱惑的提供保本保息投资服务的平台可能风险更高,寿命更短。
2、数据科学中的预测文化
王星副教授教授从美国统计学家David Donoho《数据科学50年》出发,阐述了预测文化的意义、以CTF为范式的预测模型、中国统计学科面临的危机和数据科学的科学展望四方面的内容。她提到既然所有科学都已成为数据科学,统计是否可以成为数据科学中的科学?国内统计学科的相关学科屈指可数,而模型是交流理解数据的场景,是统计学在其他学科中形象的重要组成部分,有必要从中寻找显著性突破。
3、数据科学时代的统计学科:一个设计科学的视角
黄向阳副教授将2015年美国统计学家David Donoho 所做的《数据科学50年》和加州大学伯克利分校统计系和电子工程与计算机科学系的讲席教授郁彬2014年的多次演讲进行对比,“数据科学的热潮中,统计学家在被边缘化”,进入数据科学时代,统计学家愈来愈感觉到统计方法并不是统计学家能够独占的。而统计方法和统计学家的分离是造成当前危机的根源之一。统计学家不应该只停留于“码农”,成为数据时代中的“蓝领”,应该发挥自己的优势,合理应用其他学科知识。重拾长期为人忽视的设计科学视角,以更好的理解数据科学时代,统计学所扮演的角色。
这次主题研讨会使同学们受益匪浅。沈艳教授对P2P问题平台的研究报告拓宽了同学们在大数据时代中,将统计知识运用在其他领域的思路。而王星和黄向阳副教授对数据科学的过去,现状的报告让同学们明白了数据时代统计学家的无奈,以及未来统计人的努力方向。