新闻

新闻

您当前的位置: 首页> 新闻
大数据系列讲座第二期成功举办
时间:2015-05-20

 

2015年5月12日晚上七点,由大数据分析硕士培养协同创新平台主办,中国人民大学统计学院、中国人民大学数据挖掘中心承办的大数据系列讲座第二期在明德主楼1030教室成功举办。此次讲座特别邀请百度研究院大数据实验室的数据科学家吴海山博士给同学们带来本期报告,五校联合的大数据班专业硕士以及人民大学统计学院部分老师及同学参加了此次讲座。吴博士长期从事计算机视觉群体行为的量化研究,目前主要负责百度时空数据的用户行为预测研究,一方面,通过分析挖掘用户的时空运动规律,打造更加智能化、个性化的个人助理;另一方面,通过相关分析进行社会公益、智慧城市等的研究。



 

此次讲座的主题内容为Spatio-temporal big data: from science to industry,即时空大数据在具体行业中的应用。随着时空信息数据的大规模增长与数据挖掘理论的不断发展,时空数据的研究已经成为计算机系统专家学者研究的热点,目前的研究涵盖时空数据挖掘技术的理论分析、模型搭建与实际应用等。本次讲座中,吴博士侧重于对数据实际应用层面的讨论。



 

以动物行为的研究为引入,吴博士和大家分享了用计算机视觉和数据挖掘技术来研究动物行为的思想,并详细描述了利用实验获取模拟数据的过程。通过收集的轨迹数据,可以进一步根据模型展开影响因素分析,从而对动物的行为进行深入了解。紧接着,吴博士重点给大家介绍了基于用户行为的时空数据的应用成果。在智能手机广泛使用的今天,利用百度地图能够得到海量定位数据,就可以实现对用户行为预测的多层面研究。为了让同学们对该研究有更直观的理解,吴博士给出了多项研究的可视化展示及结果分析。

 

一方面,定位系统的数据可以帮助分析和挖掘用户的时空运动规律。其中包括苹果系统与安卓系统用户所在地的分布对比、旅游旺季的游客出行方式及活动范围的差异性分析、基于卫星云图的各地经济发展水平比较、节假日城市之间的人口流动情况、基于用户活动轨迹的社交关系网络分析等。这些研究不仅涉及了用户行为的各个方面,还有效结合了经济社会热点问题进行分析,有助于深入挖掘某些社会现象及行业发展的特点,进而寻找有利条件以提高行业运作效率。另一方面,定位系统的数据还可以用于社会公益相关事务的研究。吴博士指出,利用归一化处理、相关性分析等方法,可以实现如自然灾害预警、踩踏事故预警、人口流量预测等工作,这些研究成果对于减少危害行为的发生具有一定的探索和借鉴意义。



 

讲座尾声,在场老师和同学针对讲座中涉及的研究成果进行了提问,吴博士一一给出了详细解答。他表示,关于时空数据的研究还有很多值得探索的地方,有兴趣的同学可以深入的从理论层面学习。最后,吕晓玲老师代表主办方对吴博士的到来表示了衷心的感谢,大数据系列讲座第二期获得圆满成功。