5月7日下午,“统计大讲堂”系列讲座第189讲举行。本次讲座采取线上会议的方式,邀请字节跳动研究科学家高伟豪作题为“Machine Learning Meets Molecular Dynamics”的报告。讲座由师资博士后王睿主持。
王睿首先介绍了主讲人的相关信息。高伟豪,字节跳动研究科学家。本科就读于清华大学姚班,博士就读于伊利诺伊大学香槟分校电气与计算机工程系,于2019年获得博士学位,博士导师是Sewoong Oh教授和Pramod Viswanath教授。研究方向包括机器学习与分子模拟结合、机器学习、深度学习、推荐系统和信息论。在IEEE Transactions on Information Theory、ICML、NeurIPS等期刊和会议上发表论文十余篇。
高伟豪首先阐释了分子动力学(MD)的概念、应用、模拟流程及其中的挑战。MD是求解原子和分子的经典运动方程,以获得系统的时间演化。它适用于许多粒子系统——一般的解析方法不可能解出它的答案,必须借助数值方法和计算机。高伟豪指出,MD的应用非常广泛,在材料与锂电池、生物化学与药物设计等研究领域都有着巨大作用。紧接着,高伟豪分七个步骤介绍MD模拟流程,并从速度、精确性和采样效率三个方面说明MD模拟流程中遇到的挑战。
随后,高伟豪从三个方向介绍了自己的研究工作。其一,通过机器学习对MD进行加速。经典的MD模拟速度受到时间步长的限制,而利用机器学习可以扩大时间步长从而实现加速。同时,运用MDNet方法也使得误差随时间步长增加的增速减缓。其二,做一个精度更高的机器学习力场。相比于以往的位置编码方法,高伟豪及其团队提供了一种可供机器学习的位置编码方法,并进行了分子性质的预测。在大多数任务中,使用这种位置编码大幅优化了最终效果。其三,用机器学习做有效率的采样。相比传统采样方法,使用PathFlow不需要真实时间的迭代。此外,一旦经过训练,PathFlow就可以轻松地进行采样并寻找转型路线。
最后,高伟豪基于上述所讲,从和速度、精确性和采样效率相关联的三个方向出发总结了团队在机器学习和MD交叉领域的探索与研究。
在提问环节中,高伟豪认真细致地解答了师生们的疑问,就本课题进行了更进一步的探讨。
此后“统计大讲堂”系列将陆续推出更多精彩讲座,敬请关注。