新闻

新闻

您当前的位置: 新闻
“统计大讲堂”系列讲座High Dimensional Compositional Data Analysis in Microbiome Studies成功举办
时间:2016-12-23

1221日下午,“统计大讲堂”系列讲座第四课High Dimensional Compositional Data Analysis in Microbiome Studies在明德主楼1030会议室召开。宾夕法尼亚大学生物统计系Li Hongzhe教授介绍了他最近关于人体内微生物群落的研究成果。本次讲座由统计学院副院长尹建鑫老师主持。

2016-12-21 主讲人.jpg

 

2016-12-21 尹建鑫.jpg

在讲座的开始阶段,李教授介绍了研究的背景知识:人体内的微生物往往与人体健康的状况有很大的关系。目前对人体内微生物群落的辨识往往从基因分析的角度出发,通过分析基因的成分来判断不同微生物的种类及数目。而在基因测序的过程中,往往会因为测序深度不够等问题导致获取的基因比例不准确。Li Hongzhe 教授及其团队研究了一系列方法来克服这个问题。

在讲座的第一部分,Li Hongzhe 教授讨论了由于基因测序深度不够所导致的一些种类稀少的基因探测结果为0的问题,这种探测结果将导致对微生物种群丰富度的低估。为解决这个问题,李教授假设这些观测都服从高维的多元正态分布,其中菌落比例构成了这个多元分布的概率参数。对于n个人,p个菌落,我们可以做一个n*p的成分矩阵,其中每一列代表菌落在不同人中的比例,而每一行代表每个人身体中的不同菌落的比例情况。在这个成分矩阵低秩的条件下,不同菌落的成分比例可以用一种加罚的极大似然估计方法估计出来,并且具有很好的渐近性质。

在讲座的第二部分,李教授介绍了他们在高维成分数据下对不同菌落之间相关矩阵的研究。他介绍了一种可以对成分数据进行调整的阈值方法。这种方法在高维基相关矩阵稀疏的假设下有很好的性质。首先,对成分数据导出的相关矩阵进行分解,得到一种基相关矩阵。在高维情况下,这个基相关矩阵可以看作是近似可识别的。然后对这个矩阵加阈值进行调整,就可以得到对不同微生物群相关矩阵的良好估计。最后,他介绍了将该方法用于人类内脏微生物数据的研究的成果。

2016-12-21 听众.jpg

讲座结束后,Li Hongzhe老师与在场师生就讲座细节进行了深入的交流。