百年校庆杰出学者讲座第54期-适用于复杂结构表型的全基因组关联分析算法

时间:2025-05-19 17:05    来源:     阅读:

主题:适用于复杂结构表型的全基因组关联分析算法

主讲人:北京大学基础医学院 毕文健教授

主持人:统计与数据科学学院 林华珍教授

时间:5月22日16:00-17:00

地点:柳林校区弘远楼408会议室

主办单位:统计与数据科学学院 科研处

主讲人简介:

毕文健,北京大学基础医学院医学遗传学系课题组长,研究员,北京大学博雅青年学者,国家级人才计划入选者。主要工作涉及统计遗传学、生物统计与系统生物学、生物信息学等,针对基因-环境交互作用、生存数据和多分类表型数据设计了多种快速、准确的分析算法,并应用于UK Biobank等大型生物样本库的实际数据中。以第一/通讯作者身份发表于Nature Genetics (2022)、American Journal of Human Genetics (2019, 2020, 2021, 2023)、Nature Communications (2025a, 2025b, 2025c)、PLOS Genetics (2024)、Cell Reports Medicine (2025)、Genetics、Biostatistics等学术杂志。主持国家自然科学基金专项项目、面上项目、国际合作和交流项目,北京市自然科学基金非共识创新项目等。

内容提要:

随着全球大型生物样本库(biobank)数据的兴起,人们开始在大规模全基因组关联研究(GWAS)中关注结构更为复杂的性状。例如,生存时间(time-to-event)和纵向(longitudinal)数据能够更全面刻画个体健康状况的演变过程,相比于传统的定量或二元性状蕴含更多信息。回顾性关联方法(retrospective association methods)以表型为条件、将基因型视为随机变量,从而为大规模遗传关联研究提供了可扩展、精准且通用的分析框架。基于这类分析框架,我们提出了多种适用于复杂表型的大规模 GWAS 通用方法。SPAmix:通过利用原始基因型数据及 SNP 派生的主成分(PCs),为每个变异估计个体层面的等位基因频率,从而处理群体混合(population admixture)问题。SPAGRM:借助稀疏遗传关系矩阵(sparse GRM)和同源片段(IBD)信息,校正得分统计中的隐含遗传相关性,以调整样本亲缘关系的影响。SPAGxE:利用矩阵投影方法去除基因-环境交互作用分析中的遗传边际效应。我们在模拟研究和英国生物样本库(UK Biobank)真实数据分析中验证了 各类方法 的性能。结果表明,这两种方法在保持较高统计功效的同时,能够严格控制第一类错误率,这些特点有助于实际数据分析找到更多的致病遗传位点。

西南财经大学  版权所有 webmaster@swufe.edu.cn     蜀ICP备 05006386-1号      川公网安备51010502010087号