1月26日,Nature Genetics杂志(5年IF=37.4)在线发表题为“Conditional transcriptome-wide association study for fine-mapping candidate causal genes”的全转录组关联分析精细定位(TWAS fine-mapping)新方法。金沙游戏城网页公共卫生学院博士研究生刘璐(现为密歇根大学博士后)为论文第一作者,金沙游戏城网页公共卫生学院袁中尚教授、密歇根大学生物统计系周翔教授为论文共同通讯作者,金沙游戏城网页为第一和共同通讯作者单位。
全转录组关联研究(TWAS)旨在整合表达数量性状基因座(eQTL)和全基因组关联研究(GWAS),以期进一步阐明复杂疾病内在分子遗传机制。当前TWAS方法多停留在单基因分析模式,未充分考虑同一基因组区域多基因表达水平间、多预测基因表达间、调控不同基因表达的遗传变异间的复杂关系,致使单基因分析方法识别出多个显著基因,却无法从错误信号中区分出真正的因果关联。此外,多数TWAS方法采用两阶段式推断策略,将基于eQTL估计的遗传效应作为固定数值直接带入GWAS基因型数据,忽略了参数估计过程中的不确定性,势必会降低其检验效能。
为减少假阳性、提升检验效能、准确定位因果基因,本研究构建了GIFT(Gene-based Integrative Fine-mapping through conditional TWAS)模型,对区域内的所有基因联合建模,在最大似然框架中进行条件TWAS分析,以有效地实现TWAS精细定位。GIFT对区域中不同基因之间表达水平的相关性和cis-SNPs的LD关系联合建模,并校正了构建预测基因表达时的不确定性。因此,GIFT可提供校准的p值,将多个边际TWAS关联精炼为更小的因果关联集,具有很高的检验效能,减少了错误发现。通过UKB中血压和血脂六个复杂性状的实际数据应用,GIFT比已有方法识别因果基因集大小减少了32.16%~91.32%。GIFT识别的因果基因突出了直接血管调节在血压中的重要性,以及脂质代谢在调节血脂水平中的重要性。
该研究得到了国家自然基金面上项目、山东省自然科学基金重大基础研究项目、泰山学者青年专家计划、金沙游戏城网页齐鲁青年学者计划等资助,国家健康医疗大数据研究院为本研究提供了计算平台支持。袁中尚教授课题组沿医数交叉研究路径,长期从事跨组学数据整合统计方法与应用研究,成果先后发表在Nature Genetics、Nature Communications、Science Advances、The American Journal of Human Genetics、JAMA Psychiatry等权威期刊。