近日,生物医学与健康学院PI龚静教授课题组在《Nucleic Acids Research》(IF:11.1)杂志先后发表题为“ncRNA-eQTL: a database to systematically evaluate the effects of SNPs on non-coding RNA expression across cancer types” 和 “SNP2APA: a database for evaluating effects of genetic variants on alternative polyadenylation in human cancers”等2篇文章。系列文章对多种癌症中遗传变异的功能进行深入分析,发现了大量可调控ncRNA和可选择性多聚腺苷酸化(APA)的遗传变异位点,构建了在线数据库,方便其他研究者使用。
研究表明,非编码RNA(ncRNA)在生物学过程中具有重要功能,一些遗传变异(SNP)可通过影响ncRNA表达而导致疾病。目前虽然有一些ncRNA得到深入研究,但绝大多数ncRNA的功能仍有待解析。在该研究中,研究团队基于TCGA的癌症多组学数据和全基因组关联分析(GWAS)数据,开发了新的生物信息计算方法,系统鉴定了能影响ncRNA(包括lncRNA和miRNA)的表达数量性状基因座(ncRNA-eQTL),并进一步整合了GWAS数据和临床信息,鉴定了与GWAS表型或临床信息相关的ncRNA-eQTL,并搭建了ncRNA-eQTL的数据平台。用户可通过ncRNA-eQTL数据库查询和下载所有ncRNA-eQTL结果,包括不同癌症类型的顺式和反式ncRNA-eQTL、患者存活时间相关的ncRNA-eQTL,GWAS 相关的ncRNA-eQTL。此外,该平台提供批量查询功能,可跨癌症类型比较多个功能性ncRNA-eQTL或基因。该平台为探索SNP、非编码RNA和癌症表型之间的关联及其潜在的生物学机制提供极大便利。
研究结果表明,可选择性多聚腺苷酸化(APA)可通过识别转录本上不同的PolyA加尾信号,使转录本具有不同长度的3’端非翻译区(3’UTR),从而影响其生物学功能。SNP是人类遗传变异的最常见类型,在人类复杂性状和疾病中发挥重要作用。近来发现,一些遗传变异可造成APA功能失调,APA也与癌症的发生发展密切相关。研究团队利用公共数据库多种癌症样本的基因型数据和APA数据,通过生物信息学方法系统鉴定了影响APA事件的遗传变异(apaQTL),并根据基因调控方式定义了顺式和反式apaQTL。在进一步整合GWAS数据后,鉴定了落在GWAS区域的tag SNP及其连锁不平衡LD区域中的apaQTL,并利用样本的临床信息鉴定预后相关的apaQTL。研究团队搭建了SNP2APA数据库展示这些结果,同时设计了软件在线预测SNP对多聚腺苷酸化信号的影响。该数据库将成为APA和SNP等研究领域的重要资源。