加州大学河滨分校数量遗传和生物信息学团队发表人类肿瘤miRNA表达谱数据库CancerMIRNome

测序中国
2021-09-16 11:37 来自北京市

近日,来自美国加州大学河滨分校贾震宇教授团队,广州市第一人民医院钟惟德教授团队以及贵州省人民医院朱建国教授团队联合在国际著名期刊Nucleic Acids Research在线发表肿瘤miRNA组学数据库CancerMIRNome(http://bioinfo.jialab-ucr.org/CancerMIRNome/)。

microRNA/miRNA是一类内源的约22nt的小RNA。在基因表达调控网络中起到非常关键的作用。研究表明miRNA参与到肿瘤发生发展的各个阶段,可以作为癌症诊断和预后的生物标记。尤其是循环miRNA(circulating miRNA)可以被胞外囊泡(EVs)如外泌体(Exosomes),凋亡小体(Apoptotic bodies)或Argonates(AGOs)蛋白等保护起来以非常稳定的形式存在于体液中,可以作为非侵入性早期肿瘤筛查(Non-invasive early cancer detection)的重要标记物。

CancerMIRNome是迄今最全面的肿瘤miRNA表达谱数据库,该数据库整合了来自The Cancer Genome Atlas(TCGA)的33个癌种超过10,000份肿瘤组织或癌旁样本的miRNA表达谱数据,以及约30,000份来自血浆、血清、外泌体的循环miRNA表达谱数据,并提供了非常全面系统的miRNA组学数据分析及可视化功能。

用户可以在CancerMIRNome查看单个miRNA在不同肿瘤/癌旁组织的表达情况;作为诊断和预后标记的能力;跟靶基因的表达相关性;miRNA靶基因富集到的通路;以及单个miRNA在循环miRNA数据集中各个不同样本的表达情况。除此之外,CancerMIRNome还提供了多个miRNA组学(miRNome)数据分析模块,如鉴定高表达的miRNA;不同组之间比如肿瘤和癌旁,早期和晚期等表达有差异的miRNA;基于AUC或基于Lasso算法的诊断标记;PCA降维分析;单变量KM、CoxPH生存分析;以及基于多变量CxoPH,Cox-Ridge和Cox-Lasso的预后模型构建。用户可以提供感兴趣的miRNA列表并选择一种机器学习算法来构建预后模型。

此外,CancerMIRNome数据库中收集的所有数据(miRNA表达数据和样本表型数据)都以ExpressionSet的形式存储在.RDS文件中,用户可以非常方便的下载这些数据并在R中读取用于后续分析。

美国加州大学河滨分校贾震宇教授课题组已毕业博士生李瑞东(现为美国吉利德科学公司生物信息科学家)为论文的第一/通讯作者。加州大学河滨分校贾震宇教授,广州市第一人民医院钟惟德教授和贵州省人民医院朱建国教授为论文的共同通讯作者。该团队此前在国际著名期刊发表多个生物统计/生物信息学软件及算法,包括在Molecular Biology and Evolution发表的基于单细胞配子体测序进行单倍型分析的软件Hapi, 在Briefings in Bioinformatics发表的整合多组学数据进行癌症患者预后分析的统计算法SFS-BLUPH,在Bioinformatics发表的基于Genomic Data Commons(GDC)/The Cancer Genome Atlas(TCGA)肿瘤测序数据进行lncRNA, miRNA和mRNA联合分析的软件GDCRNATools等,以及近期在bioRxiv预印本上线的前列腺癌转录组数据库PCaDB。

热点新闻