加州大学圣地亚哥分校的研究人员推出了EUGENe:一种易于使用的深度学习基因组学软件

加州大学圣地亚哥分校研究人员发布易用的EUGENe深度学习基因组学软件

深度学习在生活的各个领域中被使用。它在各个领域都有其实用性。它对生物医学研究产生了重大影响。它就像一个智能计算机,可以在很少帮助下在任务上变得更好。它改变了科学家研究医学和疾病的方式。

它在基因组学中具有影响力,基因组学是研究DNA组织为基因以及这些基因在个体细胞内被激活或停用的过程的生物学领域。

加利福尼亚大学圣迭戈分校的研究人员制定了一个新的深度学习平台,可以快速且轻松地适应各种基因组学项目。加利福尼亚大学圣地亚哥医学院医学系的副教授汉娜·卡特博士表示,每个细胞都具有相同的DNA,但DNA的表达方式会改变细胞的外观和功能。

EUGENe使用模块和子程序包来促进基因组学深度学习工作流程中的基本功能。这些功能包括(1)从各种文件格式中提取、转换和加载序列数据;(2)实例化、初始化和训练不同的模型架构;和(3)评估和解释模型行为。

尽管深度学习具有为遗传变异的多样生物过程提供有价值的见解的潜力,但其实施对于需要更广泛的计算机科学专业知识的研究人员而言存在挑战。研究人员表示,目标是开发一个能够使基因组学研究人员简化他们的深度学习数据分析的平台,以更轻松高效地从原始数据中提取预测。

尽管仅约占总基因组的2%的编码特定蛋白质的基因,其余的98%通常被称为垃圾DNA,因为其被认为没有已知的功能,但它在确定某些基因被激活的时间、位置和方式方面起着至关重要的作用。理解这些非编码基因组部分的作用一直是基因组学研究人员的首要任务。深度学习已经被证明是实现这一目标的强大工具,但有效使用它可能很困难。

卡特实验室的博士生Adam Klie表示,许多现有平台需要大量的编码和数据整理时间。他指出,许多项目需要研究人员从头开始进行工作,这需要可能不是所有对此领域感兴趣的实验室现有的专业知识。

为评估其有效性,研究人员通过尝试复制三个先前使用各种测序数据类型的基因组学研究的结果来测试EUGENe。在过去,分析这种多样化的数据集需要整合多个不同的技术平台。

EUGENe表现出了出色的灵活性,成功复制了每项调查的结果。这种灵活性突显了该平台管理各种测序数据的能力,以及其作为基因组学研究中一种适应性工具的潜力。

EUGENe显示了对不同的DNA测序数据类型的适应性和对各种深度学习模型的支持。研究人员的目标是将其范围扩大到包括更广泛的数据类型,包括单细胞测序数据,并计划使EUGENe对全球研究团队可供使用。

卡特对该项目的合作潜力表示激动。他说,这个项目的令人兴奋之处之一是随着更多人使用该平台,他们能够随着时间的推移不断改进,这对于深度学习的快速发展至关重要。