|
Nvidia推出用于基因组分析的深度机器学习模型软件作者:美格君 国际**的人工智能技术企业英伟达Nvidia周二表示,它正在与Broad博德研究所合作,为博德研究所的Terra数据平台的25000名用户提供Clara Parabricks GPU加速软件,用于基因测序数据的二次分析。作为图形处理器GPU和高性能计算技术的制造商,英伟达表示将为Broad的基因组分析工具包GATK提供一种新的基于Parabricks的深度学习模型,用于基因遗传变异分析。 此外,博德研究人员将在新发布的名为Nvidia BioNeMo的人工智能应用框架上开发用于DNA和RNA研究的基础深度学习语言模型。该技术基于一个名为NeMo Megatron威震天的Nvidia自然语言处理平台。 Terra由Broad、Microsoft和Alphabet的Verily共同开发,为研究人员提供了一种通过云计算连接数据集、生物信息学工具的方法。 Nvidia表示,Parabricks将在定于下月发布的GATK下一次更新中提供,以帮助提高变体调用的准确性。 随着单位基因组测序的成本从数百美元下降到100美元以下,需要高效的基因组数据的分析能力,GPU正在推动下一波基因组学分析发展。 通过BioNeMo,Nvidia为生物学带来了一种称为大型语言模型LLM的深度学习策略,在这种策略中,算法是在基于大量文本的数据集上进行训练的。 BioNeMo框架是为希望开发新的、预处理过的大型语言模型的研究人员和开发人员设计的,这些模型具有任何规模和任何类型的生物序列,无论是化学、蛋白质、DNA还是RNA。 而在DNA领域,这才刚刚开始。 在下一波人工智能中,大型语言模型可以理解化学和生物学的语言,未来将作为药物发现管道,实现端到端运行,将药物发现的方式转变为信息和计算机科学方式。LLM为我们提供了一种新的工具,来探索生物分子和化学的无限世界。 LLM可以帮助研究人员和临床医生理解医疗记录中的人的语言。同样,在生物学中,还有另一套语言,DNA、RNA和蛋白质的语言。就像训练大型语言模型来分析人类语言一样,我们也可以训练这些模型来分析生物语言。 BioNeMo是Nvidia的Clara Discovery计算框架家族的一员,已经拥有一个称为MegaMolBART的生成化学预处理模型,这是Nvidia和阿斯利康在Cambridge-1超级计算机上合作开发的产品。Nvidia将发布两个蛋白质模型,ESM-1nv用于预测氨基酸序列的性质,ProtT5用于序列生成。未来,研究人员将能够定制LLM模型。 BioNeMo的输出可用于下游任务,如生成新的蛋白质和化学品,或预测结构、功能或反应性质。 基于人工智能的医学成像软件Monai 1.0版周二也正式发布,Nvidia在过去两年里一直与伦敦国王学院合作开发Monai,并计划将其添加到Broad的Terra云中。 Monai是专门为放射学、病理学、外科数据、图像和视频而构建的。成像技术的下一个前沿领域是为微创手术和机器人手术的创新做出贡献。 相关阅读 美参议院议案大幅扩大基因专利范围, 对分子诊断行业重大影响! Magigen T7核酸内切酶I / T7 Endonuclease I Magigen耐高温RNase HII-核糖核酸酶 - rhPCR好帮手! Magigen Bst DNA聚合酶 - 与环介导恒温扩增LAMP技术完美结合 Magigen LAMP试剂盒 - 环介导恒温扩增技术典范 Magigen一步法RT-qPCR预混液试剂盒-轻松搞定反转录qPCR |