人工神经网络可以揭示大量基因表达数据中的模式,发现与疾病相关的基因组。由林雪平大学研究人员领导的一项新研究显示了这一点,该研究发表于《自然通讯》。科学家希望这种方法最终能应用于精准医学和个性化治疗。
使用社交媒体时,平台通常会建议您可能想要添加为朋友的人。这个建议是基于你和其他有共同交往的人,说明你们可能认识。以类似的方式,科学家根据不同的蛋白质或基因如何相互作用来绘制生物网络。一项新研究背后的研究人员使用人工智能AI来研究是否有可能使用深度学习来发现生物网络,其中被称为“人工神经网络”的实体由实验数据训练。由于人工神经网络善于学习如何在大量复杂数据中寻找模式,因此被用于图像识别等应用。
物理系博士后Sanjiv Dwivedi说:“我们第一次利用深度学习发现了与疾病相关的基因。这是分析大量生物信息或“大数据”的非常有效的方法。林雪平大学化学与生物学。
科学家们使用了一个大型数据库,其中包含了许多人20,000个基因表达模式的信息。从某种意义上说,研究人员并没有提供人工神经网络信息,即哪些基因表达模式来自疾病患者,哪些来自健康人的信息,因此这些信息是“未分类的”。然后训练人工智能模型来发现基因表达模式。
机器学习的挑战之一是,不可能确切地看到人工神经网络是如何解决任务的。有时候人工智能被称为“黑匣子”——我们只能看到放入盒子的信息和它产生的结果。我们看不到他们之间的台阶。人工神经网络由几个层组成,在这些层中信息被数学处理。该网络包括输入层和输出层,它们传递系统执行的信息处理的结果。在这两层之间是几个隐藏的层,在这些层中进行计算。当科学家训练人工神经网络时,他们想知道是否有可能以某种方式揭开黑匣子的盖子,并了解其工作原理。
“当我们分析神经网络时,我们发现第一个隐藏层很大程度上代表了各种蛋白质之间的相互作用。相比之下,在模型的第三层,我们发现了不同细胞类型的组。这非常有趣,因为我们的网络从未分类的基因表达数据开始,这种类型的生物学相关分组是自动生成的,”IFM高级讲师和研究负责人Mika Gustafsson说。
然后,科学家们研究了他们的基因表达模型是否可以用来确定哪些基因表达模式与疾病有关,哪些与疾病有关。他们证实,该模型发现了与人体生物学机制一致的相关模式。因为模型是用未分类的数据训练的,所以人工神经网络可能已经找到了一个全新的模型。研究人员现在计划从生物学的角度研究这种以前未知的模式是否相关。
“我们认为,这一领域取得进展的关键是理解神经网络。这可以教会我们关于生物环境的新知识,例如许多因素相互作用的疾病。我们认为我们的方法提供的模型更容易推广,可以用于许多不同类型的生物信息。”Mikgustafsson说。
Mika Gustafsson希望与医学研究人员的密切合作将使他能够将研究中开发的方法应用于精准医学。例如,可以确定哪些患者群体应该接受某些类型的药物,或者确定受影响最严重的患者。
这项研究得到了瑞典战略研究基金会(SSF)和瑞典研究委员会的资助。
标签: