在这个“大数据”时代,人工智能(AI)已经成为科学家的宝贵盟友。例如,机器学习算法正在帮助生物学家理解数量惊人的控制基因功能的分子信号。然而,随着分析更多数据的新算法的发展,它们也变得更加复杂和难以解释。定量生物学家贾斯汀b金内和阿马尔塔林开发了设计高级机器学习算法的策略,这使得生物学家更容易理解。
该算法是一种人工神经网络。受大脑中神经元连接和分支方式的启发,人工神经网络是高级机器学习的计算基础。虽然它有人工神经网络的名字,但并不是专门用来研究大脑的。
像塔林和金内这样的生物学家都使用人工神经网络来分析实验方法中的数据。这种方法被称为“MPRA”,用于研究脱氧核糖核酸。利用这些数据,定量生物学家可以制造人工神经网络来预测哪些分子在一个称为基因调控的过程中控制特定的基因。
细胞并不总是需要所有的蛋白质。相反,他们依靠复杂的分子机制来根据需要打开或关闭产生蛋白质的基因。当这些规定失效时,疾病通常会发生。
金内说:“这种机械知识——理解相似的基因调控是如何工作的——通常是能够开发疾病的分子疗法和不能这样做的区别。”
不幸的是,基于MPRA数据的标准人工神经网络的建模方式与生命科学中科学家提问的方式截然不同。这种错位意味着生物学家很难解释基因调控是如何发生的。
现在,金内和塔林开发了一种新的方法来弥合计算工具和生物学家想法之间的差距。他们创建了一个自定义的人工神经网络,从数学上反映了生物学中基因和控制基因的分子的共同概念。这样,这对夫妇实际上迫使他们的机器学习算法以生物学家可以理解的方式处理数据。
金内解释说,这些努力强调了如何为生命科学优化现代工业人工智能技术。金内的实验室已经验证了这种定制人工神经网络的新策略,并将其应用于研究各种生物系统,包括与人类疾病相关的关键基因回路。
标签: