中国基因网您的位置:首页 >国外研究 >

利用这台机器学习黑客DNA计算得到了提升

作为生活的主要代码,DNA可以做很多事情。遗产。基因疗法。擦掉整个物种。解决逻辑问题。认识到你粗鄙的笔迹。

利用这台机器学习黑客DNA计算得到了提升

等等,什么?

在自然界发表的一项精彩研究中,加州理工学院的一个团队巧妙地攻击了DNA的特性,实质上将其转变为分子人工神经网络。

当受到经典机器学习任务的挑战 - 识别手写数字 - DNA计算机可以灵巧地识别从1到9的字符。该机制依赖于一种被称为“消灭器”的特殊类型的DNA分子(令人敬畏的名字!),它从生化反应的汤中选择获胜的反应。

但这不仅仅是草率的笔迹。该研究代表了DNA计算新生领域的巨大飞跃,使系统能够使用相同数量的分子识别更复杂的模式。随着更多的调整,分子神经网络可以形成过去学习的“记忆”,允许它执行不同的任务 - 例如,在医学诊断中。

“常见的医疗诊断检测的几个生物分子的存在,例如胆固醇或血糖,”说研究报告的作者凯文樱桃。“使用像我们这样更复杂的生物分子电路,诊断测试有一天可能包含数百种生物分子,分析和响应直接在分子环境中进行。”

神经网络

对于资深作者Lulu Qian博士来说,将DNA转化为生物计算机的想法来自大自然。

“在基于神经元的大脑进化之前,复杂的生物分子回路为个体细胞提供了生存所需的”智能行为“,”钱在一篇2011年的学术论文中写道,该论文描述了第一个基于DNA的人工神经网络(ANNs)系统。她说,通过建立在DNA计算的丰富性上,可以用自主的类似大脑的行为对这些分子进行编程。

钱先生对以分子形式重构人工神经网络的想法特别感兴趣。深度学习的基础,一种机器学习,风靡世界,人工神经网络是学习算法的灵感来自人类的大脑。类似于它们的生物学灵感,人工神经网络包含通过各种优势相互连接的“神经元”层 - 科学家称之为“权重”。权重取决于某个特征是否可能存在于它试图识别的模式中。

人工神经网络非常珍贵,因为它们特别灵活:例如,在数字识别中,训练有素的人工神经网络可以概括手写数字的要点 - 比如7,并使用该记忆来识别新的潜在“七人制”,即使是手写是非常糟糕的。

钱先生首次尝试制作基于DNA的人工神经网络是一项谨慎的成功。它只能识别非常简单的模式,但系统有可能扩展到执行更复杂的计算机视觉类任务。

这是钱和樱桃在新研究中要做的事情。

试管计算机

因为DNA计算机确实存在于试管内,所以第一个问题是如何将图像转换成分子。

该团队首先将每个手写数字转换为10×10像素的网格。然后使用具有大约30个字母A,T,C和G的短DNA序列表示每个像素。这样,每个单个数字具有其自己的DNA分子“混合”,其可以一起添加到试管中。

由于股线在试管内自由浮动,而不是很好地与网格对齐,因此团队巧妙地使用每条线的浓度来表示其在原始图像网格上的位置。

与输入图像类似,计算机本身也是由DNA构成的。该团队首先使用标准计算机来训练任务中的人工神经网络,从而产生一堆“权重矩阵”,每个都代表一个特定的数字。

Cherry解释说:“我们想出一些我们希望网络识别的模式,并使用普通计算机找到一组合适的权重”。

然后将这些权重集转换成DNA链的特定混合物以构建用于识别特定数字的网络。

“DNA [重量]分子存储着我们想要识别的模式,”基本上充当了计算机的记忆,Cherry解释说。例如,一组分子可以检测到七个,而另一组分子可以检测到六个。

为了开始计算,研究小组将代表输入图像的DNA分子与DNA计算机一起添加到同一个试管中。然后神奇的事情发生了:图像分子与“重量”分子反应 - 与Ts结合,Cs标记为Gs - 最终导致第三束输出DNA发出荧光。

为什么这种DNA反应可以作为一种计算方式?请记住:如果一个像素经常出现在一个数字内,那么代表该像素的DNA链将在试管中的浓度更高。如果在输入模式中也存在相同的像素,则结果是大量的反应,并且相应地,更多的发光在黑暗中输出分子。

相反,如果像素发生的可能性很小,那么化学反应也会受到影响。

通过这种方式,通过统计每个像素(即每种类型的DNA链)的反应,团队了解输入图像与DNA计算机中存储的数字的相似程度。这里的诀窍是一种叫做“赢家通吃”的策略.DNA“湮没者”分子被释放到试管中,在那里它被标记到不同的输出分子上,并且在此过程中,它们变成不能发出荧光的非活性斑点。

“灭绝者迅速吃掉所有竞争对手的分子,直到只有一个竞争对手的物种仍然存在,”Cherry解释道。然后胜利者发出明亮的光芒,表明神经网络的决定:例如,输入是六,而不是七。

在第一次测试中,该团队将大约36个手写的数字 - 用两台DNA计算机重新编码到DNA中 - 放入同一个试管中。一台计算机代表六号,另外七台代表。分子计算机正确识别了所有这些。在数字模拟中,该团队进一步表明,该系统可以对超过14,000个手写的六和七人进行分类,准确度达到98% - 即使这些数字看起来与该数字的内存有很大不同。

“一些在视觉上更具挑战性的模式对于DNA电路来说并不一定更困难,”该团队表示。

接下来,他们通过为每个数字提供不同的输出颜色组合来进一步加强系统:绿色和黄色为五,绿色和红色为九。这允许“智能汤”在单个反应中同时检测两个数字。

向前迈进

该团队的DNA神经网络不是第一台DNA计算机,但它肯定是最复杂的。

到目前为止,最流行的方法是使用称为DNA链置换的技术构建逻辑门-AND,OR,NOT等。在这里,输入DNA与DNA逻辑门结合,推出另一条可以作为输出读取的DNA链。

虽然许多这样的门可以组合成复杂的电路,但是构建分子计算机是一种繁琐而低效的方法。例如,为了匹配团队的DNA ANN的性能,基于逻辑门的DNA计算机将需要超过23种不同的门,使得化学反应更容易出错。

更重要的是,同一组分子人工神经网络可用于计算不同的图像识别任务,而基于逻辑门的DNA计算机需要针对每个问题的特殊分子矩阵。

展望未来,Cherry希望有一天能够创建一台独立学习的DNA计算机,放弃了对普通计算机生成权重矩阵的需求。“这是我正在努力的事情,”他说。

“我们的系统为在自主分子系统中嵌入学习提供了直接的可能性,使他们能够'在自主操作期间根据环境信号调整其功能',”该团队说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容