中国基因网您的位置:首页 >行业资讯 >

研究人员在DNA上存储计算机操作系统和短片

人类可能很快会产生比硬盘驱动器或磁带可以处理的数据更多的数据,这个问题让科学家转向大自然的信息存储DNA解决方案。在科学的一项新研究中,哥伦比亚大学和纽约基因组中心(NYGC)的一对研究人员表明,设计用于在手机上传输视频的算法可以通过将更多信息压缩到其四个基本核苷酸中来解锁DNA几乎完全的存储潜力。他们证明这项技术也非常可靠。DNA是一种理想的储存介质,因为它非常紧凑,如果保存在阴凉干燥的地方可以持续数十万年,最近从一个43万年前发现的人类祖先的骨骼中恢复DNA就证明了这一点。西班牙的一个洞穴。

研究人员在DNA上存储计算机操作系统和短片

研究报告的共同作者,哥伦比亚工程公司的哥伦比亚工程公司的计算机科学教授Yaniv Erlich说:“DNA不会随着时间的推移而像盒式录音带和CD那样降级,而且不会过时 - 如果确实如此,我们就会遇到更大的问题。”数据科学研究所,以及NYGC的核心成员。

Erlich和他的同事,NYGC的副科学家Dina Zielinski选择了六个文件来编码或写入DNA:一个完整​​的计算机操作系统,一部1895年的法国电影,“在La Ciotat到达火车”,50美元的亚马逊礼物卡片,计算机病毒,先锋牌匾和信息理论家克劳德·香农1948年的一项研究。

他们将文件压缩为主文件,然后将数据拆分为由1和0组成的短二进制代码串。使用称为喷泉码的擦除校正算法,他们将字符串随机打包成所谓的液滴,并将每个液滴中的1和0映射到DNA中的4个核苷酸碱基:A,G,C和T.算法删除了字母已知可以创建错误的组合,并为每个Droplet添加条形码以帮助以后重新组合文件。

总之,他们生成了72,000条DNA链的数字列表,每条长度为200个碱基,并将其以文本形式发送给旧金山DNA合成创业公司Twist Bioscience,专门将数字数据转换为生物数据。两周后,他们收到一个装有DNA分子斑点的小瓶。

为了检索他们的文件,他们使用现代测序技术来读取DNA链,然后使用软件将遗传密码翻译成二进制。研究报告称,他们在没有错误的情况下恢复了文件。(在这个简短的演示中,Erlich在虚拟机上打开他的归档操作系统并玩一个Minesweeper游戏来庆祝。)

他们还证明,通过聚合酶链式反应(PCR)将DNA样本相乘,可以使用编码技术创建几乎无限数量的文件副本,这些副本,甚至副本的副本等都可以无错误地恢复。

最后,研究人员表明,他们的编码策略在一克DNA上包含215PB的数据 - 比哈佛大学的先驱研究人员George Church和欧洲生物信息学研究所的Nick Goldman和Ewan Birney所发表的方法多100倍。“我们相信这是有史以来密度最高的数据存储设备,”Erlich说。

理论上,DNA数据存储的容量限于每个核苷酸的两个二进制数字,但DNA本身的生物学限制以及包含冗余信息以重新组装和读取片段的需要随后将其容量降低至每个核苷酸碱基1.8个二进制数字。

该团队的见解是应用喷泉代码,这是Erlich从研究生院学到的一种技术,使阅读和写作过程更加高效。利用他们的DNA Fountain技术,Erlich和Zielinski在每个碱基核苷酸中平均包含1.6位。这比以前发布的方法至少多60%的数据,接近1.8位的限制。

成本仍然是一个障碍。研究人员花了7,000美元来合成他们用于存档2兆字节数据的DNA,另外花费2000美元来阅读它。虽然DNA测序的价格呈指数下降,但对于DNA合成的需求可能并不相同,加州大学洛杉矶分校的生物化学教授斯科索里说,他没有参与这项研究。“投资者可能不愿意冒很多钱来降低成本,”他说。

但是,如果生成质量较低的分子,DNA合成的价格可以大大降低,并且像DNA Fountain这样的编码策略被用来修复分子错误,Erlich说。“我们可以在计算机上做更多的繁重工作,以减轻时间密集型分子编码的负担,”他说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容