当前位置: 首页 > 科技观察

惊!科学家可利用DNA将数据中心压缩至方糖大小

时间:2023-03-18 20:47:17 科技观察

震惊!科学家可以使用DNA将数据中心压缩到方糖大小Microsoft和华盛顿大学的研究人员展示了旨在使用合成DNA作为数据存档存储介质的解决方案。研究人员指出,如果这项技术足够强大,它可以将像沃尔玛这样的大公司的整个数据存储设施缩小到方糖大小。研究人员在他们的论文中写道:“我们认为,基于DNA的存储解决方案变得可行并基于它们设计和构建系统的时机已经成熟。”研究团队已成功将来自四张图像的数字化数据存储在合成DNA片段中。更重要的是,他们还能够逆转这个过程——也就是说,从更大的DNA库中检索正确的序列,并使用提取的完整字节重建图像。UW计算机科学与工程研究科学家混合DNA样本进行存储。数字化文件存储在每条DNA链中。另一项实验表明,华盛顿大学的“卢旺达法院之声”项目可以对视频文件存档的数据进行编码和检索。该项目共使用了49段采访卢旺达战争罪法庭法官、律师和其他相关人员的视频。“生命创造了DNA,这是一种神奇的分子,可以有效地存储各种遗传信息以及生命系统的工作方式——它非常紧凑,而且非常耐用,”该研究的合著者、计算机科学与工程副教授LuisCeze说。威斯康星大学快报。“我们基本上是在使用DNA来存储数字化数据——图片、视频、文档——这些数据可以保存数百年甚至数千年,”他补充道。DNA数据存储的研究进展迅速。1999年,DNA存储方案只能编码和恢复23字节长的信息。到2013年,英国EMBL欧洲生物信息学研究所的科学家们能够在DNA中存储小马丁路德金的“我有一个梦想”演讲的MP3文件。研究人员在《自然》期刊上发表的一篇论文表明,仅一杯DNA就可以存储至少1亿小时的高清视频数据。根据英国研究人员的说法,存储在DNA链中的数据可以保存数万年。读取DNA很容易,但写入它却很困难。这里有两个挑战:首先,现代协议只能制作短的DNA序列,其次,DNA在写入和读取时容易出错,尤其是当重复相同的DNA字母时。以上三张图片就是本次DNA数据存储实验的对象。微软和华盛顿大学的研究人员表示,他们已经开发出“一种新颖的方案”,可以将长串字符串转换为DNA序列的四个组成部分——分别是腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。缩写为A、G、C和T。为了访问数据,研究人员在DNA序列中编码类似于邮政编码和街道地址的符号。聚合酶链反应或PCR技术——通常用于分子生物学——帮助他们更容易地识别他们正在搜索的邮政编码。使用DNA测序技术,研究人员能够“读取”数据并使用街道地址重新排序,将其恢复为视频、图片或文档。“将1和0转换为A、G、C和T非常重要,因为只有非常精细的实现才能提高存储密度并降低错误率,”共同作者GeorgSeelig解释道。微软和华盛顿大学的研究人员宣布,他们已在ACM编程语言和操作系统架构支持国际会议上展示了他们的研究成果。“DNA具有相当大的发展潜力,”研究人员说,因为它具有极高的存储密度,理论极限比磁带高出八个数量级。磁带技术可以在手掌大小的磁带上存储多达185TB的数据。微软和华盛顿大学的研究人员也证实了合成DNA的长期效果,称其在恶劣环境下可以带来超过500年的半衰期。相比之下,磁带的使用寿命为10到30年,而磁盘驱动器只有三到五年——研究人员指出。研究人员还强调,根据IDC和EMC的一份报告,到2020年,计算机上存储的所有数据——包括档案、视频、图片、企业系统数据和移动设备信息——预计将达到44万亿千兆字节。研究报告。“这相当于2013年数据总量的十倍。虽然不是所有的信息都需要长期存储,但可以肯定的是,数据存储设备的增长速度跟不上数据产生的速度。”然而,在商业用途之前,DNA存储系统不得不克服一系列挑战。首先,DNA合成和测序的效果远非完美,每个核苷酸仍有1%的测序错误率。因此,DNA存储需要设计合适的编码方案,从而带来额外的容错能力。此外,DNA存储不擅长实现随机数据访问,这意味着整体读取延迟远高于写入延迟。目前的进步只能访问大数据块;即使只读取一个字节,也必须对整个DNA库进行排序和解码。科学家们提出了相应的解决方案,即利用聚合酶链反应(简称PCR)对所需数据进行靶向扩增,从而通过靶向测序提高随机存取能力。这样,我们将不再需要对整个DNA文库进行测序。“这是我们从大自然中借用某些东西的绝对例子,”Ceze解释道。“但我们也在利用现有的计算机技术对其进行改进,比如如何纠正记忆错误,让最终结果回归自然。”原标题:科学家可利用DNA将数据中心缩小成方糖