哆啦A梦有一个神奇道具叫做“记忆面包”,只要把内容印在面包上再吃下去,就可以暂时记住这些内容。虽然只能暂时记住,而且还需要大胃王的“肚量”,但哆啦A梦的“记忆面包”绝对是广大学生党临考前梦寐以求的神奇宝物。
那如果说,能够把需要记录的内容直接存放在 DNA 中,听上去是不是比“记忆面包”更有诱惑力呢?
事实上,世界上第一部电影《火车进站》已经被存入 DNA 硬盘里了。
随着信息时代的高速发展,日常生活中能够接触到的数据量早已达到了30年前难以想象的状态,从我们比较熟悉的电子游戏就能瞥见冰山一角。
早年间 FC 所使用的 ROM 卡带,256KB 的游戏已经算是“大体量”水准;到了 PlayStation 时代,存储媒介转为 CD-ROM 光盘,理论上的最大容量上升到 912MB;Xbox 360 时期,DVD 光盘早已非常普及,数据容量以 GB 为单位已经不足为奇;现世代的 Xbox One 和 PS4 都采用了蓝光制式的存储光盘,容量的理论最高值已经突破 100GB。但就算是这样的容量,在面对《荒野大镖客2》这样的游戏时还是需要两张蓝光盘才能解决。
数据存储在游戏行业并非是个开发过程中最大的问题,但是发展速度也已经越来越快,数据量越来越大。可想而知再过几年,整个互联网或者换言之整个人类社会,需要多么庞大的物理存储空间来记录信息。作为普通人的我们似乎升级到 TB 一级的单位还能够满足需求,但对于一些商业组织或者科教文化机构来说,数据存储是一个需要重视的问题。
DNA 硬盘技术,就是其中一种极具潜力的解决方案。
这种想法算是天方夜谭吗?放在100多年前的第二次工业时期来看可能是,但是进入到信息时代后,这就不再是遥不可及的梦想。
要想弄明白 DNA 是如何与数据储存联系起来的,我们需要先了解一下 DNA 本身。
高中时的生物课就学习过有关 DNA 的基础知识,它的学名叫作脱氧核糖核酸(Deoxyribonucleic Acid),是生物体内最为重要的大分子物质之一。通常情况下,DNA 呈现出双螺旋的链式结构,两条彼此配对的 DNA 单链互相螺旋延伸组合在一起。进一步观察的话,可以看到每条单链 DNA 的基本组成单元,脱氧核糖核苷酸。
别看 DNA 的架构可能无比复杂,但是无外乎四种脱氧核糖核苷酸的排列组合。这四种核苷酸的结构很相似,都由三个部分组成,脱氧核糖(下图中灰、红、白球构成的主体)、磷酸基团(下图中黄、红、白球构成的外端)、含氮碱基(下图中蓝、灰、红、白球构成的中间区域)。每个脱氧核糖核苷酸在磷酸基团和脱氧核糖这两部分几乎没有区别,主要是它们的含氮碱基不同。根据含氮碱基的差别,又把这四种脱氧核糖核苷酸称为腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)。含氮碱基两两配对,腺嘌呤 A 与 胸腺嘧啶 T 组合,鸟嘌呤 G 与胞嘧啶 C 组合,这就是两条 DNA 能像拉链一样咬合在一起的主要原因。
简单来说,DNA 的编码性就和 A、T、G、C 这四种核苷酸的排列组合有关。
如果把 DNA 长链比作是一条长长的密码纸带,那么 A、T、G、C 就是打孔器在上面敲出来的密码孔。
我们知道,现代计算机能读懂的基本语言就是0和1,其内部的数据都只能以二元的方式储存。而 DNA 的这种核苷酸排列的编码方式,很容易让人就能联想起计算机的这种二元编码“语言”。科学家们正是依托这种与二进制数据的转换关系来实现数据的存储。假设规定了一套编码方案,让 A、G、C、T 这四种核苷酸分别与 00、01、10、11 这四个数据码对应,这样就可以用 DNA 来记录所有二进制下的数据。简单点说,字母“A”的 ASCII 二进制表示是“01000001”,那它用 DNA 短链来记录就是一条由 GAAG 这四个核苷酸依次排列的 DNA 链。
理论上来讲,只要是计算机能够处理的数据,都可以通过 DNA 储存起来。
DNA 存储技术理解起来不复杂,实际操作起来可没那么轻松。首先要将数据转换成 DNA 序列表,再根据这张序列表人工合成特定的 DNA 链。人工合成 DNA 链从技术上来讲不算困难,麻烦的是需要耗费大量时间来操作。与此同时,想要读取 DNA 链中的信息,也是简单但耗时。DNA 测序技术已经非常成熟,定向分析某个 DNA 片段的碱基序列已经在很多领域有着实际应用。
同时,DNA 数据储存技术也有着无可比拟的优点。DNA 实在是太小了,从物理层面上来看,这种分子级别的储存介质,可以在容量上秒杀目前其他储存设备。据估算,仅仅1克 DNA,就足以容纳2.15亿 GB 的数据,如此庞大的数据容量,其背后的价值是无法估量的。技术上讲,如果不是经常需要读取到的数据,像是文献资料、记录档案,存放在 DNA 中完全是可行的。
说起来,Yaniv Erlich 把哪些文件存入 DNA 硬盘了呢?
很遗憾,虽然 DNA 是生物体中的重要物质,不过我们的大脑肯完全不能读取这样的 DNA 硬盘。即便你的脑袋里以 DNA 链的形式装下了整个大英博物馆的资料,还是得老老实实读书学习,更不要想着遗传给孩子。
评论区
共 103 条评论热门最新