记者从天津大学获悉,该校合成生物学团队创新DNA存储算法,将十幅精选敦煌壁画存入DNA中,通过加速老化实验验证壁画信息在实验室常温下可保存千年,在9.4℃下可保存两万年。该算法支持DNA分子成为世界上最可靠的数据存储介质之一,可以让面临老化破损危机的人类文化遗产信息保存千年万年。
该成果近日发表于《自然·通讯》上。

DNA存储的敦煌壁画
从结绳记事、仓颉造字到磁带、硬盘等现代磁光电存储技术,人类文明的发展与存储技术密切相关。随着科学技术的进步,数据存储方式不断迭代创新。中国科学院院士、天津大学元英进教授带领团队一直致力于下一代存储技术——DNA存储。“据国际数据公司估计,到2025年全球数据总量将达到惊人的175ZB(1ZB≈10的21次方字节)。全世界都在建数据中心,数据中心的能耗是惊人的。DNA存储由于其高存储密度与低能耗处理等特点,被视为一种极具潜力的存储技术,成为应对数据存储增长挑战的新机遇。”元英进院士介绍说。
2021年8月元英进教授团队取得DNA存储的重大突破,从头编码设计合成了一条长度为254886碱基对、专用于数据存储的酵母人工染色体,将两张经典图片和一段视频存储于人造染色体中,利用酵母繁殖实现了数据稳定复制,并用纳米孔测序器件实现了数据快速读出与无错恢复。

DNA存储技术概念图
DNA存储高效低耗,但作为一种链式生物大分子,在体外常温保存时会面临DNA断裂降解等风险,严重影响信息存储的长期可靠性,是亟待解决的关键科学问题。对此,元英进团队设计了基于德布莱英图理论的序列重建算法来解决DNA断裂等问题。该算法结合贪婪路径搜索和循环冗余校验码来实现断裂DNA片段的高效从头组装,从原理上支持了DNA存储的长期可靠性。
结合该序列重建算法(内码)与喷泉码算法(外码),团队设计编码了6.8MB敦煌壁画,合成了承载图片信息的DNA片段21万条。为数据的长期可靠性,团队制备了一个没有任何特殊保护的DNA水溶液样本,并在70℃下加速样本断裂、降解长达十周。处理后的DNA片段80%以上都发生了断裂错误,依靠设计的序列重建算法依然可以准确组装并解码96.4%以上的片段,再通过喷泉码解决少量片段丢失的问题,原始的敦煌壁画图片依然能够完美恢复。根据理论推算,这种程度的高温破坏相当于实验室常温25℃一千年或者9.4℃长达两万年的自然保存。
这是继基于人工合成染色体的酵母体内信息存储模式取得突破后,天津大学合成生物学团队在DNA信息体外存储模式上取得的又一重要突破。

 2022年法考客观题考试开考 逾56.9万名考
2022年法考客观题考试开考 逾56.9万名考 第九批在韩中国人民志愿军烈士遗骸安葬
第九批在韩中国人民志愿军烈士遗骸安葬 全国“脱贫攻坚楷模”李玉院士殷殷叮咛
 全国“脱贫攻坚楷模”李玉院士殷殷叮咛 “黑医”刘翔峰深夜被查,两个细节值得
“黑医”刘翔峰深夜被查,两个细节值得 四川泸定6.8级地震已造成46人遇难
四川泸定6.8级地震已造成46人遇难 李克强出席全国大众创业万众创新活动周
李克强出席全国大众创业万众创新活动周 网球传奇费德勒宣布即将退役
网球传奇费德勒宣布即将退役 找到藏匿在乌云背后的霞光!“ 数字化”
找到藏匿在乌云背后的霞光!“ 数字化” 澳门:张灯结彩迎中秋
 澳门:张灯结彩迎中秋 震区里的中秋节爱心课堂
震区里的中秋节爱心课堂 夕阳西下好“风景”
 夕阳西下好“风景” 最美高铁
最美高铁 山东微山县:俯瞰生态鱼塘美如调色板
山东微山县:俯瞰生态鱼塘美如调色板 “八一”建军节,向军营的他们致敬
“八一”建军节,向军营的他们致敬 2022夏粮增产丰收观察
2022夏粮增产丰收观察 中国美院追忆方增先:浙派人物画当之无
中国美院追忆方增先:浙派人物画当之无 聂荣臻:知识分子的贴心人
聂荣臻:知识分子的贴心人 网球“背篓少年”成名背后……
网球“背篓少年”成名背后…… 一篮鸡蛋送亲人——重庆璧山群众送别云
一篮鸡蛋送亲人——重庆璧山群众送别云