設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

存儲新圖譜:DNA 存儲的邊界與天地

腦極體 2022/2/22 21:06:58 責(zé)編:問舟

數(shù)字信息時代,無論是生產(chǎn)數(shù)據(jù)的各大視頻網(wǎng)站、應(yīng)用平臺等,還是消費者們使用的各類電子設(shè)備,都無不在時時刻刻產(chǎn)生數(shù)據(jù)。

拿自動駕駛舉例來說,平均每輛自動駕駛車每天產(chǎn)生的數(shù)據(jù)量高達 10TB。根據(jù) IDC 機構(gòu)的預(yù)測,2020 年到 2025 年間,全球生成的數(shù)據(jù) (包括新數(shù)據(jù)和副本數(shù)據(jù)) 量預(yù)計復(fù)合年增長率為 23%,到 2025 年達到 180ZB,每天幾乎產(chǎn)生 490EB 的數(shù)據(jù)。

數(shù)據(jù)也成為繼土地、勞動力、資本、技術(shù)之后的第五種生產(chǎn)要素,所有基于數(shù)據(jù)的挖掘和增值都離不開存儲。存儲成為數(shù)據(jù)應(yīng)用的基礎(chǔ),其存儲方式也隨著數(shù)據(jù)量的激增與需求不斷發(fā)生變化。在信息與技術(shù)的不斷發(fā)展演進中,存儲開始面臨不少的挑戰(zhàn)。

存儲設(shè)備、介質(zhì)(磁性材料和半導(dǎo)體材料)隨時間的老化與更新不及時,存儲維護成本高,存儲密度的局限以及能源功耗大等。這些現(xiàn)實的困境驅(qū)動業(yè)界開始尋找更好的替代方案,滿足不斷增高的性能、低功耗、穩(wěn)定性等需求。

DNA 存儲成為基礎(chǔ)的新存儲技術(shù)被作為優(yōu)先的研究方向,以解決數(shù)據(jù)存儲中存在的負荷與問題。我們經(jīng)常會在新聞中看到,考古學(xué)家通過什么 DNA 測定,了解到幾百年、幾千年的信息。據(jù)悉,在合適的條件下,DNA 可以持續(xù)存在數(shù)十萬年,甚至幾百萬年。

不考慮 DNA 的其他存儲特性,僅僅憑借著恒久的保存時間,我們的數(shù)據(jù)也有可能成為和“化石”一樣的存在,這個特性就十分值得我們長久地下功夫去研究與投資。當(dāng)然,DNA 存儲的優(yōu)勢不止如此。

存儲效率的千倍提升

簡單來說,DNA 存儲原理就是將 DNA 分子中的堿基序列與存儲信息編碼一一對應(yīng),將文字、圖片、聲音等信息轉(zhuǎn)化為 DNA 序列進行存儲。這是一門需要多學(xué)科交叉的高精尖技術(shù),涉及生物、計算機、化學(xué)等學(xué)科。

在生物分子中儲存信息,非常復(fù)雜??茖W(xué)家們將目光與精力投入到 DNA 存儲的領(lǐng)域,最根本的原因是看重其極高的存儲密度特性。據(jù)悉,1 克 DNA 即可儲存 215PB 的信息,而硬盤的存儲量不過幾 TB。要知道,1PB=1024TB=1024X1024GB,按照高清電影每部 10GB 算,1 克 DNA 能夠存儲 2.2 億部電影。與此同時 DNA 存儲的維護成本也相較數(shù)據(jù)中心低很多。在能耗方面,1GB 的數(shù)據(jù)硬盤存儲能耗約為 0.04W,而 DNA 存儲的能耗則遠遠小于硬盤存儲能耗,可忽略不計。

在數(shù)據(jù)量日漸激增的信息時代,高存儲密度,低成本維護與低能耗儲存信息的方式,使得科研機構(gòu)與資本都將精力與金錢押碼在這個可能成為未來主流存儲方式。不過雖然有資金與科研的投入,但其進展仍較為緩慢。我們能在公開渠道中看到的成果都是實驗室的最佳成績。例如 2012 年,哈佛大學(xué)研究人員用 DNA 儲存了一本五萬字的圖書。歐洲生物信息研究所在 DNA 儲存了莎士比亞的十四行詩以及馬丁?路德?金的演講《我有一個夢想》的錄音帶。

從上世紀 50 年代提出,DNA 的數(shù)據(jù)存儲研究的進展一直緩慢,沒有什么較為重大的變化。不過在近兩年,DNA 存儲的技術(shù)開始有了一些新的進展。近日微軟研究院對外宣稱,研究出新的分子控制器,使得 DNA 的存儲寫入的速度相較以往提高了 1000 倍。微軟研究院作為 DNA 數(shù)據(jù)存儲的早期入局者,2015 年開始進行相關(guān)研究,直到 2019 年才有研發(fā)進展,到如今速率千倍的升級,還是著實下了一番功夫。

與此同時,國內(nèi)的東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程的劉宏團隊也實現(xiàn)了 DNA 存儲的新突破:立足自主開發(fā)實現(xiàn)了 DNA 合成與測序環(huán)節(jié)的一體化,儀器設(shè)備也實現(xiàn)了小型化。DNA 存儲在國外的技術(shù)路線大都是存儲的合成與測序環(huán)節(jié)分開進行,需要大型的儀器設(shè)備,操作也相對復(fù)雜一些。劉宏團隊將儀器設(shè)備等朝著便攜式改進了許多。

佐治亞理工學(xué)院 (GTRI) 近期也公布了新進展,他們的團隊設(shè)計了一種微芯片,可以顯著提高以 DNA 形式寫入數(shù)據(jù)的速度。該團隊預(yù)計將比當(dāng)前的 DNA 存儲技術(shù)提高 100 倍。

研究機構(gòu)的各種進展也使得嗅覺靈敏的投資機構(gòu)風(fēng)聞而來,中科碳元(深圳)、密碼子(杭州)等創(chuàng)業(yè)公司獲得數(shù)千萬的天使輪融資。

而政策方面,DNA 存儲已經(jīng)成為國家層面部署的重點發(fā)展方向。國家“十四五”規(guī)劃中提到要加快布局量子計算、量子通訊、神經(jīng)芯片、DNA 存儲等前沿技術(shù)。我們可以看到,DNA 存儲在政策、資本與技術(shù)的集中發(fā)力中開始蓄勢待發(fā),不過對于這類高精尖的技術(shù)來說,距離其真正的商業(yè)化落地進程還尚早。

難以突破的結(jié)構(gòu)性障礙

雖然 DNA 存儲具有較為明顯突出的優(yōu)勢,政策、資本等也在全方位的支持,應(yīng)用的前景廣闊,但商業(yè)化的進展仍然十分緩慢。其最大屏障來自于其存儲技術(shù)本身。

為了便于理解 DNA 存儲的面臨的技術(shù)困境,我們簡單介紹一下 DNA 存儲數(shù)據(jù)的過程。主要分為以下五個步驟:編碼 —— 將數(shù)字信息編碼為 DNA 序列;合成 —— 將序列融入實際的 DNA 分子;存儲 —— 將合成的 DNA 片段保存在載體或細胞中;訪問 —— 檢索和選擇性讀取序列信息;解碼 —— 將測定的序列信息轉(zhuǎn)換回數(shù)字信息。

在整個存儲的過程中,編碼與合成是 DNA 存儲中較為關(guān)鍵和困難的環(huán)節(jié)。尤其是 DNA 的合成過程最為艱辛,在堿基序列融入 DNA 分子的過程中,很容易隨機損失掉合成的 DNA。

而編碼是 DNA 存儲中成本與難度較大的環(huán)節(jié),不過隨著 AI、納米微孔等技術(shù)的發(fā)展,編碼環(huán)節(jié)的難度與成本都開始逐漸降低。

DNA 存儲的合成過程使得數(shù)據(jù)輸入和讀取的效率無法提上去,花費的時間較長、成本較高。據(jù)佐治亞理工學(xué)院 2021 年 12 月披露的信息稱,DNA 存儲速度提升到了每天寫入 20GB 數(shù)據(jù),這是目前已知 DNA 存儲最快的寫入速度,而目前固態(tài)硬盤的讀寫速度最快大約為每秒 500MB。

成本方面,2017 年哥倫比亞大學(xué)的實驗顯示,合成 2MB 的 DNA 數(shù)據(jù)需要 7000 美元,而讀取數(shù)據(jù)需要 2000 美元,如果用戶需要以 DNA 形式儲存 1GB 的電影,編碼大約需要花費 358 萬美元,而讀取數(shù)據(jù)還需要 102 萬美元。DNA 存儲技術(shù)的讀寫速度與成本,大大制約了其規(guī)模商業(yè)化的發(fā)展。

另外一個較大的影響因素跟科研人才相關(guān),由于 DNA 存儲技術(shù)領(lǐng)域的強學(xué)科交叉性,必須依靠計算機、生物、化學(xué)、數(shù)學(xué)等多個相關(guān)學(xué)科的協(xié)同,這也就對科研人才的復(fù)合能力水平要求較高。

當(dāng)然除了技術(shù)的進階、人才的需求以外,存儲的便攜式要求也是其較為重要的發(fā)展方向需求。對于這類高精尖技術(shù)的設(shè)備,傳統(tǒng)的設(shè)備都較為笨重,便攜式的優(yōu)化也困難重重??偟膩碚f,DNA 存儲的各個環(huán)節(jié)都有較多的難關(guān)需要克服,DNA 存儲真正意義上的走入商業(yè)市場,進一步發(fā)展成為主流的存儲設(shè)備,還需要長時間的沉淀,才能讓 DNA 存儲技術(shù)有實質(zhì)的進階。

終極存儲:深空與亙古

對于數(shù)據(jù)的存儲來說,多元化、智能化、綠色化是其主要的發(fā)展風(fēng)向標(biāo),尤其是綠色的數(shù)據(jù)中心是主推的發(fā)展方向。

據(jù)研究機構(gòu)預(yù)測,若能源利用效率得不到持續(xù)提高,數(shù)據(jù)存儲用電量到 2030 年可能增長到全球用電總量的 3% 至 13%。數(shù)據(jù)存儲的能源功耗令人擔(dān)憂,降低能耗將成為數(shù)據(jù)中心建設(shè)的首要目標(biāo),存儲設(shè)備作為數(shù)據(jù)中心中最為耗能的設(shè)備,成為革新的排頭兵。

目前改進常見的思路是從存儲設(shè)備的硬件層面進行考量,如架構(gòu)設(shè)計、芯片、硬盤介質(zhì)等。而 DNA 存儲可謂是存儲的終極進化方向。據(jù)悉,麻省理工學(xué)院生物工程教授 MarkBathe 稱,理論上,一個裝滿 DNA 的咖啡杯就可以存儲世界上所有的數(shù)據(jù)。如果未來可以實現(xiàn),DNA 存儲一定會革新存儲領(lǐng)域的格局。

在生物科技領(lǐng)域,近年來因為人工智能技術(shù)的飛速發(fā)展,一些生物科技和人工智能交融的方面,例如蛋白質(zhì)的結(jié)構(gòu)預(yù)測、新藥的研發(fā)、制備都有了質(zhì)的飛躍。DNA 存儲在 AI 技術(shù)的加持下,其編碼的環(huán)節(jié)效率也獲得了極大地提升。未來隨著納米技術(shù)與 AI 技術(shù)的加持,DNA 存儲的技術(shù)也會一步步解除智識的限制禁錮,逐步升級,為存儲領(lǐng)域帶來質(zhì)的飛躍。

當(dāng)然 DNA 存儲除了數(shù)據(jù)的存儲外,也有一些新應(yīng)用方向的可能。比如,可以把個人健康歷史數(shù)據(jù)存儲進 DNA,這種存儲方法與人體更兼容,醫(yī)生可以隨時的調(diào)用參考這些病例數(shù)據(jù),更加精準(zhǔn)全面地進行治療,改善病患的健康情況,甚至促進壽命的增加。

未來人類深空宇航飛行的時候,可以用 DNA 存儲信息,只要制備適宜的保存條件,這些訊息就會留存,向宇宙深處傳播;也可能存在這種情形,新人類在考古的時候,發(fā)掘出我們存儲在 DNA 的彩蛋,DNA 的數(shù)據(jù)展開是一部先輩留存的文明與技術(shù)訊息,訴說著我們的輝煌與經(jīng)驗,感覺有種終極的浪漫。我們最后要留下什么傳承,如何實現(xiàn)這個技術(shù),這個終極的存儲進化值得我們?nèi)パ芯颗c等待。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知