容量10ZB(ゼタバイト)を実現する「DNAストレージ」:実現への道のりと可能性
DNAにデジタルデータを書き込むDNAストレージは、膨大な容量と100万年レベルの保持能力を提供する。その可能性と実現に向けた取り組みを紹介する。
数年以内に、HDDの1000万倍のデータを保存できるようになる。その根拠がDNAストレージだ。DNAストレージは生命の遺伝子コードを使ってデータを保持する。
関連記事
- フラッシュの後継技術は「ヘリウムドライブ」と「DNA」
- PLC(ペンタレベルセル)フラッシュでフラッシュストレージはどう変わる?
- 低価格・大容量のQLCフラッシュに最適のユースケースとは?
- 3D XPoint、Z-NAND、TLC、QLC……ユースケースに最適なSSDとは
- FPGAやGPUを搭載した特化型コンピュテーショナルストレージ
Gartnerのジョン・モンロー氏(バイスプレジデント兼アナリスト)は、現在の科学では靴箱サイズのDNAストレージに10ZB(ゼタバイト)のデータを保持できると言う。「4文字(訳注)の美しいコードは、デジタルデータの保存に理想的な方法になる可能性がある。容量は巨大で、他のアーカイブストレージよりも有望だ」
訳注:DNAを構成する塩基、A(アデニン)、T(チミン)、G(グアニン)、C(シトシン)。
研究者によると、DNAに格納できるデータは現在のストレージ技術をはるかに上回り、推定70万〜100万年保持し続ける可能性があるという。DNAストレージはテープあるいはニアラインやオフラインストレージ用の光学ドライブに取って代わるとモンロー氏は見ている。
DNAは極めて堅牢(けんろう)で、暑さにも寒さにも耐える。情報をエンコードしてDNAに合成したら、その状態を保持するための電力は必要ない。DNAのシークエンシングとデコードにより、DNAの4文字のヌクレオチドコードはコンピュータ処理可能な形式に変換される。
だが、このアイデアは実用化には程遠い。IT業界は実用的なDNAストレージ機器をまだ考え出していない。「人々にはそれがどのように見えるかの辺りで悪戦苦闘している」とモンロー氏は認める。
同氏は、ストレージがキッチンの家電サイズになると考えている。スクールバスのサイズになるかもしれないと考える人もいる。Microsoftとワシントン大学は、共同でDNAをエンコードして取得する実用サイズの機器を既に開発している。とはいえごく初期のプロトタイプで、19Uのラックに単純に落とし込めるシロモノではない。
化学のロマンス
現在のDNAエンコードとシークエンシングの大部分は化学の領域のプロセスだ。Microsoftとワシントン大学によるプロトタイプが、データセンターではなく科学実験室にあるもののように見えるのはそこに理由がある。しかもこのプロセスは今のところ高価だ。
1MBのデータのシークエンシングに約3500ドル(約38万円)かかる。このコストは下がっている。だが、同じ量のデータをフラッシュやHDDに書き込むコストよりもはるかに高価だ。コストが1GB当たり約0.01ドルまで下がらなければDNAストレージが主流になることはないというのがGartnerの見解だ。
酵素DNA合成(EDS)などの代替技術もある。この技術はハーバード大学のWyss Instituteが開発中だ。研究者はこの技術によってDNA合成のコストが数桁下がると想定している。WyssはデータをDNAに合成できる電子機器を開発している。Wyssの研究チームは、この合成プロセスを並列化できればプロセスをスケールアップできると考えている。
DNAに大量のデータを格納できる可能性のある技術は少ない。だが、同研究チームはコストと実用面での障壁は克服できると確信している。
DNAストレージへの関心が高まる背後には、政府や諜報(ちょうほう)機関の存在がある。米国ではODNI(Office of the Director of National Intelligence)に属するIARPA(Intelligence Advanced Research Projects Activity)が分子情報ストレージ(MIST:Molecular Information Storage)プログラムを運用している。このプログラムには、1TBの書き込みと10TBの読み取りを1000ドル(約11万円)で24時間以内に行う任務がある。
ロスアラモス国立研究所には、DNA情報をコンピュータが読み取り可能なコードに変換するシステムに取り組むためにIARPAから資金提供を受ける研究員がいる。そのシステム「ADS Codex」は、DNA合成自体に使われた手法とは無関係にバイナリに戻ってエンコードとデコードを処理する。
ADS Codexは、高度なエラー訂正も提供する。DNAストレージでは4文字のコードそれぞれに状態があるため、0と1しか状態のない従来型ストレージよりも書き込みエラー率が高い。ADS Codexはデータを検証してそのエラーを取り除く。ADS CodexのコードはGitHubで入手できる。
欧州もこの分野に貢献している。スロベニアの研究員らが統括するEUベースのDNA DSプロジェクトは、1つの分子に450PBのデータを格納することを目標とする。これにより、データセンター全体が液体の小びん1本に収まる可能性がある。研究員はDNAストレージの別のメリットも調べている。DNAへの書き込みには時間がかかる。だがほとんどコストが発生せずエネルギーもほとんど必要とせずに数時間で複製できる。
技術提携
研究者がDNAストレージの可能性を証明した今、焦点は実用化に移っている。
2020年、MicrosoftやWestern Digitalなどの業界大手がTwist BioscienceやIlluminaといったバイオテクノロジー企業および研究者と共に「DNA Data Storage Alliance」を結成した。
目標はDNAストレージを中心とするエコシステムを生み出すことだ。Microsoftらはこの分野が学術的、科学的研究からIT用データストレージの応用に移っていると指摘する。最も魅力的なユースケースは、いったん書き込んだらめったに読み込むことのないコールドストレージデータだ。
メディアへの応用も考えられる。2020年、TwistはNetflixのドラマ『Biohackers』の1話分をDNAに余裕を持ってエンコードした。事実上無制限の量のデータを無期限に保存して素早く複製できることは、映画などのクリエイティブ業界での利用に適している可能性がある。
医療データ用ストレージ、法務やコンプライアンスのアーカイブなどにも応用できる可能性がある。
とはいえ、他の問題も幾つか引き起こす。Gartnerのモンロー氏は次のように注意を促す。「WORM(write once read many:1回書いて何度も読む)やWORN(write once read never:いったん書いたら読まない)などのデータは不変であることが重要だ」
研究者がそれを保証できるなら、生命の二重らせんは遠い未来までデータを保存しておく最善の手法として浮上する可能性がある。
Copyright © ITmedia, Inc. All Rights Reserved.