バックアップと混同されがちな“アーカイブ”だが、本来その目的や実現手段はまったく異なるものだ。アーカイブを正しく理解し、使いこなすことで、さまざまなメリットを享受することができる。
「アーカイブ」という言葉自体は非常に広く使われていることもあり、多くの人が通常のデータ保存やバックアップと混同してしまいがちだ。確かにデータ保存やバックアップと密接に関係しているのだが、「アーカイブとは何か?」「どのようにシステムに組み込むのがいいのか?」という点を整理することで、大変効率よくストレージを運用できるようになるのだ。
さらに、今後は内部統制やコンプライアンス(法令順守)を推進する際にアーカイブが大変重要な意味を持つようになることもあり、今回のキーワードとしてあらためて取り上げてみたい。
一般的にアーカイブとは「1つ、もしくは複数のファイルを圧縮して保存すること」ととらえられがちだが、アーカイブのそもそもの由来は「記録保管庫」からきている。例えば、書類などを長期にわたって安全に保管して、必要になった場合に容易に取り出すことができる書庫のようなものだと考えればいい。この場合、書類を取り出す際に「誰がいつ取り出したのか」「いつ返却するのか」「何年間保管するのか」などといった記録を残すよう運用することが重要だ。アーカイブとは、このもともとの意味をITに当てはめた用語であり、「普段使用しているストレージから情報資産を抜き出して、長期保存に適した別のストレージに安全に保管すること」を意味するのである。
ここで、アーカイブの必要性について見直してみたい。今日の情報システムが直面している大きな課題として、「日々増殖し続けるデータをいかにして管理するか」が挙げられる。データは日々増加するのに、同じ方法でバックアップを続けていれば、その作業に必要な時間と保管メディアの容量が増え続けることは明らかである。
また、定期的にフルバックアップを取るのは、変更されていないデータまで何度も保存することになり、大変効率が悪い。そこで、もう変更されることがなくなり、アクセス頻度も低くなったデータをアーカイブすることで、稼働系システムが管理するデータ容量を小さくできる。結果、稼働系システムでのバックアップ対象のデータ量が減り、バックアップ作業に要する時間も短くなる。
では次に、どのようにアーカイブをシステムに取り入れるかを考えてみたい。皆さんは「ILM(情報ライフサイクル管理)」というキーワードをご存じだろうか。これは、情報が生成されてから削除されるまでのライフサイクル全般を管理するための手法である。基本は「すべての情報が同じ価値を持っているわけではない」という考えに基づいている。
例えば、今日届いた緊急のメールは、1年前に届いたメールよりも当然のことながら重要度が高い。このように、情報の価値は時間の経過とともに変化する。従って、価値の異なるデータを押し並べて同じ状態で保存する必要はないのである。
具体的には、ストレージを高性能な「FC(Fibre Channel)ストレージアレイ」、導入の容易な「SATA(Serial ATA) IPストレージ」、改変されないデータの保管に最適化されコストパフォーマンスに優れた「CAS」(Contents Addressed Storage)と呼ばれるストレージ、遠隔地保管に適した「リムーバブルメディア」などに階層化する。そして、情報のライフサイクル(作成・生成、公開、閲覧・配布、保存・アーカイブ、廃棄・削除など)に応じて管理方法をルール化し、階層化されたストレージの各階層にデータを適宜移動・配置していくことで、情報の利便性を損なうことなくコストを削減できる。この考えを実現するためには、アーカイブは決して欠かすことができないのである。
次世代生成AIで優位に立つのはMeta? Google? それともマスク氏のあの会社?
生成AI時代において、データは新たな金と言える。より人間らしい反応ができるようになる...
GoogleからTikTokへ 「検索」の主役が交代する日(無料eBook)
若年層はGoogle検索ではなくTikTokやInstagramを使って商品を探す傾向が強まっているとい...
B2B企業の市場開拓で検討すべきプロセスを定義 デジタルマーケティング研究機構がモデル公開
日本アドバタイザーズ協会 デジタルマーケティング研究機構は、B2B企業が新製品やサービ...