「HDDの限界」がゲノム解析で露呈 何が問題だったのか?ゲノム解析とストレージ【第2回】

フランスの医療協力連合は、ゲノム解析に使用するストレージシステムを刷新することにした。従来のストレージシステムには限界があったからだ。何が問題だったのか。

2023年02月23日 05時00分 公開
[Yann Serra, Antony AdsheadTechTarget]

 フランスの医療協力連合(GCS:Groupement de Cooperation Sanitaire)である SeqOIA(Sequencing Omics, Information Analysis)が担うのは、フランスにおけるゲノム(遺伝情報)解析の推進だ。SeqOIAは2022年3月、解析に使用するストレージシステムを刷新した。背景には、従来利用していたストレージシステムの“ある限界”があった。

解析で「ストレージクラスタ」が崩壊 その原因とは?

 SeqOIAで情報システム担当ディレクターを務めるアルバン・レルミン氏は、「ゲノムシーケンス(ゲノム解析手法の一つ)で扱うデータは膨大で、複数のゲノム領域に対して解析を実施する必要がある」と説明する。

 2018年、GCS SeqOIAは並列分散ファイルシステム「Lustre」を使った容量400TBのストレージクラスタを導入した。レルミン氏は「この容量は科学技術界では一般的な規模だ」と話す。40ギガビットイーサネット(GbE)のネットワークを経由し、コンピューティングクラスタの2000個のプロセッサコア(演算装置)がストレージにアクセスする仕組みだ。

 SeqOIAは解析に当たり、コンピューティングクラスタへの負荷を段階的に高めていった。1つのゲノム領域の解析から開始し、2つ、3つと増やしていったところ、解析数を4つに増やしたときにシステムが崩壊した。

 システム崩壊の原因は、ストレージクラスタのHDDがI/O(データの入出力)要求に対処できなくなったことだった。LustreはHDDの磁気ヘッドがデータの書き込みを完了するのを待ちつつ、新たに到着したデータを一時保存する。「キャッシュメモリに空き領域がなくなり、書き込みの時間を十分に確保できなくなった結果、書き込みの作業が不完全になって最終的にファイルが壊れてしまった」とレルミン氏は説明する。


 第3回は、SeqOIAが新しいストレージシステムをどのように選定したのかを紹介する。

Computer Weekly発 世界に学ぶIT導入・活用術

米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

ITmedia マーケティング新着記事

news135.png

インターネットの利用環境、女性の66%は「スマホのみ」――LINEヤフー調査
LINEヤフーが実施した2023年下期のインターネット利用環境に関する調査結果です。

news108.png

LINEで求職者に合った採用情報を配信 No Companyが「チャットボット for 採用マーケティング」を提供開始
就活生が身近に利用しているLINEを通して手軽に自社の採用情報を受け取れる環境を作れる。

news102.jpg

GoogleがIABのプライバシーサンドボックス批判に猛反論 完全論破へ42ページのレポートを公開
Googleは、米インタラクティブ広告協会から寄せられた批判について「多くの誤解と不正確...