検索
特集/連載

「HDDの限界」がゲノム解析で露呈 何が問題だったのか?ゲノム解析とストレージ【第2回】

フランスの医療協力連合は、ゲノム解析に使用するストレージシステムを刷新することにした。従来のストレージシステムには限界があったからだ。何が問題だったのか。

Share
Tweet
LINE
Hatena

 フランスの医療協力連合(GCS:Groupement de Cooperation Sanitaire)である SeqOIA(Sequencing Omics, Information Analysis)が担うのは、フランスにおけるゲノム(遺伝情報)解析の推進だ。SeqOIAは2022年3月、解析に使用するストレージシステムを刷新した。背景には、従来利用していたストレージシステムの“ある限界”があった。

解析で「ストレージクラスタ」が崩壊 その原因とは?

 SeqOIAで情報システム担当ディレクターを務めるアルバン・レルミン氏は、「ゲノムシーケンス(ゲノム解析手法の一つ)で扱うデータは膨大で、複数のゲノム領域に対して解析を実施する必要がある」と説明する。

 2018年、GCS SeqOIAは並列分散ファイルシステム「Lustre」を使った容量400TBのストレージクラスタを導入した。レルミン氏は「この容量は科学技術界では一般的な規模だ」と話す。40ギガビットイーサネット(GbE)のネットワークを経由し、コンピューティングクラスタの2000個のプロセッサコア(演算装置)がストレージにアクセスする仕組みだ。

 SeqOIAは解析に当たり、コンピューティングクラスタへの負荷を段階的に高めていった。1つのゲノム領域の解析から開始し、2つ、3つと増やしていったところ、解析数を4つに増やしたときにシステムが崩壊した。

 システム崩壊の原因は、ストレージクラスタのHDDがI/O(データの入出力)要求に対処できなくなったことだった。LustreはHDDの磁気ヘッドがデータの書き込みを完了するのを待ちつつ、新たに到着したデータを一時保存する。「キャッシュメモリに空き領域がなくなり、書き込みの時間を十分に確保できなくなった結果、書き込みの作業が不完全になって最終的にファイルが壊れてしまった」とレルミン氏は説明する。


 第3回は、SeqOIAが新しいストレージシステムをどのように選定したのかを紹介する。

Computer Weekly発 世界に学ぶIT導入・活用術

米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る