「HDDの限界」がゲノム解析で露呈 何が問題だったのか?ゲノム解析とストレージ【第2回】

フランスの医療協力連合は、ゲノム解析に使用するストレージシステムを刷新することにした。従来のストレージシステムには限界があったからだ。何が問題だったのか。

2023年02月23日 05時00分 公開
[Yann Serra, Antony AdsheadTechTarget]

 フランスの医療協力連合(GCS:Groupement de Cooperation Sanitaire)である SeqOIA(Sequencing Omics, Information Analysis)が担うのは、フランスにおけるゲノム(遺伝情報)解析の推進だ。SeqOIAは2022年3月、解析に使用するストレージシステムを刷新した。背景には、従来利用していたストレージシステムの“ある限界”があった。

解析で「ストレージクラスタ」が崩壊 その原因とは?

 SeqOIAで情報システム担当ディレクターを務めるアルバン・レルミン氏は、「ゲノムシーケンス(ゲノム解析手法の一つ)で扱うデータは膨大で、複数のゲノム領域に対して解析を実施する必要がある」と説明する。

 2018年、GCS SeqOIAは並列分散ファイルシステム「Lustre」を使った容量400TBのストレージクラスタを導入した。レルミン氏は「この容量は科学技術界では一般的な規模だ」と話す。40ギガビットイーサネット(GbE)のネットワークを経由し、コンピューティングクラスタの2000個のプロセッサコア(演算装置)がストレージにアクセスする仕組みだ。

 SeqOIAは解析に当たり、コンピューティングクラスタへの負荷を段階的に高めていった。1つのゲノム領域の解析から開始し、2つ、3つと増やしていったところ、解析数を4つに増やしたときにシステムが崩壊した。

 システム崩壊の原因は、ストレージクラスタのHDDがI/O(データの入出力)要求に対処できなくなったことだった。LustreはHDDの磁気ヘッドがデータの書き込みを完了するのを待ちつつ、新たに到着したデータを一時保存する。「キャッシュメモリに空き領域がなくなり、書き込みの時間を十分に確保できなくなった結果、書き込みの作業が不完全になって最終的にファイルが壊れてしまった」とレルミン氏は説明する。


 第3回は、SeqOIAが新しいストレージシステムをどのように選定したのかを紹介する。

Computer Weekly発 世界に学ぶIT導入・活用術

米国TechTargetが運営する英国Computer Weeklyの豊富な記事の中から、海外企業のIT製品導入事例や業種別のIT活用トレンドを厳選してお届けします。

ITmedia マーケティング新着記事

news130.jpg

“AI美女”を広告に起用しない ユニリーバ「Dove」はなぜそう決めたのか
Unilever傘下の美容ケアブランド「Dove」は、「Real Beauty」の20周年を機に、生成AIツー...

news099.png

有料動画サービス 34歳以下では過半数が利用経験、4割は1日1回以上利用
「ニールセン・ビデオコンテンツ アンド アド レポート 2024」を基に、テレビ画面での動...

news171.png

2024年のGW予算は横ばい 賃上げよりも物価高と円安の影響が勝る?――インテージ調査
インテージが全国の15歳から79歳の男女を対象に実施したゴールデンウイークに関する調査...