OpenStackで6万5000コアのプライベートクラウドを構築し、さらに演算能力の不足をクラウドフェデレーションで補う仕組みを開発したCERN。「足りないときだけ外部調達」の発想は今後さらに広まるだろう。
スイスに本部を構える欧州原子核研究機構(CERN)は、大型ハドロン衝突型加速器(LHC)を利用した実験を行い、宇宙の構成要素を解明することを目的とする組織である。CERNは現在、ITシステムの拡張、ビッグデータの処理、演算処理で高レベルのスループットを達成するニーズの全てに対して、それぞれ課題の規模は異なるが、同時に対処しなければならない状況にある。
本記事は、プレミアムコンテンツ「Computer Weekly日本語版 8月20日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。
なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。
課題の1つは、LHCの測定器だ。CERNに設置されているこの測定器は、稼働すると毎秒1Pバイト(1億Gバイト)のデータを生成する。しかも、2015年に予定されているLHCの次回の稼働時には、データ量はさらに増える可能性が高い。例えば現在検討中のFuture Circular Collider(FCC)など、LHCの後継となる衝突型加速器ではなおさらだと、CERNのインフラストラクチャマネジャーであるティム・ベル氏は語る。
「LHCは現在、年間25Pバイトを超えるデータを生成している。2020年までに、われわれが得るデータ量は年間0.5E(エクサ)バイトに達する見通しだ」とベル氏は話す。0.5Eバイトは、何と5000億Gバイトに相当する桁外れな数字だ。
CERNにとっての主な課題の1つは、これほどまでに膨大な量のデータを分析および共有し、同機関が所有する装置のシミュレーションを正確かつ効率よく実施することだ。コンピューティングは、この機関で重要な役割を果たしている。ITチームは、世界最大の素粒子物理学研究室で働く科学者や研究者に対して、同機関の大規模コンピュータインフラを、管理が容易で、費用対効果が高く、セキュリティの強固なものとして提供しようと努めている。
「当機関のコンピュータインフラのパフォーマンスは、さほど高い数値ではない。どちらかといえばスループットを高めることを重視している」とベル氏は語る。「実行しなければならない演算タスクは実に多いが、各タスクは全て個別に実行しなければならない」
CERNが現在保有する資産は、100Pバイトのデータアーカイブ、1万1000台のサーバ、7万5000個のHDDまたはテープだ。同機関は総額10億スイスフラン(6億5000万ポンド)の予算を投じて、素粒子物理学の実験を進められる演算能力を1万人の科学者に提供している。
ただし、データ管理は同機関が直面している課題のうちの1つにすぎない。ITチームにとっては、ITリソースをオンデマンドで提供するという新たな課題も見えてきたからだ。「追加の費用を掛けずにシステムをスケールアップするにはどうすればいいのか、チーム内で議論を繰り返していた」とベル氏は語る。
同機関は2年前に、プライベートクラウド上で演算処理を行うためのオープンソースプラットフォームであるOpenStackを選択してITリソースを拡張した。演算リソースを大幅に拡大して、宇宙の謎を解き明かすためにこのインフラを利用する世界中の科学者をサポートするのが目的だ。
CERNがOpenStackの利用を始めた当時、使用したAPIは5番目のバージョン「Essex」だった。現在CERNが利用しているOpenStackは8番目にして最新バージョンの「Havana」をベースとしている。このバージョンはパブリッククラウド、プライベートクラウド、ハイブリッドクラウド環境のいずれにも対応するように設計されている。またHavanaには、大規模なソフトウェア開発、データ管理、アプリケーションインフラストラクチャを支援する400弱の新機能が追加されている。
「(Havanaへの)アップグレードは2014年2月に完了したが、実施の合意に至るまで、何度もデューデリジェンス(適正評価)とプランニングが必要だった。ただしアップグレード作業自体は6時間で完了して、作業中のシステム停止時間も長くはかからなかった」とベル氏は語る。
LHCなどの加速器が稼働していないときは、ITリソースを遊ばせることになる。そこでITチームは、加速器が停止するタイミングでアップグレードを実行した。さらに、OpenStackのアップグレードの一部始終をブログに投稿した。
OpenStackコミュニティー運営団体にも幹部として加わっているベル氏は、次のように語る。「OpenStackのようなオープンソーステクノロジーに大きな価値があることは疑う余地がない。オープンソーステクノロジーは、コミュニティーの貢献によって技術の発展が続いている。また、コミュニティー内の他のユーザーの実践例を参考にすることで、われわれ自身もシステムの大幅な拡張などの課題に迅速に対処できるようになる」
ところが、CERNが構築したOpenStackベースのプライベートクラウドは、同機関で必要とされる莫大な演算パワーを十分カバーしているとはいえなかった。「当機関のプライベートクラウドにはかなりの負荷が掛かっていた。また、クラウドベースの演算インフラに対する(期待通りの性能を求める)プレッシャーも相当なものだった」とベル氏は語る。
本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。
■Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 8月6日号:RAIDはもういらない
Computer Weekly日本語版 7月16日号:Windows 8をめぐる中国 vs. Microsoft
Computer Weekly日本語版 7月2日号:クラウドの専門家による4つの警告
Copyright © ITmedia, Inc. All Rights Reserved.
ロッテはシステムのAWS移行を進める中、DX推進の鍵は内製化比率の向上にあると考え、内製化の強化に踏み切った。本資料では、内製化の実現に向け、支援を受けながら、初めて取り組んだAWS開発と人材育成を成功させた事例を紹介する。
B2B取引の決済手段として多くの企業が採用している請求書払い(後払い)だが、入金遅延や未払いが発生するリスクもある。そこで、これらのリスクと業務負担を解消する決済代行サービスが登場した。本資料で詳しく紹介する。
SaaSの決済手段ではクレジットカード払いを設定するのが一般的だが、B2B取引においてはそれだけだと新規顧客を取りこぼすこともある。Chatworkやココナラなどの事例を交え、決済手段を多様化する重要性と、その実践方法を解説する。
ハイブリッドクラウドやエッジコンピューティングの普及に伴い、企業が管理すべきIT資源が急増している。こうした中で注目を集めるのが、あるクラウドサービスだ。分散環境における課題とその解決策について、導入事例とともに解説する。
AI活用やデータドリブン経営が加速する一方で、レガシーインフラが問題になるケースが増えている。特に複数の世代にわたってIT資産が混在しているインフラ環境では、運用負荷やコストが増大してしまう。この問題をどう解消すればよいのか。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...