英国気象庁はどうやって膨大なデータを処理しているのかComputer Weekly製品導入ガイド

前例のない量のデータに対応している英天気予報サービス機関は、「怠慢な」オープンソースツールに支えられている。

2017年10月31日 08時00分 公開
[Computer Weekly]

 真のビッグデータを扱う状況になったとき、どんな課題に直面するかを正確に予想したければ、Met Office(英国気象庁)の事例が参考になる。

Computer Weekly製品導入ガイド無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly製品導入ガイド」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。


 世界最大級のスーパーコンピュータ数台を保有する同庁は、現在およそ60P(ペタ)Bものデータを保持し、1日当たり1P(ペタ)B前後のデータを処理している。同庁のデータアーカイブは1週間に約1.4PBずつ増大し、2020年までには300PBを超す見通しだ。

 「これより少ない量のデータ(たとえ現時点で多くの人に『ビッグ』データと呼ばれている量だったとしても)に対して通用しているデータ管理技術は、そうした領域に踏み込めば通用しなくなる」。最高情報責任者(CIO)のチャールズ・イーウェン氏は言う。「われわれが今直面している課題は、あと5〜20年もすれば、大部分の組織が突き当たるだろう。多くの場所にデータセットを分散させる昔ながらの蓄積交換モデルは、いずれ通用しなくなる」

クラウドのデータ

 膨大な量のデータセットを自前のシステム経由で提供すれば、英国気象庁の帯域幅はたちまち飽和状態になる。そこで最初の課題は、一定量のビッグデータをパブリッククラウドに移転することだった。同庁はそのために、Amazon Web Services(AWS)の「Snowball」サービスを利用した。「AWSから最大100TBの膨大な容量のHDDが郵送されてくる。これに接続し、データを保存して返送すると、向こうで接続してクラウドストレージの『Amazon S3』に転送してくれる」とトムリンソン氏は説明する。

 これまでにクラウドに保存されたデータは80TB前後。英国気象庁が保存している総量に比べればほんの一部にすぎない。だが同庁は、最も多くの顧客の役に立つデータに重点を置いているという。「現時点ではわれわれが2016年に実施した全グローバルモデリングと、2013年〜2016年の全英モデリング全てが含まれる。いずれはこれに加えて、新しいデータを何回にも分けて追加していく」

 多くのビッグデータセットと違って、気象データは多次元で構成され、従来のテーブル構造に当てはまらない。そこでデータは「Zオーダー曲線」を使って保存する。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...