オープンデータの予測分析で遺跡の埋蔵地点を推測:Computer Weekly製品導入ガイド
考古学データを調査している研究者は、オープンデータムーブメントが今後の英国企業にとって何を意味するかを実証してきた。
公共機関が持つ膨大な情報へのアクセスを約束するオープンデータの動きが、土木の分野にまで広がってきた。
建設作業や土木工学プロジェクトでは、地面を掘り起こしてみるまでそこに何が埋まっているのか全く分からない。英国で考古学的に重要なものが発見された場合、プロジェクトが時には何カ月も中断されることがある。この間に研究者が現場を調査して出土品を取り除く。ロンドン市の調査によれば、市内での考古学作業に掛かったコストは、平均で総建設費の1〜3%を占める。ただし地元の当局によれば、3%を超すのは「非常にまれな状況」だという。
数百万ポンド規模(数十億ではないとしても)のプロジェクトでは、住宅や商業ビル、インフラ開発の代償の一部として、建設コストにおけるこの大きな不確実要因を受け入れなければならない。だが、不確実性を狭めることができれば、プロジェクトの計画や予算割り当ての助けになる。オープンデータの研究者が支援できると考えているのは、この部分だ。
考古学支援のための分析
科学技術設備会議(STFC)が2014年6月に主催したオープンイノベーションデイにおいて、オープンデータサービスと技術を手掛けるDemocrataは、特定の場所で遺跡が発掘される可能性は分析によって予測できるかもしれないと提案した。それができれば建設会社は建設に伴うリスクの可能性を把握でき、考古学者がより正確な発掘を行う助けになる。このアイデアが生まれたのは、同イベントで英Archaeology Data Serviceが行ったプレゼンテーションがきっかけだった。
この提案をSTFCが支持して、IBMと共に9人で構成した開発チームを提供し、13万1000コアを搭載した高性能施設であるHartree Centreのスーパーコンピュータにアクセスできるようにした。同システムでは、古文書の自然言語を処理するためにIBMの「Watson」(米国のクイズ番組『Jeopardy!』で勝利した有名な人工知能サービス)の2つのコンポーネントを利用する。モデリングソフトウェアは「SPSS」を、アルゴリズム開発にはR言語を、データ処理には「Hadoop」を使っている。
Democrata共同創業者のジェフ・ロバーツCEOは、土木や建設の大手企業がプロジェクトを中断させるような遺跡に突き当たった場合、コストやプロジェクトの工期に大きな影響を与えかねないと指摘する。
「われわれがやろうとしているのは、予測と可視化を方程式に取り入れて、遺跡がありそうな場所を示すことだ。それがアウトプットだ。この分野には、研究者による非常に小さなレベルでの先行技術があるが、ビッグデータと大規模分析を活用するアプローチはまだ行われていない」とロバーツ氏。
コンセプト実証にはヨーク大学の考古学データと環境省、英国遺産、スコットランド自然遺産、軍需調査局、森林委員会、国家統計局、土地登記所などのデータが使われた。
オープンデータの見方を変える
SASの英国・アイルランド担当最高技術責任者だったDemocrata共同創業者のジョン・モートン氏によれば、最初の課題は異なるソースの扱いだった。
Computer Weekly日本語版 最近のバックナンバー
Computer Weekly日本語版 6月3日号:Windows XPサポート終了後のPCに市場
Computer Weekly日本語版 5月20日号:Windowsから脱却するときが来た?
Computer Weekly日本語版 5月7日号:Nano Server投入に見るMSの思惑
Copyright © ITmedia, Inc. All Rights Reserved.