分析と機械学習を加速するDataOpsDataOpsの誕生【前編】

データ活用の文脈から、DataOpsが浮上してきた。DataOpsを実践することにより、全てのベースとなるデータの運用体制が確立される。複数の識者が語るDataOpsの考え方とは?

2019年06月13日 08時00分 公開
[Adrian BridgwaterComputer Weekly]

 DevOpsのバリエーションの一つに「DataOps」がある。DataOpsは、新しいデータモデルの提供とデータのテストを素早く実行する方法だ。DataOpsにより、データ主導の戦略を構築する速度が向上する。

 DataOpsはDevOpsと似た方法で使われ、データモデルの構築、テスト、導入の速度を向上させる。その結果、組織は収集した顧客データから価値を引き出す時間を短縮できる。

 ビッグデータツールベンダーのTalendで技術製品マネジャーを務めるティボー・グルデル氏は次のように話す。「DataOpsは機械学習の登場をきっかけとする新しいアプローチだ。データの複雑さが増し、データのガバナンスや所有権に対するニーズの高まりが、DataOps誕生の大きなきっかけになっている。組織は、どのデータに誰がアクセスでき、そのデータを誰が所有しているかを把握する必要がある」

分析能力の向上

会員登録(無料)が必要です

 DataOpsが効果を発揮するのが、中央のデータハブ、リポジトリ、管理ゾーンの作成とキュレーションだ。これらはアプリケーションデータとデータモデルの収集、照合後に分散するよう設計される。DataOpsの考え方の基盤となるのは、データ分析の大半は、メタデータレベルの分析を組織のITスタック全体に広く伝搬できるという考え方だ。これにより、より洗練された分析層を生み出すことが可能になる。

 データ統合ツールベンダーのTamrでデータベース部門のリーダーを務めるアンディ・パルマー氏は次のように語る。「DataOpsでは、データエンジニアリング、データ統合、データ品質、データセキュリティ/プライバシーそれぞれが本質的に結び付いていることを認める。分析速度が上がるデータを素早く提供できるようにして、今までは不可能だった分析を可能にするのがDataOpsだ」

 DataOpsは製品ではない。どちらかといえば方法論で、一つのアプローチだ。そのためDataOpsには理論家もいれば、反対論者も盲信者もいる。DataOpsはバージョン管理を使って継続的にテストを実施するために、データとデータモデルを提供できるようにするものだという意見もある。

 DataOpsの重要な要件は、人間がデータを操作しやすくすることにある。構成自動化ツールベンダーのPuppetでエコシステムエンジニアリング担当バイスプレジデントを務めるナイジェル・ケルステン氏は次のように話す。「DataOpsという動きは、プロセスやツールだけでなく、人間にも注目する。データの収集と分析を自動的かつ極めて大規模に行うには、人間がかつてないほど重要になる」

 DataOpsの実践者、つまりDataOpsエンジニア(DOE)は通常、データ管理フレームワークの構築に注力する。優れたデータガバナンスフレームワークがあれば、データモデルを迅速に進化させることができる。優れたデータガバナンスフレームワークとは、具体的にはITスタック全体から生み出されるデータの重複を正確に排除して、定期的に供給するフレームワークだ。これにより、エンジニアは一貫したテスト環境を使って再現可能なテストを実行できる。このテスト環境には、データとプライバシーの法制度に準拠した方法で顧客データが取り込まれる。

 これが最終的にはデータモデルの開発、テスト、導入に継続的な好循環を生み出す。そう語るのはソフトウェア開発ツールベンダーRogue Wave Softwareでチーフアーキテクトを務めるジャスティン・レオック氏だ。「最新ビジネスは、全てその中核においてドメインデータを転送、分析、配置するコードが必要になる。これがエンタープライズフェデレーション、API間通信、ビッグデータ分析、ストリーム処理、機械学習、データサイエンスなど、全く新しいソフトウェア分野を生み出している。高度な環境ではよくあることだが、こうしたアプリケーションが複雑化、巨大化するとこれを収束させる必要性が生まれる。データのセキュリティ、整合性、アクセシビリティー、編成を調整して一つの考え方にまとめなければならない。その考え方がDataOpsになる」

 重要なのは、データにはライフサイクルがあるのを意識することだ。入念なDataOpsプロセスから生まれるデータモデルはデータライフサイクル全体を認識する。

 新しく、未加工で、構造化されておらず重要性が非常に低いと思われるデータもあれば、現在進行形で使用されていて恐らくミッションクリティカルなデータもある。冗長なデータや廃棄する必要があるデータも必ず存在する。アクセス管理ポリシーやシステムの非互換性により単純にアクセスできないデータもあるだろう。

 ビッグデータ関連ツールベンダーMapR Technologiesのシニアテクノロジストを務めるマイトシュ・シャー氏は次のように語る。「データ管理に包括的でオープンなアプローチを取ればDataOps優先の方法論が実現する。こうすると、データサイエンティスト、開発者、その他データを重視するスタッフのチームが、機械学習でトレーニングしたモデルを運用環境に導入することが可能になる。DataOps開発環境は、職務の能力の枠を超えたアジャイルなコラボレーションや、価値実現の高速化を促す」

後編(Computer Weekly日本語版 6月19日号掲載予定)では、DataOpsを実践する上での課題、DataOpsに有効な技術を解説する。

Copyright © ITmedia, Inc. All Rights Reserved.

新着ホワイトペーパー

事例 アステリア株式会社

ノーコードでアプリ開発とデータ連携を実現、9社の事例に学ぶ現場DXの推進術

工場や倉庫などの現場では、人手不足などにより業務負担の増大が懸念されており、業務のデジタル化と業務プロセスの改善が急務となっている。そこでモバイルアプリの作成からデータ連携までをノーコードで実現できる製品が注目されている。

製品資料 ジオテクノロジーズ株式会社

6つのユースケースから学ぶ、「人流データ」の効果的な活用方法

広告や小売、観光振興、まちづくりなど、さまざまな領域で導入が進む「人流データ」。その活用でどのような施策が可能になり、どのような効果が期待できるのか。人流データ活用の6つのユースケースを紹介する。

製品資料 ジオテクノロジーズ株式会社

基礎から解説:「人流データ」の特徴から活用におけるポイントまで

人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。

事例 アルテリックス・ジャパン合同会社

地図情報によるデータ分析作業を効率化、ゼンリングループ企業はどう実現した?

多くの企業でデータ活用が模索されているが、データ処理の煩雑さや属人化が課題となっている企業は少なくない。そこで注目したいのが、データ分析ツールの活用で課題を一掃した「ゼンリンマーケティングソリューションズ」の取り組みだ。

製品資料 サイオステクノロジー株式会社

ITインフラの自動化を実現、いま注目のクラウド型マネージドサービスの実力

複雑化を続けるITシステムの運用管理は、企業にとって大きな負担だ。そこで負担を軽減するものとして注目したいのが、クラウド上でさまざまな機能を利用できるマネージドサービスだ。本資料では、その詳細を解説する。

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news025.png

「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。

news014.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news046.png

「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。