2019年06月13日 08時00分 公開
特集/連載

DataOpsの誕生【前編】分析と機械学習を加速するDataOps

データ活用の文脈から、DataOpsが浮上してきた。DataOpsを実践することにより、全てのベースとなるデータの運用体制が確立される。複数の識者が語るDataOpsの考え方とは?

[Adrian Bridgwater,Computer Weekly]

 DevOpsのバリエーションの一つに「DataOps」がある。DataOpsは、新しいデータモデルの提供とデータのテストを素早く実行する方法だ。DataOpsにより、データ主導の戦略を構築する速度が向上する。

Computer Weekly日本語版 6月5日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 6月5日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 DataOpsはDevOpsと似た方法で使われ、データモデルの構築、テスト、導入の速度を向上させる。その結果、組織は収集した顧客データから価値を引き出す時間を短縮できる。

 ビッグデータツールベンダーのTalendで技術製品マネジャーを務めるティボー・グルデル氏は次のように話す。「DataOpsは機械学習の登場をきっかけとする新しいアプローチだ。データの複雑さが増し、データのガバナンスや所有権に対するニーズの高まりが、DataOps誕生の大きなきっかけになっている。組織は、どのデータに誰がアクセスでき、そのデータを誰が所有しているかを把握する必要がある」

分析能力の向上

 DataOpsが効果を発揮するのが、中央のデータハブ、リポジトリ、管理ゾーンの作成とキュレーションだ。これらはアプリケーションデータとデータモデルの収集、照合後に分散するよう設計される。DataOpsの考え方の基盤となるのは、データ分析の大半は、メタデータレベルの分析を組織のITスタック全体に広く伝搬できるという考え方だ。これにより、より洗練された分析層を生み出すことが可能になる。

 データ統合ツールベンダーのTamrでデータベース部門のリーダーを務めるアンディ・パルマー氏は次のように語る。「DataOpsでは、データエンジニアリング、データ統合、データ品質、データセキュリティ/プライバシーそれぞれが本質的に結び付いていることを認める。分析速度が上がるデータを素早く提供できるようにして、今までは不可能だった分析を可能にするのがDataOpsだ」

 DataOpsは製品ではない。どちらかといえば方法論で、一つのアプローチだ。そのためDataOpsには理論家もいれば、反対論者も盲信者もいる。DataOpsはバージョン管理を使って継続的にテストを実施するために、データとデータモデルを提供できるようにするものだという意見もある。

 DataOpsの重要な要件は、人間がデータを操作しやすくすることにある。構成自動化ツールベンダーのPuppetでエコシステムエンジニアリング担当バイスプレジデントを務めるナイジェル・ケルステン氏は次のように話す。

ITmedia マーケティング新着記事

news089.jpg

「平成ジャンプ世代」の男女共に約8割は結婚意向あり――Pairsエンゲージ パーソナル婚活研究所調べ
「平成ジャンプ世代」とは、未婚のまま平成の30年間を飛び越えて令和を迎えた昭和生まれ...

news046.jpg

F1層(20〜34歳女性)に聞く「タピオカドリンクを飲む理由」――ミュゼマーケティング調べ
タピオカドリンクを購入する理由などを、20〜34歳女性1764人にリサーチしています。

news043.jpg

「GAFA」を脅威と言う前に正しく理解する――オプトホールディング鉢嶺 登氏インタビュー
『GAFAに克つデジタルシフト』(日本経済新聞出版社)を上梓したオプトホールディング代...