Googleが提供しているビッグデータ分析サービスは多彩だ。中には「Google検索」「Googleアナリティクス」などの裏側で稼働するシステムを基にしたサービスもある。5つの主要サービスをピックアップして説明する。
Googleは検索エンジン「Google検索」でのノウハウを生かし、クラウドサービス群「Google Cloud Platform」(GCP)の中でビッグデータ分析サービスを提供している。
前後編にわたって、Googleの主要なビッグデータ分析サービス10個を紹介する本連載。10個中5個のサービスを紹介した前編「『BigQuery』だけではない GCPのビッグデータ分析サービスの違いは?」に引き続き、残り5個のサービスについて、具体的な機能と特徴を説明する。
「Cloud Composer」はクラウドとオンプレミス環境にまたがるワークフローの作成、管理、監視を可能にするオーケストレーションサービスだ。オープンソースのワークフロー作成・管理ソフトウェア「Apache Airflow」を基に構築されている。このサービスは、Googleの他のビッグデータ分析サービスや、サードパーティー製ツールとの連携も可能だ。
メタデータ管理サービスの「Data Catalog」は、GCP環境にあるメタデータを取り込み、検索と管理、保護ができるデータカタログを構築する。管理対象となるメタデータは、データの場所や構造といった、データへのアクセスに必要な情報を記載した「テクニカルメタデータ」と、データの意味を理解するのに必要な情報を記載した「ビジネスメタデータ」だ。
Data Catalogはアクセス制御機能を備える。Googleの機密データ保護サービス「Cloud Data Loss Prevention」(Cloud DLP)と合わせて利用することで、機密データを管理できる。
「Cloud Data Transfer」は、オンプレミス、クラウドを問わず、大小さまざまな規模のデータをオブジェクトストレージサービスの「Google Cloud Storage」やデータウェアハウスサービスの「BigQuery」、分散処理サービス「Cloud Dataproc」に移行する。選択可能なデータ転送手段は、以下の4つだ。
転送時間は、データ量、ネットワーク接続、データの移動方法によって異なる。
Copyright © ITmedia, Inc. All Rights Reserved.
AIの普及や発展によって、企業が保有するデータの量は膨れ上がっている。その約90%は非構造化データだ。そのため、AIと分析のワークロードをより有効なものにする上では、非構造化データの扱いが非常に重要となる。
Excelやスプレッドシートを用いて社内のデータを管理している企業は少なくない。しかし、それにより、データの閲覧や管理、共有などにおいて問題が発生している企業も多い。データ活用を加速するためには、どのような体制が有効なのか。
ビジネスの成果を挙げるためにデータ活用の取り組みが進む一方、分散するデータが足かせとなり、データの価値を引き出せていないケースも多い。その解決策となるAI対応のデータ基盤を構築する方法について解説する。
広告や小売、観光振興、まちづくりなど、さまざまな領域で導入が進む「人流データ」。その活用でどのような施策が可能になり、どのような効果が期待できるのか。人流データ活用の6つのユースケースを紹介する。
人の動きを可視化した「人流データ」。屋外広告の効果測定や出店計画、まちづくりや観光振興など幅広い領域で活用されている。その特徴を確認しながら、価値のある分析・活用につなげるためのポイントを解説する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。