「ビッグデータ」丸分かり 比較、事例、解説記事を紹介

ユーザー企業のIT担当者を対象に、IT製品/サービスの導入・購買に役立つ情報を提供する無料の会員制メディア「TechTargetジャパン」。このコンテンツでは、ビッグデータに関する事例、比較、解説の記事を紹介します。製品/サービス選定の参考にご覧ください(リンク先のページはPR記事を含みます)。

ビッグデータとは何か

 ビッグデータは、大量かつ多様なデータと、そのデータを高速で収集、処理、分析するための技術を指す。ビッグデータには構造化データと半構造化データ、非構造化データが含まれ、これらは機械学習や予測モデル、その他の高度なデータ分析アプリケーションで使用される。

ビッグデータ関連の比較

「プロプライエタリ」と「OSS」のRDBMS、読者が考えるそれぞれの魅力とは?

RDBMSは組織のデータ管理を担う。さまざまなRDBMS製品が存在する中、組織はどのような観点でRDBMS製品を採用したり、置換したりしているのか。読者調査の結果から探る。

(2021/9/30)

「Googleマップ」「Gmail」を支えるシステムも GCPのビッグデータ分析サービス

Googleが提供しているビッグデータ分析サービスは多彩だ。中には「Google検索」「Googleアナリティクス」などの裏側で稼働するシステムを基にしたサービスもある。5つの主要サービスをピックアップして説明する。

(2019/7/31)

ビッグデータで輝くITスキルは、舞台がクラウドに移るとどう変わるのか?

企業は、ビッグデータの処理基盤をクラウドに移している。この動きは、それまでのITスキルを覆すことはないが、管理者や開発チームには幾つか変化が求められるだろう。

(2018/3/12)

注目の比較記事一覧へ

ビッグデータ関連の事例

IT人材不足よりもまず「女子生徒の関心」が大事なのはなぜ?

AWSはIT人材を育成するための幾つかの施策に取り組んでいる。同社が奨学金制度や、女子生徒向けの教育プログラムを提供する狙いとは。

(2023/9/30)

Porscheの“速さ”もPlayStationゲームの“安さ”も「Kafka」のおかげだった?

連続的に発生し続けるデータを処理するミドルウェア「Kafka」のユーザー企業には、PorscheやSony Interactive Entertainmentといった著名企業もある。彼らはKafkaをどう活用し、競争力の向上を図っているのか。

(2021/7/21)

高級自動車メーカーBMWが「Kafka」で製造ラインの安定性を向上 その方法とは?

BMWは、連続的に発生し続けるデータを処理するミドルウェア「Kafka」を自動車製造に役立てているという。どのように活用しているのか。同社責任者の話を基にコンパクトに紹介する。

(2021/7/14)

注目の事例記事一覧へ

ビッグデータ関連の製品解説

P RGPUサーバの検討を重ね、たどり着いた結論は? 東京大学発ベンチャー社長に聞く

ハイスペックなGPUサーバは高額であり、サーバ管理も専門的なノウハウが必要なため、導入のハードルが非常に高い。中小企業におけるそんな悩みを解消し、ビジネスを強力に後押しするGPUクラウドサービスとは。

(2022/8/2)

OSSの改ざん防止データベース「immudb」、試す価値あり

改ざん防止に主眼を置いたデータベースがOSSで登場した。オンラインデモやDocker、Kubernetesインストールもサポートしており、取りあえず試してみることができる。百聞は一見にしかずだ。

(2022/2/3)

あらゆるデータを一元的に分析できる「オープンデータレイク分析」

何の前処理も行っていないデータレイクから必要なデータだけを取り出してデータウェアハウスにインポートして……と、データ分析には手間が掛かる。オープンデータレイク分析は煩雑な部分をまとめて処理する。

(2021/3/12)

注目の製品解説記事一覧へ

ビッグデータ関連の技術解説

「ビッグデータ活用」を成功させる“実践のポイント”は?

ビジネスの意思決定にビッグデータを活用する際、その取り組みを成功させるポイントは幾つかある。どのような点から着手し、どのような点に気を付ければよいのか。課題とポイントを紹介する。

(2024/5/20)

医療データ基盤に「もう失敗しない」と意気込むNHS 何が問題だったのか?

NHS Englandは新しい医療データ基盤の構築計画を発表した。「公共の信頼を獲得できるよう、同じ失敗は繰り返さない」という意気込みの背景には、どのような出来事があったのか。

(2023/3/28)

「Apache Kafka」で実現したマルチクラウド対応のシステム連携

システム連携の課題は、相手のシステムにどう対応させるかにある。個別対応では開発リソースとコストがかかり過ぎる。OSSの分散イベントストリーミング基盤である「Apache Kafka」がそうした課題を解決する。

(2021/10/13)

注目の技術解説記事一覧へ

ビッグデータ関連の運用&Tips

英国政府“データ分析に3000億円投資”を後押しした「国家データ戦略」の4本柱

データ分析分野における製品/サービスの調達を加速させる英国政府。どのような観点から、何を重視して製品/サービスの導入を進めようとしているのか。

(2023/1/23)

Salesforceも「データの倫理的活用」に本腰 原則を現場に落とし込む方法とは?

経営層がデータを倫理的に扱うと決めても、現場にその意図が伝わらなければ意味がない。どのようにすればよいのか。Salesforceをはじめとする先駆的企業の取り組みを基に考える。

(2021/4/13)

“取りあえずデータ収集”の落とし穴 「警察や検察へのデータ開示」が招く問題

「いつか何かに使うかもしれない」といった考えで、目的が不明瞭なまま集められるだけのデータを取得しようとすることは望ましいことではない。そうした企業は、大きな代償を払うことになる可能性があるからだ。

(2021/3/29)

注目の運用&Tips記事一覧へ

ビッグデータ関連の用語解説

突っ込みどころ満載の“おかしな分析グラフ”はなぜ生まれるのか

大量のデータをビジネスに生かす「データ駆動型ビジネス」。その推進に当たり、データ分析者の焦りや先入観が思わぬ落とし穴になりかねない。

(2015/9/24)

1回で分かる:知識創発の機会を生む、オープンデータとは何か?

2012年7月に電子行政オープンデータ戦略が策定されて以来、にわかに盛り上がりを見せているオープンデータ。オープンデータとは何をもたらすものなのか。「Open Definition」の定義にならい、オープンデータの本質を導き出す。

(2013/12/11)

注目の用語解説記事一覧へ

ビッグデータの用途と6つの「V」を解説

ビッグデータはどのように使われているのか

 企業はビッグデータをシステムに組み込むことで、業務効率を向上させたり、より良い顧客サービスを提供したり、顧客一人一人にパーソナライズした販促キャンペーンを実行したりできる。

 ビッグデータを効果的に利用する企業は、事業判断のスピードと正確性を向上させて、競争力を高められる可能性がある。例えばビッグデータは、顧客に関する貴重な洞察を提供する。こうした洞察は企業のマーケティング活動を洗練させて、顧客の満足度を向上させるために利用できる。過去のデータとリアルタイムのデータの両方を分析することで、消費者や顧客企業の需要の変化を評価して、すぐにその需要に合わせられるようになる。

 医師は疾患の兆候とリスクを特定したり、診断を補助したりするためにビッグデータを利用できる。感染症対策にも有用だ。医療機関や電子健康記録やソーシャルメディア、Webサイト、その他の情報源からのデータを収集して組み合わせて分析することで、感染症の発生状況や患者者数の予測ができる。

 他にもさまざまな業界でビッグデータが使われている。

  • 石油会社やガス会社は、資源の掘削ができる新しい場所の特定や、パイプラインの運用監視のためにビッグデータを利用している。
  • 金融サービス企業は、ビッグデータを利用してリスク管理や市場データのリアルタイム分析を実施している。
  • 製造業者や輸送会社は、サプライチェーンの管理や配送ルートの最適化のためにビッグデータを利用している。

ビッグデータに含まれるデータの種類とは

 ビッグデータは、取引処理システムや顧客データベース、電子メール、医療記録、インターネットのクリックログ、モバイルアプリケーション、ソーシャルネットワークなど、さまざまなデータ源から生じる。テキスト形式のデータに加えて画像や動画、オーディオファイルもまた、ビッグデータの形態だ。

 ネットワークやサーバのログファイル、製造機械、IoT(モノとインターネット)デバイスからのセンサーデータなど、機械が生成するデータもビッグデータに含まれる。組織の業務システムが取得したデータに加えて、金融市場や気象、交通状況などに関する統計データや地理情報、科学研究など、組織外から取得したデータをビッグデータとして扱うこともある。

ビッグデータの「V」とは何か

 ビッグデータを表す3つのVという概念がある。3つのVは、それぞれ以下の意味を持つ。

  • Volume(データの量)
    • データの量を指す。ビッグデータは膨大な量のデータを扱うことが特徴で、データ量がテラバイト(TB)からペタバイト(PB)、さらにはエクサバイト(EB)規模に及ぶことがある。
  • Variety(データの種類)
    • データの種類の多様性を指す。ビッグデータは表形式のデータなどの構造化データとログファイルやJSON形式のデータなどの半構造化データ、テキストや動画などの非構造化データの全てを含む。
  • Velocity(データの速度)
    • データの生成、収集、処理の速度を指す。ビッグデータシステムはリアルタイムまたはほぼリアルタイムでデータを生成、収集し、迅速に処理や分析を必要がある。

 3つのVは2001年に調査会社META Groupのアナリストだったダグ・ラニー氏が提唱した。最近ではデータの正しさ(Veracity)や価値(Value)、変動性(Variability)など、他のVを追加して、ビッグデータについて説明することもある。これらのVには以下の意味合いがある。

  • データの正しさ(Veracity)
    • 真実性は、データセットの精度と信頼性を指す。さまざまなソースから収集されたそのままのデータは、データ分析のときに問題を引き起こす可能性がある。そのデータをデータクレンジング技術で修正することで、分析精度と信頼性を向上できる。
  • 価値(Value)
    • 収集されたデータの全てが、実際のビジネスで価値を持つわけではない。組織はビッグデータ分析プロジェクトでデータを使う前に、プロジェクトで解決したい課題にそのデータが関係していることを確認する必要がある。
  • 変動性(Variability)
    • 収集するデータの変動の大きさや不規則性を指す。具体的には、データが時間の経過とともにどのように変動するか、または一貫性を欠くパターンを示すかを意味する。変動性の高いデータを扱う場合は、その不規則性に対処する必要があるため、ビッグデータの管理と分析を複雑にする。