「ビッグデータ」の主要製品は? 一押しポイントを整理

ユーザー企業のIT担当者を対象に、IT製品/サービスの導入・購買に役立つ情報を提供する無料の会員制メディア「TechTargetジャパン」。このコンテンツでは、ビッグデータに関する製品解説の記事を紹介します。製品/サービス選定の参考にご覧ください(リンク先のページはPR記事を含みます)。

ビッグデータとは何か

 ビッグデータは、大量かつ多様なデータと、そのデータを高速で収集、処理、分析するための技術を指す。ビッグデータには構造化データと半構造化データ、非構造化データが含まれ、これらは機械学習や予測モデル、その他の高度なデータ分析アプリケーションで使用される。

ビッグデータ関連の製品解説

ITmedia × シンクソート・ジャパン

P Rサイロを乗り越え「使えるデータ」を生み出すために何をすればいいのか

データドリブンの経営を目指す動きが広がる中、データ活用の大前提となるのがさまざまなシステムに分散したデータの統合だ。データ集約はできても中身の整理ができていなくてはどうにもならない。この最初にして最大の課題をどうするか。

(2019/12/17)

P Rレガシーなシステムにあるデータをビジネスに生かす方法

メインフレームなどを中心とするレガシーシステムからビッグデータ環境へのデータ移行時に企業が抱える課題をどう解決すればいいのか。

(2017/11/16)

P Rビッグデータ活用の最初の難関「データ統合」をどうする?

真のデータドリブン経営の実現には、レガシーシステムを含めたデータ統合が必要になる。だが品質を確保するには従来のETLツールでは限界がある。どうするか。

(2017/6/30)
ITmedia × レノボ・ジャパン

P RERPデータとビッグデータ分析の連携を実現する SAP HANA Vora + MapR

基幹系データを活用しつつ、ビッグデータに備えたシステム構築に必要なシステムアーキテクチャとは。SAP HANA VoraとMapRを連携させ、Lenovoサーバ上で動作させる検証を基に、3社およびCTCの4社が共同でベストプラクティスを提案。

(2017/2/21)

P Rビッグデータ時代のデータベースサーバに「フラッシュ」を選ぶべき理由

誰もが膨大なデータを扱うことが当たり前になれば、そこにはシステムの課題も生まれる。肥大化するデータソースの負荷に耐えストレスのない高速な処理を実現できるデータベースサーバに何を選ぶかは特に悩ましい。

(2015/7/22)
ITmedia × 日本アイ・ビー・エム

P R“1秒以内”の素早いレスポンスを実現、フラッシュストレージ進化の行方

「ビジネスのデジタル化」が進む中、顧客から集まる膨大なデータを素早く分析し、ビジネスに生かす必要がある。それを実践するヤフーや資生堂は、高速レスポンスのITインフラ基盤をどのように構築したのだろうか。

(2016/7/12)

P R再注目のテープが担う「ビッグデータ時代のデータ管理基盤」

ビッグデータ時代の本格到来を控え、膨大な量のデータ管理に頭を悩ませているITスタッフも多いことだろう。どうすれば費用対効果に優れた管理基盤を整備することができるのか。

(2016/2/15)

P R簡単「お鍋診断」でチェック、あなたにオススメの「個客中心」実現アイデア

顧客の声を企業戦略に反映するためには、顧客を「個」として考える「個客中心」への転換が必要だ。個客中心へと転換するために必要なスキルを養うオンライン講座を、「お薦めお鍋診断」とともに紹介する。

(2013/10/30)
ITmedia × 伊藤忠テクノソリューションズ

P R数十億行にも及ぶビッグデータ分析環境を2カ月半で構築できた理由とは

新しいDWHプラットフォームを導入しても、期待していたほどのスケールアウトができなかったり、カタログスペックの性能が出ていなかったりすれば意味がない。その不安を事前に解消する方法はないのだろうか。

(2016/3/31)

P Rデータサイエンティスト4人が座談会で語った「データ分析の現在と未来」

ビッグデータ分析と関連して注目される「データサイエンティスト」。彼らはどのような仕事をし、どのような価値を企業に提供しているのか。実際にデータ分析に関わるデータサイエンティストが座談会で語った。

(2013/4/24)

P Rビッグデータ活用の課題を解決し、ビジネスに結び付けるには

大量データをどのように扱いビジネスに生かすか――企業のビッグデータへの取り組みはビジネスメリットを追求するフェーズに入りつつある。実践への道筋を示すワンストップサービスを紹介する。

(2013/3/29)
ITmedia × 日本電気

P R成功の鍵は“分析前”にある――ビッグデータ分析の壁をどう解消するか

目的にマッチした、高度な分析モデルを作成することができればビジネスで効果が挙げられる。しかし実際ビッグデータ分析を始めると、データの準備や処理時間という課題に直面する。どう解決すればいいのか?

(2016/3/3)

P R調査から分かったビッグデータ活用の課題、導入時に考えるべき5つのステップ

ビジネスで大きな力となり得る「ビッグデータ」。活用したいけど「どこから始めればいいの」と考える読者も多いのではないだろうか。その悩みを解決する方法を紹介する。

(2015/8/3)

P R仮想化とインメモリで実現、高速かつ低コストなデータ処理手法とは?

バッチ処理を高速化したいが、余分な投資は抑えたい。その解決の鍵は、「仮想化」と「インメモリ」という2つの技術の組み合わせにあった。その具体像を探っていこう。

(2013/4/23)

P RGPUサーバの検討を重ね、たどり着いた結論は? 東京大学発ベンチャー社長に聞く

ハイスペックなGPUサーバは高額であり、サーバ管理も専門的なノウハウが必要なため、導入のハードルが非常に高い。中小企業におけるそんな悩みを解消し、ビジネスを強力に後押しするGPUクラウドサービスとは。

(2022/8/2)

OSSの改ざん防止データベース「immudb」、試す価値あり

改ざん防止に主眼を置いたデータベースがOSSで登場した。オンラインデモやDocker、Kubernetesインストールもサポートしており、取りあえず試してみることができる。百聞は一見にしかずだ。

(2022/2/3)

あらゆるデータを一元的に分析できる「オープンデータレイク分析」

何の前処理も行っていないデータレイクから必要なデータだけを取り出してデータウェアハウスにインポートして……と、データ分析には手間が掛かる。オープンデータレイク分析は煩雑な部分をまとめて処理する。

(2021/3/12)

AWSがノーコードのデータクレンジング/ETLツール「AWS Glue DataBrew」を発表

AWSは、新たなデータクレンジング/ETLツール「AWS Glue DataBrew」を発表した。コードを記述することなく、データ分析の準備を整えることができる。

(2020/12/3)

P R社内のデータ分析担当者を「AI人材」にする支援ツールとは

企業が保有するデータは、新たなビジネスを生み出す資産だ。しかし、大量のデータを処理する作業に追われて肝心の分析がおろそかになっていないだろうか。データサイエンティストのいない企業で、AIによるデータ分析を実現する方法とは。

(2020/11/4)

P R拝見、隣の“すご腕”データ活用――先進企業はどうしているのかを語り合った

データをビジネスに活用する機運が高まっているが、データ分析の実現にはさまざまな課題と向き合う必要がある。これらを解決し、データの活用を推進するためには何から始めればいいのだろうか。複数の観点から語り合った。

(2020/10/27)

P Rペタバイト時代に対応、データ活用のための“余裕”をもたらす次世代ストレージ

企業が保有するデータがペタバイト規模へと急増する中、データの保護や管理に追われ、価値を引き出すことができないケースが目立ち始めた。これを解決するのが、優れた重複排除や圧縮機能を備えた、次世代のストレージだ。

(2019/10/18)

P Rビッグデータもクラウドへ向かう中、データ保護は古いままでいいのか?

企業を取り囲む環境は変化しており、データが中心となるこれからのビジネスにおいてバックアップの仕組みは軽視できない。最新のバックアップ事情について紹介する。

(2018/11/30)

Hadoop 3.0が“控え目”にデビュー、クラウドとGPU対応を強化

今はポストHadoopの時代なのか。支持者に言わせれば、ビッグデータフレームワークの最新版「Apache Hadoop 3.0」は機械学習アプリケーションとクラウドシステムで成功を収めており、まだその時代は終わっていない。

(2018/1/19)

P Rデータ活用時代に生き残るための、新たなデータ分析基盤戦略とは

データ分析に注目していても、その基盤を整えるためのコストや手間が障壁となっている企業は多い。しかし手の届くDWHがあれば、データ活用時代に競争力を増せるはずだ。

(2017/5/23)

ビッグデータの用途と6つの「V」を解説

ビッグデータはどのように使われているのか

 企業はビッグデータをシステムに組み込むことで、業務効率を向上させたり、より良い顧客サービスを提供したり、顧客一人一人にパーソナライズした販促キャンペーンを実行したりできる。

 ビッグデータを効果的に利用する企業は、事業判断のスピードと正確性を向上させて、競争力を高められる可能性がある。例えばビッグデータは、顧客に関する貴重な洞察を提供する。こうした洞察は企業のマーケティング活動を洗練させて、顧客の満足度を向上させるために利用できる。過去のデータとリアルタイムのデータの両方を分析することで、消費者や顧客企業の需要の変化を評価して、すぐにその需要に合わせられるようになる。

 医師は疾患の兆候とリスクを特定したり、診断を補助したりするためにビッグデータを利用できる。感染症対策にも有用だ。医療機関や電子健康記録やソーシャルメディア、Webサイト、その他の情報源からのデータを収集して組み合わせて分析することで、感染症の発生状況や患者者数の予測ができる。

 他にもさまざまな業界でビッグデータが使われている。

  • 石油会社やガス会社は、資源の掘削ができる新しい場所の特定や、パイプラインの運用監視のためにビッグデータを利用している。
  • 金融サービス企業は、ビッグデータを利用してリスク管理や市場データのリアルタイム分析を実施している。
  • 製造業者や輸送会社は、サプライチェーンの管理や配送ルートの最適化のためにビッグデータを利用している。

ビッグデータに含まれるデータの種類とは

 ビッグデータは、取引処理システムや顧客データベース、電子メール、医療記録、インターネットのクリックログ、モバイルアプリケーション、ソーシャルネットワークなど、さまざまなデータ源から生じる。テキスト形式のデータに加えて画像や動画、オーディオファイルもまた、ビッグデータの形態だ。

 ネットワークやサーバのログファイル、製造機械、IoT(モノとインターネット)デバイスからのセンサーデータなど、機械が生成するデータもビッグデータに含まれる。組織の業務システムが取得したデータに加えて、金融市場や気象、交通状況などに関する統計データや地理情報、科学研究など、組織外から取得したデータをビッグデータとして扱うこともある。

ビッグデータの「V」とは何か

 ビッグデータを表す3つのVという概念がある。3つのVは、それぞれ以下の意味を持つ。

  • Volume(データの量)
    • データの量を指す。ビッグデータは膨大な量のデータを扱うことが特徴で、データ量がテラバイト(TB)からペタバイト(PB)、さらにはエクサバイト(EB)規模に及ぶことがある。
  • Variety(データの種類)
    • データの種類の多様性を指す。ビッグデータは表形式のデータなどの構造化データとログファイルやJSON形式のデータなどの半構造化データ、テキストや動画などの非構造化データの全てを含む。
  • Velocity(データの速度)
    • データの生成、収集、処理の速度を指す。ビッグデータシステムはリアルタイムまたはほぼリアルタイムでデータを生成、収集し、迅速に処理や分析を必要がある。

 3つのVは2001年に調査会社META Groupのアナリストだったダグ・ラニー氏が提唱した。最近ではデータの正しさ(Veracity)や価値(Value)、変動性(Variability)など、他のVを追加して、ビッグデータについて説明することもある。これらのVには以下の意味合いがある。

  • データの正しさ(Veracity)
    • 真実性は、データセットの精度と信頼性を指す。さまざまなソースから収集されたそのままのデータは、データ分析のときに問題を引き起こす可能性がある。そのデータをデータクレンジング技術で修正することで、分析精度と信頼性を向上できる。
  • 価値(Value)
    • 収集されたデータの全てが、実際のビジネスで価値を持つわけではない。組織はビッグデータ分析プロジェクトでデータを使う前に、プロジェクトで解決したい課題にそのデータが関係していることを確認する必要がある。
  • 変動性(Variability)
    • 収集するデータの変動の大きさや不規則性を指す。具体的には、データが時間の経過とともにどのように変動するか、または一貫性を欠くパターンを示すかを意味する。変動性の高いデータを扱う場合は、その不規則性に対処する必要があるため、ビッグデータの管理と分析を複雑にする。