ビッグデータは、大量かつ多様なデータと、そのデータを高速で収集、処理、分析するための技術を指す。ビッグデータには構造化データと半構造化データ、非構造化データが含まれ、これらは機械学習や予測モデル、その他の高度なデータ分析アプリケーションで使用される。
データ分析分野における製品/サービスの調達を加速させる英国政府。どのような観点から、何を重視して製品/サービスの導入を進めようとしているのか。
経営層がデータを倫理的に扱うと決めても、現場にその意図が伝わらなければ意味がない。どのようにすればよいのか。Salesforceをはじめとする先駆的企業の取り組みを基に考える。
「いつか何かに使うかもしれない」といった考えで、目的が不明瞭なまま集められるだけのデータを取得しようとすることは望ましいことではない。そうした企業は、大きな代償を払うことになる可能性があるからだ。
個人情報などのデータを収集する上でコンプライアンスは間違いなく重要だ。だが法律に違反しないデータ収集であれば問題は一切ないのか。データ保護やデータプライバシーをコンプライアンスと倫理の両面で考える。
書籍の読み放題サービス「Kindle Unlimited」は幾つかのハードルを抱えるものの、Amazon.comにさまざまなメリットをもたらす。出版業界の慣行を変え得る、そのメリットとは。
多くの企業は、今日のビッグデータとデータサイエンスがもたらすチャンスを認識しているが、一方でそのエコシステムの複雑さに手を焼いている。
米大統領選でのドナルド・トランプ氏の予想外の勝利を受け、メディアや世論調査会社はデータ分析に失敗した原因の検証を進めている。
企業がデータサイエンスチームを形成するときには、希少価値の高い人材を求めるよりも、さまざまなバックグラウンドを持った人材を確保すべきだ。
PayPalは、高度な予測データ分析を使用してユーザーを不正行為から保護し、PayPalのブランドを維持している。常に進化することがPayPal成功の鍵を握っている。
現代IT技術で注目のビッグデータで要となるデータサイエンスチームは最も花形のセクションだ。優柔な人材が集まってくるが、それだけに、自らの誤りに気付かないままビジネスを窮地に追い込むこともある。
2016年に分析プログラムを洗練させるための注意事項は何だろうか。本稿で紹介するリストに従えば、2016年に分析で成功を収められること請け合いだ。
直感とデータドリブン型の意思決定のどちらが優れていのだろうか。ジェフリー・マー氏は、同氏がどのようにデータを活用してブラックジャックと起業家で成功したのか紹介する。
データサイエンティストはビッグデータアナリティクスで貴重な役割を果たせるが、あらゆる企業に必要というわけではなさそうだ。データサイエンティストがいなくても技術と企業文化で課題の克服に挑む企業もある。
自社のニーズを満たすビッグデータ分析ツールを見極めるためには、しっかりとした評価ポイントを策定する必要がある。評価するためポイントを紹介する。
データサイエンティストはデータを深く探求できなければならない。データサイエンティストと他の分析の専門家を区別するものは何だろうか。
21世紀の情報ガバナンスに関する5つの根強い俗説について専門家が検証する。データ管理プロセスをデジタル時代に合わせて適応させることはそれほど難しくない。
ソーシャルネットワークはAmazonの世界制覇計画に欠けている部分だった。今、彼らはそれを手にいれた。ジェフ・ベゾス氏の判断が他社のサービスに与える影響とは。
企業はビッグデータをシステムに組み込むことで、業務効率を向上させたり、より良い顧客サービスを提供したり、顧客一人一人にパーソナライズした販促キャンペーンを実行したりできる。
ビッグデータを効果的に利用する企業は、事業判断のスピードと正確性を向上させて、競争力を高められる可能性がある。例えばビッグデータは、顧客に関する貴重な洞察を提供する。こうした洞察は企業のマーケティング活動を洗練させて、顧客の満足度を向上させるために利用できる。過去のデータとリアルタイムのデータの両方を分析することで、消費者や顧客企業の需要の変化を評価して、すぐにその需要に合わせられるようになる。
医師は疾患の兆候とリスクを特定したり、診断を補助したりするためにビッグデータを利用できる。感染症対策にも有用だ。医療機関や電子健康記録やソーシャルメディア、Webサイト、その他の情報源からのデータを収集して組み合わせて分析することで、感染症の発生状況や患者者数の予測ができる。
他にもさまざまな業界でビッグデータが使われている。
ビッグデータは、取引処理システムや顧客データベース、電子メール、医療記録、インターネットのクリックログ、モバイルアプリケーション、ソーシャルネットワークなど、さまざまなデータ源から生じる。テキスト形式のデータに加えて画像や動画、オーディオファイルもまた、ビッグデータの形態だ。
ネットワークやサーバのログファイル、製造機械、IoT(モノとインターネット)デバイスからのセンサーデータなど、機械が生成するデータもビッグデータに含まれる。組織の業務システムが取得したデータに加えて、金融市場や気象、交通状況などに関する統計データや地理情報、科学研究など、組織外から取得したデータをビッグデータとして扱うこともある。
ビッグデータを表す3つのVという概念がある。3つのVは、それぞれ以下の意味を持つ。
3つのVは2001年に調査会社META Groupのアナリストだったダグ・ラニー氏が提唱した。最近ではデータの正しさ(Veracity)や価値(Value)、変動性(Variability)など、他のVを追加して、ビッグデータについて説明することもある。これらのVには以下の意味合いがある。