データマイニングは大規模なデータセットを分類してデータ分析することで、ビジネスの問題を解決するのに役立つパターンを特定するためのプロセスだ。
米プロ野球MLBの所属球団では、データを活用した試合戦略の立案が当たり前になっている。球団はビジネスインテリジェンス(BI)ツールなどの分析ツールをどのように活用しているのか。データから分かる事実とは。
データ分析を活用して「SDGs」の達成を支援する――。こうした構想を進める非営利団体が大学で講義をしたところ、学生がその理念を「熱烈に歓迎」したという。その理由は。
新型コロナウイルス感染症の影響で、2020年には主要なボート競技が相次いで中止・延期となった。こうした中、英国ボート競技チームはデータを活用した選手のトレーニング方法を生み出し、実践した。その中身とは。
セガの「Football Manager」がヒントになって起業されたSciSportsは、サッカーのあらゆる要素をデータ化してディープラーニングを応用して分析。パスの成功率まで予測する。同社の分析が行き着く先とは?
ディズニーは、主にテーマパークやリゾート施設の顧客体験向上にアナリティクスを活用しているという。一方でミュージカルの運営にも取り入れ、『ライオン・キング』の興行を成功させた。
Marks & Spencerはロジスティクスを改善するためのバックエンドプロジェクトを予測分析の革新へと膨らませ、取締役レベルの意思決定の原動力とした。
「ムーアの法則は既に限界に達している」。米IBMのマイヤーソン氏に、原子レベル、量子力学の世界に突入しつつあるチップ開発の現状を聞いた。ムーアの法則はなぜ限界なのか? そして未来は?
組織統合により、情報の一元化を迫られたスコットランド消防本部。ETLツールとBIで一元化とアウトプット体制を整備した先にあるのは、モノのインターネットの活用だった。
社内外のデータを基に顧客が購買行動に至る根本原因を探り、商品を買いそうな顧客リストや“刺さる”キーワードを導き出す。そんな予測分析製品が「iNSIGHTBOX」だ。
スポーツの結果を予測することは可能なのか? IBMが英国で取り組んでいるプロジェクトは、データを収集し、公式を導いて、チームが試合に勝つ確率を上げるための目標を抽出するシステムの開発だ。
統計解析をはじめとする分析手段を利用し、データから将来の変化を予測するのに役立つのが「予測分析」製品である。その導入効果を解説する。
テキストマイニングの精度向上には、自動処理だけでは限界がある。そこで、人の判断を支援する仕組みを盛り込み、分析精度の向上を目指すのが、NRIの「TRUE TELLER」である。
話し言葉など文法無視の日本語であっても解析したい。形態素解析に利用する辞書更新の手間を省きたい。こうした課題を解決するテキストマイニング製品が「VextMiner」だ。
ソーシャルメディアから顧客の声を探りたい。大規模テキストを高速に解析したい。こうした声に応えて、テキストマイニング製品は着実に進化している。最新動向をまとめた。
書き手の心情を自動判断できる解析エンジンを採用。アンケートの自由回答に書かれた内容から回答者の態度や行動に関する洞察が得られるという。
データマイニングの技術やツールは、企業が将来の傾向を予測し、よりデータに基づいた意思決定を実施するのに役立つ。高度な分析手法を使用して、データセット内の有用な情報を検索する。データマイニングは、データベースに保管されたデータの収集と処理、分析を実行するデータサイエンスの方法論である、KDD(Knowledge Discovery from Database:データベースからの知識発見)のプロセスの一つだ。
データマイニングは、分析対象となるデータセットの説明や、特定の施策の結果の予測、不正行為やセキュリティの問題の検出、ユーザー層の詳細な把握、システムのボトルネックや依存関係の検出などに使用できる。
ビッグデータやデータウェアハウス(DWH)の技術進化や利用可能な製品が拡充し続けていることで、データマイニングの有用性は高まっている。データマイニングを担うデータスペシャリストには、コーディングとプログラミング言語の経験や、データのクリーニングと処理、解釈を実行するための統計知識が必要だ。データスペシャリストは、ビジネスインテリジェンス(BI)やその他の分析アプリケーションを使って蓄積された履歴データやリアルタイムで収集したストリーミングデータを検査し、データマイニングを実施する。
データマイニングは、事業戦略の策定やシステムの運用管理といったさまざまな業務に役立つ。マーケティングや広告、販売、顧客サポートなどの顧客対応に加え、製造、サプライチェーン管理(SCM)、財務、人事などの幅広い分野で利用できる。IT管理の面では、不正検出やリスク管理、サイバーセキュリティ計画の策定などに効果的だ。データマイニングは、医療や政府、科学、数学、スポーツなどの研究にも利用される。
データマイニングは一般的に、データサイエンティストや熟練したデータ分析の専門家が実施する。しかし組織内でデータに精通したビジネスアナリストや経営幹部、その他の従業員が、市民データサイエンティスト(データ分析の専任担当ではないが、高度なデータ分析ができる人材)としてデータマイニングを担当することがある。
データマイニングの中核要素には、機械学習と統計分析に加えて、分析用データを準備するためのデータ管理タスクが含まれる。機械学習アルゴリズムと人工知能(AI)技術の進化で、データマイニングツールはより多くのプロセスの自動化が可能となっている。これらのツールは、顧客データベースや取引記録、Webサーバ、モバイルアプリケーション、センサーからのログファイルなど、膨大なデータセットのマイニングを実行する。
データマイニングプロセスは主に、次の4つの主要なステップに分類できる。
データマイニングにはさまざまな技術が利用できる。一般的なデータマイニング技術の例を幾つか紹介する。
さまざまなベンダーがデータマイニングツールを提供している。各ベンダーは、他の種類のデータサイエンス製品の中の一機能として、データマイニングツールを提供することもある。データマイニングソフトウェアは、データの準備機能や組み込みアルゴリズムを用いた分析機能、グラフィカルユーザーインタフェース(GUI)ベースの開発環境などの主要な機能を提供する。
データマイニングツールを提供するベンダーとしては、MicrosoftやIBM、Oracle、AlteryxDataiku、H2O.ai、KNIME、RapidMiner、SAP、SAS Institute、Tibco Softwareなどが挙げられる。数値計算とデータ可視化のためのソフトウェア「DataMelt」やデータマイニングソフトウェアの「ELKI」、機械学習ソフトウェア「Weka」などのオープンソースのデータ分析ソフトウェアをデータマイニングに活用することもできる。
一般的に、データマイニングのビジネスにおける利点は、データセット内の隠れたパターンや傾向、相関関係、異常などを発見する能力から生じる。こうした情報を他のデータ分析手法と組み合わせることで、意思決定の精度を改善できる。各業界の事例を紹介する。