特集/連載
群雄割拠の機械学習基盤 専門家が比較するポイントは?:機械学習には必須な有効性の検証機能など
機械学習市場にはここ数年で多くのベンダーが参入してきた。数あるベンダーの中から最適なベンダーを選ぶのは難しいが、専門家はどう見るのか。選定のポイントを聞いた。
機械学習市場に参入するベンダーが増え、機械学習の基盤を比較するのも簡単ではなくなってきた。そんな中、ユーザーや専門家が重視するポイントは柔軟性に集約されそうだ。
「作業に応じて適切なツールを選べることが重要だ」そう話すのは、通販サイトOverstock.comの主任データサイエンティストを務めるクリス・ロビソン氏だ。
併せて読みたいお勧め記事
機械学習基盤の動向をおさらい
機械学習、利用者側の課題とは
- Intelがこっそり教える「データサイエンティストに必要な素質」とは
- リクルートのビッグデータ分析基盤ができるまで、事業部門と開発部門が共に奮闘
- ブルームバーグのデータサイエンス担当者が見た機械学習の課題
ロビソン氏は、分散処理のフレームワークである「Apache Spark」を基にしたデータ分析サービスを提供するDatabricksが主催したオンラインセミナーで、Databricksのサービスを使ってどのようにサイト訪問者の購買傾向をスコアリング(得点付け)しているか説明した。まずWebのログ情報に特徴となる属性を追加し、それをユーザーセッションごとに整理して順番に並べ替える。ここでいうユーザーセッションとはユーザーがサイトに来てから離脱するまでの一連の流れを指す。整理されたログの情報は購買につながる行動の見取り図となる。行動の見取り図を構築、つまりデータを構造化したら、購買に関連する行動を分類する機械学習アルゴリズムのトレーニングを行う。
Copyright © ITmedia, Inc. All Rights Reserved.