検索
特集/連載

群雄割拠の機械学習基盤 専門家が比較するポイントは?機械学習には必須な有効性の検証機能など

機械学習市場にはここ数年で多くのベンダーが参入してきた。数あるベンダーの中から最適なベンダーを選ぶのは難しいが、専門家はどう見るのか。選定のポイントを聞いた。

Share
Tweet
LINE
Hatena
画像
専門家は何を重視するのか?

 機械学習市場に参入するベンダーが増え、機械学習の基盤を比較するのも簡単ではなくなってきた。そんな中、ユーザーや専門家が重視するポイントは柔軟性に集約されそうだ。

 「作業に応じて適切なツールを選べることが重要だ」そう話すのは、通販サイトOverstock.comの主任データサイエンティストを務めるクリス・ロビソン氏だ。

 ロビソン氏は、分散処理のフレームワークである「Apache Spark」を基にしたデータ分析サービスを提供するDatabricksが主催したオンラインセミナーで、Databricksのサービスを使ってどのようにサイト訪問者の購買傾向をスコアリング(得点付け)しているか説明した。まずWebのログ情報に特徴となる属性を追加し、それをユーザーセッションごとに整理して順番に並べ替える。ここでいうユーザーセッションとはユーザーがサイトに来てから離脱するまでの一連の流れを指す。整理されたログの情報は購買につながる行動の見取り図となる。行動の見取り図を構築、つまりデータを構造化したら、購買に関連する行動を分類する機械学習アルゴリズムのトレーニングを行う。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る