2019年02月22日 09時00分 公開
特集/連載

機械学習導入のカギは「運用者と開発者のスキル差をどう埋めるか」運用環境では予期しないことが起こる

機械学習モデルの導入時には、その開発時とは全く異なるスキルセットが必要だ。データサイエンティストとエンジニアリングチームはこのギャップを埋める準備をしなければならない。

[George Lawton,ITmedia]

関連キーワード

IT部門 | CIO | 機械学習


 機械学習AI(人工知能)アルゴリズムの開発時と、機械学習の運用環境への導入時では、企業が直面する課題が異なる。機械学習の開発は試験と探究のプロセスだが、導入においては安全でしっかりと管理された一貫性のある結果が求められる。

 開発段階では、正確さを求めて最適なアルゴリズムにすることを目指す。アプリケーションプラットフォーム監視製品を販売するベンダーAppDynamicsでデータサイエンス部門の最高技術責任者(CTO)を務めるジャンフランソワ・ユアール氏は「研究とは本質的に実験なので、失敗が許される」と話す。

 導入段階では、機械学習モデルが社内外の顧客に公開される。この段階では制約が増え、一層高いレベルの正確さとパフォーマンスが求められる。また、導入のコストや規模を管理するのは非常に難しく、膨大なコストがかかる可能性もある。

 「運用と導入では、研究段階では見受けられなかったコスト、リソース、新しいパターンのデータなど、多くの制約が生じる。その理由の1つは研究では全ての可能性を探ることができない点にある」(ユアール氏)

非構造化データの扱い

 機械学習を運用環境に導入する際の最も大きな課題の1つが、非構造化データの扱いだ。モデルを運用環境に導入するのが難しいのは、統制された研究室で運用モデルのトレーニングを実施したときよりも、本番の運用環境の方が多くの非構造化データやさまざまなデータ型に遭遇する可能性が高いためだ。

 「運用環境には、予期しないデータや状況が数多く存在する」とユアール氏は話す。

ITmedia マーケティング新着記事

news052.png

ゲーム業界がコロナ禍でTwitterを活用したコミュニケーションに注力した理由
コロナ禍において「巣ごもり消費」が拡大し追い風が吹いているといわれるゲーム業界だが...

news139.jpg

コロナ禍の観光に見える20の兆しとは? TBWA HAKUHODOなどが「観光復興ガイド」を公開
SNS上の旅行に対する価値観の激しい変化を分析し、そこから見えた20の新たな兆しとその後...

news161.jpg

コロナ禍で縮小したマーケティング施策 1位は「オフラインのセミナー/展示会」――ベーシック調査
B2Bマーケターを対象にした調査で8割以上が「コロナ禍で実施/検討しているマーケティン...