深層学習と機械学習の違いとは? 実例で分かるその活用:データ量やアプローチに注目
深層学習は従来の機械学習と似ているが、モデル構造と出力の点で大きく異なる。専門家が解説する。
深層学習がこれまでの機械学習とどこが違うかといえば、まず使用するデータの量が違う。
出版社のMcGraw-Hill Educationでリサーチ&データサイエンス担当バイスプレジデントを務めるアルフレッド・エッサ氏は「深層学習が真価を発揮するのはビッグデータを利用してこそだ」と話す。
解析技術が進歩し、深層学習に関する話題を昨年より広範に見聞きするようになった。そして深層学習と機械学習の違いもよく議論に上っている。この2つはツールや技法が重なる部分が多い。
だが、共通点はあっても原理は異なるようだ。エッサ氏は2017年5月15〜16日に開催された「Business Analytics Innovation Summit」におけるプレゼンテーションで、その違いについて説明した。例えば、これまでの機械学習アルゴリズムでは、ある一定量のデータを処理した時点で解析パフォーマンスは横ばいになる。変数間の相関関係を探すという指示は比較的すぐに達成でき、学習はそこで頭打ちになるからだ。
併せて読みたいお薦め記事
深層学習(ディープラーニング)について
- 深層学習が引き出す非構造化データの“暗黒面”の力とは?
- ビッグデータ分析の隠れた本命、「深層学習」の底力とは?
- Twitterも使っている「深層学習」ツール、普及の鍵は?
- ディープラーニングは“黒歴史”を乗り越えられるか
機械学習の最新トレンド
一方、深層学習のアルゴリズムでは、解析するトレーニングデータを与えれば与えるほどパフォーマンスが加速的に向上する傾向がある。その理由の1つは、機械学習のアルゴリズムよりも方向性を限定されないことにある。深層学習が採用するニューラルネットワークアプローチでは、機械学習の場合より微妙なパターンや相関関係を導き出すが、それは大量の解析データがないと見つからない。
解析出力にも違いがある。エッサ氏によると、機械学習のアルゴリズムは必ず等級やスコアなどの数値を出力するが、深層学習は幅広い出力が可能であり、画像に対する自然言語のキャプションや無声映画に付加する音声なども対象となり得る。
機械学習と深層学習は似て非なるものであり、エッサ氏はその違いを「プロペラ機とジェット機」に例えた。
深層学習で機械学習は淘汰されるか
深層学習が登場したからといって機械学習が無用になるわけではない。エッサ氏の予測では、機械学習のアルゴリズムを開発するデータサイエンティストの仕事は当面なくならないという。ほとんどの企業はまだ深層学習に利用できるほどの大量のデータを持ち合わせていない。McGraw-Hillも現時点では深層学習を研究している段階であり、実用には至っていない。
「従来の機械学習で対応できる対象はまだたくさんある。現状の機械学習の大半は深層学習ではなく、比較的少量のデータセットだけを扱っている。さまざまなタイプの機械学習手法を試すことが優れたデータサイエンティストの仕事だ」とエッサ氏は語った。
ソーシャルネットワーク会社LinkedInのデータサイエンスチームも同じことを実感している。同カンファレンスで別のプレゼンテーションを行ったLinkedInビジネスアナリティクス&データサイエンスアソシエートのウェンロン・ゼン氏によると、同社ではセールス見込み客をスコア付けするプロジェクトに深層学習の適用を試みたという。既存の企業顧客のうち、求人と人材採用のサービスを新たに利用する可能性の高い顧客を特定するのが目的だった。ところが、深層ニューラルネットワークでは求める性能を得られなかった。データ量が十分ではなかったのだ。
「深層学習には膨大なデータが必要だ。私たちには数十万件のサンプルしかなく、それでは不十分だった」とゼン氏は語った。
そこで、同社のデータサイエンスチームは従来型の機械学習手法を選ぶことにした。ランダムフォレストと勾配ブースティングという2つのアルゴリズムを組み合わせたアンサンブルモデルだ。ゼン氏は、こうした事案にはこのモデルの方が深層学習モデルより有効だったと語った。
深層学習の潜在的価値
Copyright © ITmedia, Inc. All Rights Reserved.