機械学習の代表的アルゴリズム「線形回帰」「決定木」とは?機械学習を始めるなら知っておきたいアルゴリズム5選【前編】

機械学習にはさまざまなアルゴリズムがある。前後編の前編に当たるこの記事では、数あるアルゴリズムの中でも、代表的な機械学習アルゴリズムの「線形回帰」「決定木」について紹介する。

2019年12月16日 05時00分 公開
[Kassidy KelleyTechTarget]

関連キーワード

データ分析 | 機械学習 | アルゴリズム


 機械学習モデルの開発に万能のアルゴリズムはない。使用する目的やデータセットによって、適切な機械学習アルゴリズムは異なる。例えば比較的単純な「線形回帰」は、トレーニングや実装が比較的容易な機械学習アルゴリズムだ。ただし複雑な予測が必要な場合には適切な分析結果が得られないことがある。

 IT担当者は機械学習ベンダーの選定や、機械学習モデル作成のための複雑なプログラミングを始める前に、アルゴリズムの特徴を理解し、利用する目的を明確にしておく必要がある。前後編にわたり、企業での利用に適した5種類のアルゴリズムについて、詳しく説明する。前編に当たる本稿では、そのうちの2種類を紹介しよう。

アルゴリズム1.線形回帰

 線形回帰は広く使われているアルゴリズムの一つだ。このアルゴリズムは、データセットから2つの変数の単純な相関関係をマッピング(関連付け)する。入力する値とその値に合わせて変化する値を調べ、一方の値の変化が他方にどのように影響するかといった関係を定量化する。また線形回帰はグラフの線で表すことができる。

 仕組みの単純さは、線形回帰の人気が高い理由の一つだ。簡単に説明でき、機械学習モデルのパラメータの調整はほとんど必要ないため、比較的使いやすい。企業では長期的な事業計画を策定するための、売上予測やリスク評価によく利用されている。

 テクノロジーサービス企業Clairvoyantの最高技術責任者(CTO)を務めるシェカール・ベムリ氏は、値や可能性を予測したいときに線形回帰は最適だと話す。「信用情報の調査や学生の単位取得の可否などが線形回帰の典型的な利用例だ。企業が予測したいことは『それが起こるか起こらないか』という問いに行き着くものが多く、これらの問いに答えを出すことができる」(ベムリ氏)

アルゴリズム2.決定木

ITmedia マーケティング新着記事

news193.jpg

IASがブランドセーフティーの計測を拡張 誤報に関するレポートを追加
IASは、ブランドセーフティーと適合性の計測ソリューションを拡張し、誤報とともに広告が...

news047.png

【Googleが公式見解を発表】中古ドメインを絶対に使ってはいけない理由とは?
Googleが中古ドメインの不正利用を禁止を公式に発表しました。その理由や今後の対応につ...

news115.jpg

「TikTok禁止法案」に米大統領が署名 気になるこれからにまつわる5つの疑問
米連邦上院が、安全保障上の理由からTikTokの米国事業の売却を要求する法案を可決し、バ...