機械学習の代表的アルゴリズム「線形回帰」「決定木」とは?機械学習を始めるなら知っておきたいアルゴリズム5選【前編】

機械学習にはさまざまなアルゴリズムがある。前後編の前編に当たるこの記事では、数あるアルゴリズムの中でも、代表的な機械学習アルゴリズムの「線形回帰」「決定木」について紹介する。

2019年12月16日 05時00分 公開
[Kassidy KelleyTechTarget]

関連キーワード

データ分析 | 機械学習 | アルゴリズム


 機械学習モデルの開発に万能のアルゴリズムはない。使用する目的やデータセットによって、適切な機械学習アルゴリズムは異なる。例えば比較的単純な「線形回帰」は、トレーニングや実装が比較的容易な機械学習アルゴリズムだ。ただし複雑な予測が必要な場合には適切な分析結果が得られないことがある。

 IT担当者は機械学習ベンダーの選定や、機械学習モデル作成のための複雑なプログラミングを始める前に、アルゴリズムの特徴を理解し、利用する目的を明確にしておく必要がある。前後編にわたり、企業での利用に適した5種類のアルゴリズムについて、詳しく説明する。前編に当たる本稿では、そのうちの2種類を紹介しよう。

アルゴリズム1.線形回帰

 線形回帰は広く使われているアルゴリズムの一つだ。このアルゴリズムは、データセットから2つの変数の単純な相関関係をマッピング(関連付け)する。入力する値とその値に合わせて変化する値を調べ、一方の値の変化が他方にどのように影響するかといった関係を定量化する。また線形回帰はグラフの線で表すことができる。

 仕組みの単純さは、線形回帰の人気が高い理由の一つだ。簡単に説明でき、機械学習モデルのパラメータの調整はほとんど必要ないため、比較的使いやすい。企業では長期的な事業計画を策定するための、売上予測やリスク評価によく利用されている。

 テクノロジーサービス企業Clairvoyantの最高技術責任者(CTO)を務めるシェカール・ベムリ氏は、値や可能性を予測したいときに線形回帰は最適だと話す。「信用情報の調査や学生の単位取得の可否などが線形回帰の典型的な利用例だ。企業が予測したいことは『それが起こるか起こらないか』という問いに行き着くものが多く、これらの問いに答えを出すことができる」(ベムリ氏)

アルゴリズム2.決定木

ITmedia マーケティング新着記事

news024.png

「ECプラットフォーム」 売れ筋TOP10(2024年3月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news090.jpg

GoogleがZ世代のローカル検索でInstagramやTikTokに敗北 なぜこうなった? これからどうなる?
Googleは依然として人気の検索サイトだが、ことZ世代のローカル検索に関しては、Instagra...

news056.png

DE&Iに関する実態調査 「公平」と「平等」の違いについて認知度は2割未満
NTTデータ経営研究所がNTTコム オンライン・マーケティング・ソリューションと共同で実施...