2019年12月16日 05時00分 公開
特集/連載

機械学習を始めるなら知っておきたいアルゴリズム5選【前編】機械学習の代表的アルゴリズム「線形回帰」「決定木」とは?

機械学習にはさまざまなアルゴリズムがある。前後編の前編に当たるこの記事では、数あるアルゴリズムの中でも、代表的な機械学習アルゴリズムの「線形回帰」「決定木」について紹介する。

[Kassidy Kelley,TechTarget]

関連キーワード

データ分析 | 機械学習 | アルゴリズム


 機械学習モデルの開発に万能のアルゴリズムはない。使用する目的やデータセットによって、適切な機械学習アルゴリズムは異なる。例えば比較的単純な「線形回帰」は、トレーニングや実装が比較的容易な機械学習アルゴリズムだ。ただし複雑な予測が必要な場合には適切な分析結果が得られないことがある。

 IT担当者は機械学習ベンダーの選定や、機械学習モデル作成のための複雑なプログラミングを始める前に、アルゴリズムの特徴を理解し、利用する目的を明確にしておく必要がある。前後編にわたり、企業での利用に適した5種類のアルゴリズムについて、詳しく説明する。前編に当たる本稿では、そのうちの2種類を紹介しよう。

アルゴリズム1.線形回帰

 線形回帰は広く使われているアルゴリズムの一つだ。このアルゴリズムは、データセットから2つの変数の単純な相関関係をマッピング(関連付け)する。入力する値とその値に合わせて変化する値を調べ、一方の値の変化が他方にどのように影響するかといった関係を定量化する。また線形回帰はグラフの線で表すことができる。

 仕組みの単純さは、線形回帰の人気が高い理由の一つだ。簡単に説明でき、機械学習モデルのパラメータの調整はほとんど必要ないため、比較的使いやすい。企業では長期的な事業計画を策定するための、売上予測やリスク評価によく利用されている。

 テクノロジーサービス企業Clairvoyantの最高技術責任者(CTO)を務めるシェカール・ベムリ氏は、値や可能性を予測したいときに線形回帰は最適だと話す。「信用情報の調査や学生の単位取得の可否などが線形回帰の典型的な利用例だ。企業が予測したいことは『それが起こるか起こらないか』という問いに行き着くものが多く、これらの問いに答えを出すことができる」(ベムリ氏)

アルゴリズム2.決定木

ITmedia マーケティング新着記事

news143.jpg

Accenture調査から見えた2020年の5つのテクノロジートレンド
「テック・クラッシュ」を乗り切るにはどうすればいいのか。AccentureのCEOおよびCTOの記...

news134.jpg

電話サポートの保留音、世界の主流はクラシック――Genesys調査
13カ国で実施した電話サポートの保留音に関する調査結果です。

news125.jpg

エコ活動・SDGsへの意識 「フードロス」「廃プラスチック」に高い関心――CCC調査
エコ・環境問題への関心や関連トピックスへの認知度などを調査しています。