2019年12月16日 05時00分 公開
特集/連載

機械学習を始めるなら知っておきたいアルゴリズム5選【前編】機械学習の代表的アルゴリズム「線形回帰」「決定木」とは?

機械学習にはさまざまなアルゴリズムがある。前後編の前編に当たるこの記事では、数あるアルゴリズムの中でも、代表的な機械学習アルゴリズムの「線形回帰」「決定木」について紹介する。

[Kassidy Kelley,TechTarget]

関連キーワード

データ分析 | 機械学習 | アルゴリズム


 機械学習モデルの開発に万能のアルゴリズムはない。使用する目的やデータセットによって、適切な機械学習アルゴリズムは異なる。例えば比較的単純な「線形回帰」は、トレーニングや実装が比較的容易な機械学習アルゴリズムだ。ただし複雑な予測が必要な場合には適切な分析結果が得られないことがある。

 IT担当者は機械学習ベンダーの選定や、機械学習モデル作成のための複雑なプログラミングを始める前に、アルゴリズムの特徴を理解し、利用する目的を明確にしておく必要がある。前後編にわたり、企業での利用に適した5種類のアルゴリズムについて、詳しく説明する。前編に当たる本稿では、そのうちの2種類を紹介しよう。

アルゴリズム1.線形回帰

 線形回帰は広く使われているアルゴリズムの一つだ。このアルゴリズムは、データセットから2つの変数の単純な相関関係をマッピング(関連付け)する。入力する値とその値に合わせて変化する値を調べ、一方の値の変化が他方にどのように影響するかといった関係を定量化する。また線形回帰はグラフの線で表すことができる。

 仕組みの単純さは、線形回帰の人気が高い理由の一つだ。簡単に説明でき、機械学習モデルのパラメータの調整はほとんど必要ないため、比較的使いやすい。企業では長期的な事業計画を策定するための、売上予測やリスク評価によく利用されている。

 テクノロジーサービス企業Clairvoyantの最高技術責任者(CTO)を務めるシェカール・ベムリ氏は、値や可能性を予測したいときに線形回帰は最適だと話す。「信用情報の調査や学生の単位取得の可否などが線形回帰の典型的な利用例だ。企業が予測したいことは『それが起こるか起こらないか』という問いに行き着くものが多く、これらの問いに答えを出すことができる」(ベムリ氏)

アルゴリズム2.決定木

ITmedia マーケティング新着記事

news139.jpg

新型コロナウイルスの感染拡大で注目される「巣ごもり消費」に関する意識――カンム調査
外出控えムードの中、消費意欲は「自宅でのエンタメ」に向かっているようです。

news091.jpg

オンライン医療が進む中国と台湾、日本 iOS「メディカル」アプリ最新人気ランキング
今回は、2020年2月度における中国、台湾、日本市場におけるiOS「メディカル」モバイルア...

news137.jpg

SDGsへの取り組みが最も高く評価された企業はトヨタ自動車――ブランド総合研究所調査
国内の主力企業のSDGsへの取り組みやESG活動に対して1万500人に聞いています。