2018年09月18日 08時00分 公開
特集/連載

転移学習がより容易に自然言語処理&転移学習用ツール「Enso」、オープンソースで公開

米国企業のIndicoが、Ensoというツールをオープンソースで公開した。自然言語による転移学習を簡便化するというこのツールを紹介する。

[Adrian Bridgwater,Computer Weekly]

 米ボストンを拠点とするIndicoは、非構造化コンテンツ向けのAIソフトウェアに力を入れている。そのIndicoが最近、自然言語による転移学習の利用を簡単にすることに重点を置いた新しいオープンソースプロジェクトを進めている。

Computer Weekly日本語版 9月5日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 9月5日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 では、転移学習とは何だろう。

 転移学習は機械学習の一部で、ある問題の解決によって得た知識を、(多くの場合は非常に関連性の高い)異なる問題や分析の事例に適用するプロセスを指す。

 例えば、犬を認識するための学習時の知識を猫の認識プロセスに当てはめたり、車を認識する知識をトラックやバスを認識するプロセスに当てはめたりすることをいう。

 Indicoの話に戻る。同社が作成したオープンソースライブラリ「Enso」は、幅広い自然言語処理タスク向けに、埋め込み手法や転移学習手法のベンチマーク効率を向上させるよう設計されている。

 機械学習のエンジニアやソフトウェア開発者は、このライブラリで提供される標準のインタフェースとツールを使って、さまざまなフィーチャーの表現や目標とするタスクモデルを公平に比較できる。

 Indicoの共同創立者兼CTO(最高技術責任者)を務めるスレーター・ビクトロフ氏は、次のように話している。「オープンソースコミュニティーは、機械学習分野のイノベーションを進める原動力になっている。Indicoはそのコミュニティーからの恩恵を受け、オープンソースの取り組みを余すことなく活用している。Ensoは、そのコミュニティーへの恩返しともいえる。転移学習のメリットを高め続けることで、転移学習の導入速度を上げ、機械学習の障壁を取り払う方法でもある」

 これまで、転移学習はコンピュータビジョンや画像分類の分野で成功を収めてきた。

 転移学習に関連する大きな問題の一つは特定のデータセットへの、いわゆる「過学習」だ。

続きはComputer Weekly日本語版 9月5日号にて

本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。


Computer Weekly日本語版 最近のバックナンバー

Computer Weekly日本語版 8月22日号 東京五輪でも活躍!? 5G最新動向

Computer Weekly日本語版 8月8日号 DockerとKubernetesのさらに先

Computer Weekly日本語版 7月18日号 トイザらスとAmazon成功の分かれ目


ITmedia マーケティング新着記事

news089.jpg

Fringe81田中 弦氏×ヘイ佐俣 奈緒子氏 強い組織はプロダクトマネジメント視点で作る
Web業界で注目される気鋭の起業家2人が、組織や働き方のこれからについて語り合った。

news020.jpg

無料のデジタルコンテンツが有料になったら中高生の8割は「他の無料コンテンツを探す」――MMD研究所調査
MMD研究所とテスティーは共同で、中高生のデジタルコンテンツの利用と消費に関する調査を...

news018.jpg

「辛ラーメン」は「カップヌードル」の2倍超、訪日中国人の食品認知率――ヴァリューズ調べ
ヴァリューズは「中国人の食品ブランド認知・購入状況調査」を実施しました。