2018年09月18日 08時00分 公開
特集/連載

転移学習がより容易に自然言語処理&転移学習用ツール「Enso」、オープンソースで公開

米国企業のIndicoが、Ensoというツールをオープンソースで公開した。自然言語による転移学習を簡便化するというこのツールを紹介する。

[Adrian Bridgwater,Computer Weekly]

 米ボストンを拠点とするIndicoは、非構造化コンテンツ向けのAIソフトウェアに力を入れている。そのIndicoが最近、自然言語による転移学習の利用を簡単にすることに重点を置いた新しいオープンソースプロジェクトを進めている。

Computer Weekly日本語版 9月5日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 9月5日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 では、転移学習とは何だろう。

 転移学習は機械学習の一部で、ある問題の解決によって得た知識を、(多くの場合は非常に関連性の高い)異なる問題や分析の事例に適用するプロセスを指す。

 例えば、犬を認識するための学習時の知識を猫の認識プロセスに当てはめたり、車を認識する知識をトラックやバスを認識するプロセスに当てはめたりすることをいう。

 Indicoの話に戻る。同社が作成したオープンソースライブラリ「Enso」は、幅広い自然言語処理タスク向けに、埋め込み手法や転移学習手法のベンチマーク効率を向上させるよう設計されている。

 機械学習のエンジニアやソフトウェア開発者は、このライブラリで提供される標準のインタフェースとツールを使って、さまざまなフィーチャーの表現や目標とするタスクモデルを公平に比較できる。

 Indicoの共同創立者兼CTO(最高技術責任者)を務めるスレーター・ビクトロフ氏は、次のように話している。「オープンソースコミュニティーは、機械学習分野のイノベーションを進める原動力になっている。Indicoはそのコミュニティーからの恩恵を受け、オープンソースの取り組みを余すことなく活用している。Ensoは、そのコミュニティーへの恩返しともいえる。転移学習のメリットを高め続けることで、転移学習の導入速度を上げ、機械学習の障壁を取り払う方法でもある」

 これまで、転移学習はコンピュータビジョンや画像分類の分野で成功を収めてきた。

 転移学習に関連する大きな問題の一つは特定のデータセットへの、いわゆる「過学習」だ。

続きはComputer Weekly日本語版 9月5日号にて

本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。


Computer Weekly日本語版 最近のバックナンバー

Computer Weekly日本語版 8月22日号 東京五輪でも活躍!? 5G最新動向

Computer Weekly日本語版 8月8日号 DockerとKubernetesのさらに先

Computer Weekly日本語版 7月18日号 トイザらスとAmazon成功の分かれ目


ITmedia マーケティング新着記事

news079.jpg

ブランドにとってのTwitterの価値は「オーディエンス」 『カメ止め』女優や経沢香保子氏らが語る
映画『カメラを止めるな!』に出演した女優しゅはまはるみ氏、アーティスト和田永氏、キ...

news044.jpg

世界の顧客満足度は下降傾向に――Zendesk調査
Zendeskの「カスタマーエクスペリエンス傾向分析レポート2019年版」より。

news008.jpg

ツイートから見る訪日外国人の高評価観光スポット――東京海上日動火災保険とNTTデータ調査
ソーシャルビッグデータを活用した全国インバウンド観光調査の結果です。