2018年09月18日 08時00分 公開
特集/連載

転移学習がより容易に自然言語処理&転移学習用ツール「Enso」、オープンソースで公開

米国企業のIndicoが、Ensoというツールをオープンソースで公開した。自然言語による転移学習を簡便化するというこのツールを紹介する。

[Adrian Bridgwater,Computer Weekly]

 米ボストンを拠点とするIndicoは、非構造化コンテンツ向けのAIソフトウェアに力を入れている。そのIndicoが最近、自然言語による転移学習の利用を簡単にすることに重点を置いた新しいオープンソースプロジェクトを進めている。

Computer Weekly日本語版 9月5日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 9月5日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 では、転移学習とは何だろう。

 転移学習は機械学習の一部で、ある問題の解決によって得た知識を、(多くの場合は非常に関連性の高い)異なる問題や分析の事例に適用するプロセスを指す。

 例えば、犬を認識するための学習時の知識を猫の認識プロセスに当てはめたり、車を認識する知識をトラックやバスを認識するプロセスに当てはめたりすることをいう。

 Indicoの話に戻る。同社が作成したオープンソースライブラリ「Enso」は、幅広い自然言語処理タスク向けに、埋め込み手法や転移学習手法のベンチマーク効率を向上させるよう設計されている。

 機械学習のエンジニアやソフトウェア開発者は、このライブラリで提供される標準のインタフェースとツールを使って、さまざまなフィーチャーの表現や目標とするタスクモデルを公平に比較できる。

 Indicoの共同創立者兼CTO(最高技術責任者)を務めるスレーター・ビクトロフ氏は、次のように話している。「オープンソースコミュニティーは、機械学習分野のイノベーションを進める原動力になっている。Indicoはそのコミュニティーからの恩恵を受け、オープンソースの取り組みを余すことなく活用している。Ensoは、そのコミュニティーへの恩返しともいえる。転移学習のメリットを高め続けることで、転移学習の導入速度を上げ、機械学習の障壁を取り払う方法でもある」

 これまで、転移学習はコンピュータビジョンや画像分類の分野で成功を収めてきた。

 転移学習に関連する大きな問題の一つは特定のデータセットへの、いわゆる「過学習」だ。

続きはComputer Weekly日本語版 9月5日号にて

本記事は抄訳版です。全文は、以下でダウンロード(無料)できます。


Computer Weekly日本語版 最近のバックナンバー

Computer Weekly日本語版 8月22日号 東京五輪でも活躍!? 5G最新動向

Computer Weekly日本語版 8月8日号 DockerとKubernetesのさらに先

Computer Weekly日本語版 7月18日号 トイザらスとAmazon成功の分かれ目


ITmedia マーケティング新着記事

news072.jpg

中高生のロールモデル消費 マスメディアより友人の話が情報源――大広・日本インフォメーション調査
ポストゆとり世代・ポストミレニアル世代である15〜18歳の中高生を対象に、多様化する価...

news142.jpg

「スタディサプリ」「メチャカリ」「BASE FOOD」「THEO」 サブスク型ビジネスにおける広告戦略
サブスクリプションビジネスにおける広告戦略や新規顧客獲得について注目サービスを展開...

news057.jpg

男性が職場や学校、家庭で感じている「生きづらさ」について――Lean In Tokyo調べ
実は少なくない男性が生きづらさを感じているという調査結果です。