米国企業のIndicoが、Ensoというツールをオープンソースで公開した。自然言語による転移学習を簡便化するというこのツールを紹介する。
米ボストンを拠点とするIndicoは、非構造化コンテンツ向けのAIソフトウェアに力を入れている。そのIndicoが最近、自然言語による転移学習の利用を簡単にすることに重点を置いた新しいオープンソースプロジェクトを進めている。
では、転移学習とは何だろう。
転移学習は機械学習の一部で、ある問題の解決によって得た知識を、(多くの場合は非常に関連性の高い)異なる問題や分析の事例に適用するプロセスを指す。
例えば、犬を認識するための学習時の知識を猫の認識プロセスに当てはめたり、車を認識する知識をトラックやバスを認識するプロセスに当てはめたりすることをいう。
Indicoの話に戻る。同社が作成したオープンソースライブラリ「Enso」は、幅広い自然言語処理タスク向けに、埋め込み手法や転移学習手法のベンチマーク効率を向上させるよう設計されている。
機械学習のエンジニアやソフトウェア開発者は、このライブラリで提供される標準のインタフェースとツールを使って、さまざまなフィーチャーの表現や目標とするタスクモデルを公平に比較できる。
Indicoの共同創立者兼CTO(最高技術責任者)を務めるスレーター・ビクトロフ氏は、次のように話している。「オープンソースコミュニティーは、機械学習分野のイノベーションを進める原動力になっている。Indicoはそのコミュニティーからの恩恵を受け、オープンソースの取り組みを余すことなく活用している。Ensoは、そのコミュニティーへの恩返しともいえる。転移学習のメリットを高め続けることで、転移学習の導入速度を上げ、機械学習の障壁を取り払う方法でもある」
これまで、転移学習はコンピュータビジョンや画像分類の分野で成功を収めてきた。
転移学習に関連する大きな問題の一つは特定のデータセットへの、いわゆる「過学習」だ。
続きを読むには、[続きを読む]ボタンを押して
会員登録あるいはログインしてください。
Copyright © ITmedia, Inc. All Rights Reserved.
お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。
日本テレビの運用型テレビCM「スグリー」、プレミアパートナー企業9社を認定
日本テレビは、テレビCM枠をWebで購入できるサービス「スグリー」のプレミアパートナー9...
ウェルチのCMOが語るリブランディング 脱「ぶどうジュースの会社」なるか?
Welch’s(ウェルチ)が製品の品揃えを拡大する中で、CMOのスコット・ウトケ氏はブランド...
OpenAI、Google、etc. 第59回スーパーボウルで賛否が分かれた“微妙”CMたち
スーパーパーボウルLIXでは、有名人やユーモア、政治を前面に押し出した広告について、賛...