米国企業のIndicoが、Ensoというツールをオープンソースで公開した。自然言語による転移学習を簡便化するというこのツールを紹介する。
米ボストンを拠点とするIndicoは、非構造化コンテンツ向けのAIソフトウェアに力を入れている。そのIndicoが最近、自然言語による転移学習の利用を簡単にすることに重点を置いた新しいオープンソースプロジェクトを進めている。
では、転移学習とは何だろう。
転移学習は機械学習の一部で、ある問題の解決によって得た知識を、(多くの場合は非常に関連性の高い)異なる問題や分析の事例に適用するプロセスを指す。
例えば、犬を認識するための学習時の知識を猫の認識プロセスに当てはめたり、車を認識する知識をトラックやバスを認識するプロセスに当てはめたりすることをいう。
Indicoの話に戻る。同社が作成したオープンソースライブラリ「Enso」は、幅広い自然言語処理タスク向けに、埋め込み手法や転移学習手法のベンチマーク効率を向上させるよう設計されている。
機械学習のエンジニアやソフトウェア開発者は、このライブラリで提供される標準のインタフェースとツールを使って、さまざまなフィーチャーの表現や目標とするタスクモデルを公平に比較できる。
Indicoの共同創立者兼CTO(最高技術責任者)を務めるスレーター・ビクトロフ氏は、次のように話している。「オープンソースコミュニティーは、機械学習分野のイノベーションを進める原動力になっている。Indicoはそのコミュニティーからの恩恵を受け、オープンソースの取り組みを余すことなく活用している。Ensoは、そのコミュニティーへの恩返しともいえる。転移学習のメリットを高め続けることで、転移学習の導入速度を上げ、機械学習の障壁を取り払う方法でもある」
これまで、転移学習はコンピュータビジョンや画像分類の分野で成功を収めてきた。
転移学習に関連する大きな問題の一つは特定のデータセットへの、いわゆる「過学習」だ。
続きを読むには、[続きを読む]ボタンを押して
会員登録あるいはログインしてください。
Copyright © ITmedia, Inc. All Rights Reserved.
生成AIを活用して業務や顧客体験の再構築を進める動きが活性化しているが、その多くが、PoCやラボ環境の段階にとどまっている。なぜなら、生成AIの可能性を最大限に引き出すための、インフラのパフォーマンスが不十分だからだ。
昨今のソフトウェア開発では、AIコーディングアシスタントの活用が主流になっている。しかし、最適なコーディングアシストツールは、開発者や企業によって異なるという。導入の際は、どのようなポイントに注意すればよいのか。
生成AIの活用にはデータベースが重要となるが、従来のデータベースは最新テクノロジーに対応できないなどの課題がある。本資料では、データベースをモダナイズし、生成AIを用いてビジネスイノベーションを生み出すための方法を探る。
ビジネスにおいて、検索体験およびその結果の質の向上が重要なテーマとなっている。顧客はもちろん、自社の従業員に対しても、実用的な答えをより迅速に、手間なく入手できる環境の整備が求められている。
登場以来ビジネスへの活用方法が模索されてきた生成AI。近年では業務組み込みにおける具体的な成功例が数多く報告されている。本資料では、5件の生成AI活用事例を交えて、業務に組み込む上での具体的なアプローチを解説する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年4月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...