東南アジア言語に特化した大規模言語モデルを提供開始、Alibaba 対応言語は?TechTarget発 世界のITニュース

Alibabaは、東南アジアのさまざまな言語を処理できる新しいLLM「SeaLLM」の提供を開始した。

2023年12月26日 14時50分 公開
[Aaron TanTechTarget]

 Alibaba Groupの研究機関DAMO Academyは2023年12月、東南アジアの言語で学習させた大規模言語モデル(LLM)「SeaLLM」の提供を開始した。

東南アジアの言語的多様性に適応 その中身は?

 DAMO Academyは東南アジアの言語的多様性に適応するようにSeaLLMを設計した。SeaLLMは、タイ語、ラオス語、クメール語、ミャンマー語(ビルマ語)、ベトナム語、インドネシア語、マレー語、タガログ語などの自然言語処理ができる。ユーザー企業は、該当地域の社会規範、習慣、文体の好み、法的配慮事項の理解が必要なタスクを処理するだけでなく、それを反映したチャットbotを開発できるようになる。

 DAMO Academyは、SeaLLMをオープンソース化し、AI(人工知能)技術ベンダーHugging Faceが提供する同名の情報共有サイトに公開している。同サイトはチェックポイント(機械学習における訓練済みモデル)を公開しており、研究および商用目的での利用が可能だ。

 南洋理工大学(Nanyang Technological University)のコンピュータサイエンスおよびエンジニアリングスクール助教授のルウ・アン・トゥアン氏は、Alibabaが多言語のLLMを作ろうとする取り組みを「英語と中国語以外の言語を話す人々に新たなチャンスをもたらす可能性を秘めている」と評価する。

 Alibabaは、さまざまな分野の試験問題で構成するベンチマークテスト「M3Exam」でSeaLLMの性能を評価した。「化学や物理学から経済学に至るまで、東南アジアの言語を使うさまざまな科目で深い理解を示した」と同社は説明する。

ITmedia マーケティング新着記事

news061.png

高齢男性はレジ待ちが苦手、女性は待たないためにアプリを活用――アイリッジ調査
実店舗を持つ企業が「アプリでどのようなユーザー体験を提供すべきか」を考えるヒントが...

news193.jpg

IASがブランドセーフティーの計測を拡張 誤報に関するレポートを追加
IASは、ブランドセーフティーと適合性の計測ソリューションを拡張し、誤報とともに広告が...

news047.png

【Googleが公式見解を発表】中古ドメインを絶対に使ってはいけない理由とは?
Googleが中古ドメインの不正利用を禁止を公式に発表しました。その理由や今後の対応につ...