検索
ニュース

東南アジア言語に特化した大規模言語モデルを提供開始、Alibaba 対応言語は?TechTarget発 世界のITニュース

Alibabaは、東南アジアのさまざまな言語を処理できる新しいLLM「SeaLLM」の提供を開始した。

Share
Tweet
LINE
Hatena

 Alibaba Groupの研究機関DAMO Academyは2023年12月、東南アジアの言語で学習させた大規模言語モデル(LLM)「SeaLLM」の提供を開始した。

東南アジアの言語的多様性に適応 その中身は?

 DAMO Academyは東南アジアの言語的多様性に適応するようにSeaLLMを設計した。SeaLLMは、タイ語、ラオス語、クメール語、ミャンマー語(ビルマ語)、ベトナム語、インドネシア語、マレー語、タガログ語などの自然言語処理ができる。ユーザー企業は、該当地域の社会規範、習慣、文体の好み、法的配慮事項の理解が必要なタスクを処理するだけでなく、それを反映したチャットbotを開発できるようになる。

 DAMO Academyは、SeaLLMをオープンソース化し、AI(人工知能)技術ベンダーHugging Faceが提供する同名の情報共有サイトに公開している。同サイトはチェックポイント(機械学習における訓練済みモデル)を公開しており、研究および商用目的での利用が可能だ。

 南洋理工大学(Nanyang Technological University)のコンピュータサイエンスおよびエンジニアリングスクール助教授のルウ・アン・トゥアン氏は、Alibabaが多言語のLLMを作ろうとする取り組みを「英語と中国語以外の言語を話す人々に新たなチャンスをもたらす可能性を秘めている」と評価する。

 Alibabaは、さまざまな分野の試験問題で構成するベンチマークテスト「M3Exam」でSeaLLMの性能を評価した。「化学や物理学から経済学に至るまで、東南アジアの言語を使うさまざまな科目で深い理解を示した」と同社は説明する。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る