東南アジア言語に特化した大規模言語モデルを提供開始、Alibaba 対応言語は?TechTarget発 世界のITニュース

Alibabaは、東南アジアのさまざまな言語を処理できる新しいLLM「SeaLLM」の提供を開始した。

2023年12月26日 14時50分 公開
[Aaron TanTechTarget]

 Alibaba Groupの研究機関DAMO Academyは2023年12月、東南アジアの言語で学習させた大規模言語モデル(LLM)「SeaLLM」の提供を開始した。

東南アジアの言語的多様性に適応 その中身は?

 DAMO Academyは東南アジアの言語的多様性に適応するようにSeaLLMを設計した。SeaLLMは、タイ語、ラオス語、クメール語、ミャンマー語(ビルマ語)、ベトナム語、インドネシア語、マレー語、タガログ語などの自然言語処理ができる。ユーザー企業は、該当地域の社会規範、習慣、文体の好み、法的配慮事項の理解が必要なタスクを処理するだけでなく、それを反映したチャットbotを開発できるようになる。

 DAMO Academyは、SeaLLMをオープンソース化し、AI(人工知能)技術ベンダーHugging Faceが提供する同名の情報共有サイトに公開している。同サイトはチェックポイント(機械学習における訓練済みモデル)を公開しており、研究および商用目的での利用が可能だ。

 南洋理工大学(Nanyang Technological University)のコンピュータサイエンスおよびエンジニアリングスクール助教授のルウ・アン・トゥアン氏は、Alibabaが多言語のLLMを作ろうとする取り組みを「英語と中国語以外の言語を話す人々に新たなチャンスをもたらす可能性を秘めている」と評価する。

 Alibabaは、さまざまな分野の試験問題で構成するベンチマークテスト「M3Exam」でSeaLLMの性能を評価した。「化学や物理学から経済学に至るまで、東南アジアの言語を使うさまざまな科目で深い理解を示した」と同社は説明する。

ITmedia マーケティング新着記事

news026.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2024年7月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news136.jpg

「Vポイント」「Ponta」と連携したCTV向けターゲティング広告配信と購買分析 マイクロアドが提供開始
マイクロアドは、VポイントおよびびPontaと連携したCTV向けのターゲティング広告配信を開...

news105.jpg

Netflixの広告付きプランが会員数34%増 成長ドライバーになるための次のステップは?
Netflixはストリーミング戦略を進化させる一方、2022年に広告付きプランを立ち上げた広告...