東南アジア言語に特化した大規模言語モデルを提供開始、Alibaba 対応言語は?TechTarget発 世界のITニュース

Alibabaは、東南アジアのさまざまな言語を処理できる新しいLLM「SeaLLM」の提供を開始した。

2023年12月26日 14時50分 公開
[Aaron TanTechTarget]

 Alibaba Groupの研究機関DAMO Academyは2023年12月、東南アジアの言語で学習させた大規模言語モデル(LLM)「SeaLLM」の提供を開始した。

東南アジアの言語的多様性に適応 その中身は?

 DAMO Academyは東南アジアの言語的多様性に適応するようにSeaLLMを設計した。SeaLLMは、タイ語、ラオス語、クメール語、ミャンマー語(ビルマ語)、ベトナム語、インドネシア語、マレー語、タガログ語などの自然言語処理ができる。ユーザー企業は、該当地域の社会規範、習慣、文体の好み、法的配慮事項の理解が必要なタスクを処理するだけでなく、それを反映したチャットbotを開発できるようになる。

 DAMO Academyは、SeaLLMをオープンソース化し、AI(人工知能)技術ベンダーHugging Faceが提供する同名の情報共有サイトに公開している。同サイトはチェックポイント(機械学習における訓練済みモデル)を公開しており、研究および商用目的での利用が可能だ。

 南洋理工大学(Nanyang Technological University)のコンピュータサイエンスおよびエンジニアリングスクール助教授のルウ・アン・トゥアン氏は、Alibabaが多言語のLLMを作ろうとする取り組みを「英語と中国語以外の言語を話す人々に新たなチャンスをもたらす可能性を秘めている」と評価する。

 Alibabaは、さまざまな分野の試験問題で構成するベンチマークテスト「M3Exam」でSeaLLMの性能を評価した。「化学や物理学から経済学に至るまで、東南アジアの言語を使うさまざまな科目で深い理解を示した」と同社は説明する。

Copyright © ITmedia, Inc. All Rights Reserved.

From Informa TechTarget

お知らせ
米国TechTarget Inc.とInforma Techデジタル事業が業務提携したことが発表されました。TechTargetジャパンは従来どおり、アイティメディア(株)が運営を継続します。これからも日本企業のIT選定に役立つ情報を提供してまいります。

ITmedia マーケティング新着記事

news094.jpg

「押し付けがましい広告」が配信されたとき、消費者はどう感じるか
消費者は個人データに依存した広告よりも、記事などのコンテンツの文脈に沿っている広告...

news074.jpg

SNS発信のベストな時間帯(2025年版) InstagramとFacebook、TikTokでどう違う?
Hootsuiteが2025年版のソーシャルメディア最適投稿時間を公開。各プラットフォームごとの...

news161.jpg

「動画広告がディスプレイ広告超え」他、電通「2024年 日本の広告費」インターネット広告媒体費の詳細分析
国内電通グループのデジタル領域をけん引する4社は共同で「2024年 日本の広告費」のイン...