MIT Tech Review: 東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開

Menu

始めるならこの春から！年間サブスク20%オフのお得な【春割】実施中

フラッシュ2023年7月25日

東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開
by MITテクノロジーレビュー編集部 [MIT Technology Review Japan]

東京大学発のスタートアップ企業であるLightblue（ライトブルー）は、公開モデルとしては国内最大規模の67億パラメーターの日本語大規模言語モデルを開発し、オープンソース・ソフトウェアとして公開した。ライセンスはApache 2.0。

この言語モデルは、米モザイクML （MosaicML）が公開した多言語大規模言語モデル「MPT-7B」を基にしたもの。グーグルが開発した多言語データセット「MC4」をアレン人工知能研究所（Allen Institute for AI）がそれぞれの言語ごとに利用可能にしたサブセットの日本語部分を使って追加学習した。

Lightblueは、今回公開したモデルを法人向けに提供する。業界用語や部署特有の専門用語、慣習などに合わせて訓練・調整することで、企業や部署によって異なる要望に応じるという。加えて、自社サービスの提供も予定しているとのことだ。

（笹田）
人気の記事ランキング

MITTRが選んだ世界を変える10大技術 2025年版: 本当に長期的に重要となるものは何か？これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。
特集ページへ

フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る