開発者のための情報メディア

ニュース

新規
会員登録

CodeZineニュース

LINE、商用利用が可能な日本語大規模言語モデルをOSSで公開

CodeZine編集部[著]

2023/08/21 09:00

ポスト

ポスト

　LINEは、日本語による大規模言語モデル「japanese-large-lm」をオープンソースソフトウェア（OSS）として、8月14日に公開した。36億パラメータ（3.6Bモデル）と17億パラメータ（1.7Bモデル）のモデルがそれぞれ公開されている。

　「japanese-large-lm」は、同社が以前から取り組んでいる日本語の大規模言語モデル「HyperCLOVA」の研究開発プロジェクトと並行して、Massive LM開発ユニットにより開発された。

　なお、本モデルのライセンスは、商用利用が可能な「Apache License 2.0」となっている。

　同モデルの訓練には、同社独自の大規模日本語Webコーパスが利用され、Web由来のテキスト特有のノイズを除去するために、同社NLPチームのメンバーが開発したOSSの「HojiChar」によるフィルタリング処理が適用されている。また、最終的な学習には約650GBのコーパスが利用されている。加えて本モデルでは、「3D Parallelism」「Activation Checkpointing」などの手法を用い、学習を高速化している。

　学習したモデルの性能評価には、Perplexityスコア（PPL）および、質問応答・読解タスクの正解率を活用した。他の日本語言語モデルと比較した性能評価では、1.7Bモデルでは「OpenCALM-7B」と、3.6Bモデルでは「Rinna-3.6B」と同等以上の性能を示した。

　今後同社では、指示文に対して適切な出力を行えるようにチューニングしたモデルを公開する予定。

関連リンク: ブログポスト

3.6Bモデル

1.7Bモデル

LINE

この記事は参考になりましたか？

印刷用を表示

ポスト

この記事の著者: CodeZine編集部（コードジンヘンシュウブ）

CodeZineは、株式会社翔泳社が運営する開発者のための情報メディアです。日々の開発に取り組むエンジニアやテクノロジーを学びたい方に向けて、プログラミングやAI活用、開発ツール、エンジニアの学びとキャリアに関する記事をお届けしています。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

この記事は参考になりましたか？

この記事をシェア

ポスト

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料