ニュース

新規
会員登録

CodeZineニュース

フューチャー、日本語によるソースコード補完のためのLLM学習データを無償公開

CodeZine編集部[著]

2025/09/03 08:00

ポスト

ポスト

　フューチャーは、人がLLMに与える指示とそれに対する回答のペアで構成される、ソフトウェア開発に関するインストラクションチューニング（Instruction-Tuning）データを無償公開した。

　LLMの開発には良質な学習データが必要な一方、日本語に特化したソフトウェアに関するインストラクションチューニングデータが限られることが同分野の研究開発における障壁になっている。

　同社は、2024年10月より経済産業省とNEDO（国立研究開発法人新エネルギー・産業技術総合開発機構）が実施する国内生成AIの開発力強化プロジェクト「GENIAC」に採択され、「日本語とソフトウェア開発に特化した基盤モデル」の研究開発を行ってきた。

　今回公開したデータは、同プロジェクトの研究過程においてベンチマークとしたLLMをもとに自動生成したもの。同社は、このデータを活用し、開発した「Llama 3.1 Future Code Ja」が、特に日本語の指示によるソースコード補完能力に優れていることを確認している。

公開データの例

関連リンク: プレスリリース

フューチャー

この記事は参考になりましたか？

印刷用を表示

ポスト

この記事の著者: CodeZine編集部（コードジンヘンシュウブ）

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

この記事は参考になりましたか？

この記事をシェア

ポスト

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料

アクセスランキング

アクセスランキング