SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2024 セッションレポート

LLMの日本語能力は? リーダーボード「Nejumi.ai」の開発・運営から見えてきた課題

【15-B-7】LLMの日本語能力はいかほど?日本最大級のLLMリーダーボードNejumi.aiの開発と運営

  • X ポスト
  • このエントリーをはてなブックマークに追加

オリジナルのリーダーボードを作ってみよう

 最後に山本氏は、ユーザー自身が評価系を作成する具体的な方法について紹介した。

 Nejumi.aiのリーダーボードは公開されており、誰でもアクセスして利用できる。インタラクティブな分析もその場で実践できるため「動かして洞察を得てほしい」と山本氏は背中を押す。

 さらに「自分でリーダーボードを作成してみたい」という人のために、GitHubのコードも公開されている。これを活用すれば、自身の環境で動かしてみることも可能だ。

 具体的なリーダーボード作成手順は、まずWeights & BiasesのArtifactという機能かHugging Faceを使ってモデルを準備する。次にConfigで実行条件を設定し、評価を実行する。評価の実行はコンソール上から叩く方法と、Weights & BiasesのLaunch機能でジョブを上げる方法がある。実行ができたらダッシュボード上で結果を確認し、それをリーダーボードに追加する流れだ。

オリジナルのリーダーボードを作るためのワークフロー
オリジナルのリーダーボードを作るためのワークフロー

 講演を締めくくるにあたって山本氏は、「ここまでNejumi.aiの紹介をしてきたが、リーダーボードに対する企業エンジニアの反応は2通りだ」と話す。

 スタートアップのエンジニアの場合は、メールやSlackでHugging Faceのリンクが届き、「いいモデルができたので、すぐに評価したい」と“道場破り”を仕掛けてくる。

 一方、大企業の技術者の場合は、「社内でクローズドで評価する方法はないですか」「まずは手元でこっそりやりたい」と問い合わせが来る。

 「結論、どちらも可能だ。前者の場合には、今回ご紹介したリーダーボード、既存の評価結果と可視化などのアセットを皆様ご自身でコピーないしインポートするか、あるいはデリケートクラウドやオンプレにインポートすることで、いつでもモデルを評価できる環境を整えられる。また後者のように、こっそり試すやり方もきちんとある。方法はブログなどで公開しているが、不明点があれば随時ご相談いただきたい」

 LLMが群雄割拠するなか、開発の指標となるリーダーボードの存在は今や欠かせない。Nejumi.aiの力強いニーズと反響を示す形で、講演は終了した。

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers Summit 2024 セッションレポート連載記事一覧

もっと読む

この記事の著者

丸毛 透(マルモ トオル)

インタビュー(人物)、ポートレート、商品撮影、料理写真をWeb雑誌中心に活動。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

水無瀬 あずさ(ミナセ アズサ)

 現役エンジニア兼フリーランスライター。PHPで社内開発を行う傍ら、オウンドメディアコンテンツを執筆しています。得意ジャンルはIT・転職・教育。個人ゲーム開発に興味があり、最近になってUnity(C#)の勉強を始めました。おでんのコンニャクが主役のゲームを作るのが目標です。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/19784 2024/08/26 11:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング