カラクリは、日本語に特化した生成AIのガードレール「KARAKURI Guardrails」β版の提供を、12月25日に開始した。
「KARAKURI Guardrails」は、既存のテック各社が提供するガードレール機能(有害コンテンツ検出、プライバシー保護、コンプライアンスチェックなど)に加えて、日本語独自の表現や慣習に即した高度な検知・制御を実現する。また、企業固有の要件やポリシーに合わせたカスタマイズが可能で、より精緻なリスク管理と安全なコミュニケーション環境の提供を行う。
おもな機能としては、信頼性の高い情報源と照合して不確実な情報や矛盾する内容を特定することで、誤った情報の拡散を防ぐことによって、AIが事実と異なる情報や根拠のない内容を生成するリスクを検出する「ハルシネーションリスクの検知」、会話やクエリの文脈を理解して設定された主題や目的から逸脱した応答を識別し、ユーザーの意図に沿った適切な情報提供を維持して、効率的なコミュニケーションを支援する「文脈逸脱の検知」といった機能を備えている。
ほかにも、不適切な言葉遣い、システムの脆弱性を突こうとする試み、悪意のあるコード実行の可能性がある入力を検出して、システムとユーザーの安全を確保する「攻撃的行為の検知」、氏名、住所、電話番号、クレジットカード情報といった機密データを検出して、必要に応じてマスキングまたは削除することで、プライバシー保護とデータセキュリティを強化する「個人情報の検知」、組織のポリシーや法的基準に基づく禁止用語・トピックを検出し、コンプライアンス対応と適切なコンテンツ管理をサポートする「禁止ワード、禁止トピックの検出」といった機能を搭載する。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です