AWSは10月16日、Amazon Bedrockで、推論リクエストを日本国内のリージョンに自動限定的にルーティングする「日本国内クロスリージョン推論」を導入すると発表した。今回の発表は、Anthropicの最新モデル「Claude Sonnet 4.5」「Claude Haiku 4.5」が対象になっている。
近年、生成AIワークロードの規模と重要性が増すと同時に、日本企業ではデータレジデンシ―要件やコンプライアンス規制により、データ処理を国内に限定する必要が出てきている。
今回発表された「日本国内クロスリージョン推論」は、データを日本国内に留めながら、東京リージョンと大阪リージョンの計算リソースを活用することで、急激なトラフィックの発生にも対応。
なお、グローバル全体分散のクロスリージョン推論に比べて、日本国内クロスリージョン推論では 10% 上乗せの料金設定になっている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です