さくらインターネットは2025年9月24日、生成AIを活用したサービス開発を支援する推論API基盤「さくらのAI Engine」の一般提供を開始した。
本サービスは、さくらのクラウドコントロールパネルから利用可能で、大規模言語モデル(LLM)や検索拡張生成(RAG)、音声認識など基盤モデルの機能をAPIを通じて利用できる。自社サービスや業務で生成AIを導入したい企業や自治体などを対象に、最小限の開発作業で高度なAI機能の実装を可能にしている。
さくらのAI EngineはAPIベースで提供され、インフラ構築不要で迅速な開発が可能である。また国内データセンター環境で運用されるため、機密情報や個人情報にも配慮した設計となっている。推論処理にはNVIDIA製の高性能GPUが採用されており、安定した処理性能を実現している。
料金プランは「基盤モデル無償プラン」と「従量課金プラン」が用意されている。無償枠を超えた利用については従量課金となるが、用途や規模に合わせて選択できる。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です