米Googleは、自動スケーリングのサーバレスSparkである「Dataproc Serverless for Spark」の一般提供、およびBigQueryを使用したサーバレスSparkのプライベートプレビューを、2月4日(現地時間)に開始した。
一般提供が開始されたDataproc Serverless for Sparkを使用することで、選択したインターフェースからSparkジョブを送信でき、ジョブのニーズに合わせて処理が自動スケーリングされるため、開発者はクラスタの管理やインフラストラクチャの調整が不要になり、コードとロジックへの集中が可能になる。また、データエンジニアリングチームは、エンドユーザーのインフラストラクチャを管理および監視する必要がない。
なお、インフラストラクチャの時間に対する支払いではなく、ジョブの実行時間に対してのみ料金が発生する。
BigQueryを使用したサーバレスSparkのプライベートプレビューでは、BigQueryエディタでPySparkコードを記述できるようになり、インフラストラクチャのプロビジョニングを行うことなく、サーバレスSparkを使用してコードがシームレスに実行される。
同社は現在、サーバレスSparkをさまざまなユーザーが使用するインターフェースと統合して、事前にインフラストラクチャのプロビジョニングを行うことなく、Sparkを利用できるよう取り組んでおり、数か月以内にデータサイエンティスト向けのVertex AIワークベンチ、およびデータアナリスト向けのDataplexを通じて、サーバーレスSparkの可用性を向上していく。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です