Google Cloudは、6月23日、「BigQuery Managed Python User-Defined Functions(UDF)」の一般提供を開始した。
これにより、標準SQLクエリまたはPythonで記述されたBigQuery DataFrame(BigFrames)を使用して、BigQuery内でカスタムPythonコードを直接、安全に実行できるようになる。
Managed Python UDFは、BigQueryが管理するサーバーレスリソース上で動作し、インフラストラクチャの設定やコンテナの管理を行うことなく、数十億行まで自動的にスケール可能。BigQueryが、Pythonコードのコンパイル、イメージの構築、セキュリティパッチの適用、デプロイ、実行を自動的に処理するため、SQL内でPython関数を簡単に利用できる。
また、上級ユーザー向けに、パフォーマンスの調整や使用状況の監視を行うための機能を追加している。具体的には、ベクトル化された入力をPyArrow RecordBatchesとして直接処理する機能をサポートした。また、BigQueryコンソールにクエリ結果からCloud MonitoringのリアルタイムCPU、メモリ、同時実行メトリクスへの直接リンクが追加され、本番環境のワークロードを容易にデバッグできるようになった。
Managed Python UDFは、BigQueryサービスSKUに基づいて課金される。
利用を開始するには、公開されているBigQueryデータセットに含まれる関数を試すことが推奨されている。詳細はブログポストを参照のこと。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
