CodeZine(コードジン)

特集ページ一覧

Google、多彩なデータソースへの接続が可能なデータ検証ツールを発表

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2021/07/28 09:00

 米Googleは、さまざまな環境で検証を行うための、自動化された反復可能なソリューションを提供する、オープンソースのPython CLIツール「Data Validation Tool」(DVT)を、7月22日(現地時間)に発表した。

 Data Validation Toolは、Ibisフレームワークを使用しており、BigQuery、Cloud Spanner、Cloud SQL、Teradataといった、多様なデータソースへの接続に対応している。

 さらに、Cloud Composer、Cloud Functions、Cloud Runといった、他のGoogle Cloudサービスと簡単に統合できる。

 サポートする接続タイプは以下の通り。

  • BigQuery
  • Cloud SQL
  • FileSystem(GCS、S3、ローカルファイル)
  • Hive
  • Impala
  • MySQL
  • Oracle
  • Postgres
  • Redshift
  • Snowflake
  • Spanner
  • SQL Server
  • Teradata

 テーブルレベルの検証ではテーブルの行数、行数によるグループ化、列の集計、フィルタと制限、列レベルの検証ではスキーマ/列のデータ型、行レベルの検証ではハッシュ比較(BigQueryのみ)、Raw SQL探索ではさまざまなデータソースでのカスタムクエリの実行を行える。

関連リンク

  • LINEで送る
  • このエントリーをはてなブックマークに追加

あなたにオススメ

All contents copyright © 2005-2021 Shoeisha Co., Ltd. All rights reserved. ver.1.5