Azure Synapseでペタバイト級のデータ分析を実施する企業が増加中
データプラットフォームとしてのAzureの主要な強みとなるのが、データをビジネスの戦略的な資産とすることができる分析とAIの能力、それからビジネスニーズに応えるデータのガバナンスだ。この2つをより詳しく見ていこう。
まずは分析とAI。先述したように、Azure Synapseはビッグデータ分析、データウェアハウス、企業のデータインテグレーションを統合し、1つのサービスとして提供する。クラウドネイティブの分析プラットフォームであり、開発のライフサイクル全体をカバーしているのも特徴だ。Microsoft Azure Data担当副社長のローハン・クマー(Rohan Kumar)氏は競合サービスに比べてAzure Synapseは「最大で14倍高速で、94%安価」と強調する。
プラットフォームとして統合することで、運用がシンプルになることも期待できる。例えばデータのインジェスト(取り込み)、クレンジング、変換、あるいはセキュリティの許可をユーザーに与えるなど、単調だが運用に必要なタスクを簡単かつ直感的に処理できるようになる。
サービスモデルが柔軟であるのも新たな特徴だ。サービスモデルには「サーバレス(Serverless)」と「専有ホスト(Dedicated)」の2種類があり、これをAzure Synapseはコスト効果が高いほうを自動的に選択して実行する。ユーザーがどちらかを選ぶ必要はない。
マイクロソフトの既存サービスと深く統合され、利便性も高まるだろう。実際にAzure Synapseを使うには、AzureポータルからAzure Synapse Analyticsのワークスペースを作成してから、Synapse Studioを起動する。Synapse Studioからは直接Power BIを使えるだけではなく、自動でクエリー最適化が行われる。またAzure Machine Learningレジストリから直接Azure Synapseにデプロイできる。ここでデータを移動する必要はない。
分析のデータと運用上のデータの隔たりを埋めることは長年の課題となっている。その解決策として出されたのがAzure Synapse Link。データがあるところからAzure Synapseへデータを橋渡しする。ETL不要、データベース側に負荷をかけることなく、ほぼリアルタイムの分析や洞察を得ることができる。現時点ではAzure Synapse Linkが使えるのはAzure Cosmos DBで、近いうちにSQL Databaseでも利用可能となる予定。
クマー氏によると2019年にAzure Synapseが発表になって以来、ペタバイト級のワークロードを稼働させるユーザーは500%増加したという。Azure Synapseは大規模なデータをビジネスで活用するための土台となっていきそうだ。
続いてデータのガバナンス。「私たちはデータガバナンスをデータアクセスの民主化ととらえています」とクマー氏は言う。マイクロソフトはデータがどこにあろうと、ユーザーが自社のデータをビジネスの戦略的な資産へと変換できることを目指し、Azure Purviewを発表した。
クマー氏は事例としてポンプ製造の「グルンドフォス(Grundfos)」を紹介した。同社はAzure Purviewを全社的に活用し、社内の誰でもデータを活用できるような環境にしている。Azure Purviewで数十億ものデータ資産をスキャンして分類し、今では1万6000ものPower BIワークスペースがあるという。
他にもデータ分析に関する数々の事例が紹介された。ファストファッションのスタートアップ「ミントラ(Myntra)」は顧客それぞれにカスタマイズしたおすすめを提供するために数千万セッションを運用し、小売の「ウォルグリーン・ブーツ・アライアンス(Walgreen Boots Alliance)」は2億もの品目の予測を毎日実施している。ヘルスケアの「フィリップス(Philips)」では病院や集中治療室にいる入院患者のバイタルサインや薬のオーダーなどのデータを収集することで、病気の致死率や治療期間や費用などの予測に役立てている。
ナデラ氏は言う。「2020年を振り返ると、(パンデミックで)100%回復できるレジリエンスを持つ企業はないと分かります。しかし何が起きているか理解し、予測できて、リアルタイムに行動するために準備している企業がより早く回復できて、今後強くなれることでしょう」