Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

技術のオープン化が加速する、マイクロソフトのデータプラットフォーム最新事情【デブサミ2018】

【15-B-4】Microsoft Data Platform 最新アップデート ~ 遂にCassandra、MariaDB、Spark まで? ~

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2018/03/09 14:00

目次

NoSQLの「Azure Cosmos DB」は惑星規模のアプリでも使えるデータベース

 マイクロソフトではNoSQLも用意している。それが「Azure Cosmos DB」である。「名前からもわかるとおり、惑星規模のアプリでも使えるデータベース。『惑星規模のアプリなどは作らないぞ』という人も大丈夫。小さなアプリでも活用できる」と、井上氏は笑いを交えて紹介した。

 特長はマルチモデル、マルチAPIであること。Cosmos DBは人気があり、すでにさまざまなプロジェクトで活用されているという。APIの中で特に活用されているのはJSONを格納できるDocumentDBというSQL。そのほかにもMongoDBのAPI、GremlinというグラフのAPIなどが提供されている。またコネクターはApache Sparkに簡単に接続できるコネクターを提供している。

 さらに最近、追加されたのが、Apache Cassandra API。「Cassandraはクラスタを管理するのが大変だったが、Cosmos DBはフルマネージドなので、インフラをほぼ意識しなくていい」と井上氏。Cosmos DBはターンキー形式で世界中にデータを分散配置できる。

 もちろん先述したとおり、小さなデータなので東日本のリージョンしか使わないといったこともできるうえ、ペタバイト級で1秒間に数100万トランザクションのデータでもグローバル分散できるので、容易に扱うことができる。しかも「Azure内で唯一、低レイテンシーの保証がある」と井上氏。同一リージョンで読み書きを行った時の速度は1KBの読み取りに関しては50%以上のリクエストは2ミリ秒以下、99%の以上は10ミリ秒以下、書き込みも50%以上は6ミリ秒以下、99%以上の場合は15ミリ秒以下といった具合だ。

 Azure Cosmos DBは整合性モデルを5つサポートしている。「Cosmos DBの基盤について詳しく知りたい方は、Dr.Leslie LamportがYouTubeで熱く語っているので、ぜひ見てほしい」と井上氏はチャンネルを紹介。ちなみにDr.LamportはLaTeXの開発者。マイクロソフトリサーチで研究に従事しており、2013年にはチューリング賞も受賞した人物である。Cosmos DBはInfoWorld 2018でTechnology of the Yearを受賞。「かなり先進的なデータベースとして取り上げられている」と井上氏は話した。

 Cosmos DBの使い方もデモで紹介。こちらも先のサービス同様、Azure管理ポータルからCosmos DBを選択するところから始まる。IDを入れてAPIを選択すると、Cosmos DBのデプロイが始まる。世界地図をクリックすると、惑星規模でデータを分散できるようになる。「アメリカやインド、アジアなど、どこでもクリックしてOKするだけで、データを世界中に分散配置できる」と井上氏。コレクション単位で課金や性能が決まる。キャパシティは10GBかアンリミテッドとなっている。

Azure Cosmos DBは世界中にデータを分散できる
Azure Cosmos DBは世界中にデータを分散できる

 「Azure Databricks」も紹介。DatabricksはSparkを作っていたエンジニアがスピンアウトして作った会社であり、製品である。Azureと冠がついていることからわかるが、「マイクロソフトがファーストパーティとして提供している」と井上氏。つまりサポートや、課金、アップデートの責任をマイクロソフトが負う。またApache Sparkがフルマネージドの形で動くようになっているのも特長だ。

 「従来、Sparkを環境や運用の保持が大変だったが、Databricksを使うと、それが容易になるのでSparkが使いやすくなる。Azureの他のサービスと連携しやすいのもメリットの1つ」(井上氏)

 DatabricksのCollaborative Workspaceではデータエンジニアとデータサイエンティスト、ビジネスアナリストの3者のコラボレーションが容易になる。

 実際に動かし方をデモで紹介。これもAzure管理ポータルから利用できる。「Workspaceの名前を設定し、『Launch Workspace』というボタンをクリックすると、DatabricksでSparkを管理する画面が表示される。ここでWorkspaceを作ったり、データやクラスタの管理をしたりする。StandardとServerless、いずれかを選べる。後者を選ぶと運用の手間を省くことができる。Azure HDInsightというマネージドサービスがあるが、それよりもさらにフルマネージドされたSparkのサービスがDatabricksだ」と井上氏は説明する。

 最後に井上氏は次のように参加者に呼びかけ、セッションを締めた。

 「Azure Free Trialだと2万2500円分フリーで使える。1年間ずっとフリーで使えるものもあるので、ぜひ、興味のある人は使ってほしい。また5月22日、23日にde:code 2018を開催する。100を超える濃いセッションが開催される予定。こちらもぜひ参加してほしい」

お問い合わせ

 日本マイクロソフト株式会社



  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

バックナンバー

連載:【デブサミ2018】セッションレポート

もっと読む

All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5