本稿はデータベースソフトウェア「SQL Anywhere」およびデータベース全般に関する英語ドキュメントを翻訳する形で提供しています。図など、部分的に英語のままになっていますが、製品のSQL Anywhere自体は完全に日本語化されていますのでご安心ください。
SQL Anywhereのようなデータベース管理システムの文脈では、どのようなシステムの挙動のことをロバストネスと呼ぶのでしょうか。
この概念自体は非常に単純であるように思われます。このテーマとそれが含むニュアンスを議論するため、私は先週、ドイツ・ワデーンのDagstuhlカンファレンスセンターで開かれたRobust Query Processingについてのワークショップに参加しました。(少なくとも私には)大成功に終わったこのワークショップは、Goetz Graefe(HP Labs)、Arnd Christian Konig(Microsoft Research)、Harumi Kuno(HP Labs)、Volker Markl(Technical University of Berlin)、そしてKai-Uwe Sattler(Technical University of Ilmenau)によって企画・運営されたものです。
ロバストネスを定義すること、そしてその測定基準を作ることは、私が思っていたよりはるかに困難な問題でした。なぜなら、ロバストネスの測定基準はひとえにユーザーの期待であり、そのユーザーの期待は、ただの期待にすぎないからです。この点を明らかにするために、次に示すSystem AとSystem Bについての仮定的パフォーマンスカーブを見てください。
このグラフは、もともとHP LabsのAwny Al-Omariが黒板に書いたもので、パフォーマンスに関する仮定的なベンチマーク結果を表しています。グラフのY軸はシステムスループット(1秒あたりの完了要求の数で測定)を表し、X軸は経過時間を表しています。このベンチマークのワークロードは時間の経過とともに増加するので、2つのカーブの出だしはシステムの「ウォーミングアップ」の段階に当たります。
注目すべき3つの箇所に印を付けました。
- 緑の丸の部分は、パフォーマンスカーブにおいてSystem AがSystem Bより常に高いスループットを提供している範囲です。ワークロードが時間の経過とともに増加し続けるという筋書きにもかかわらず、この「スイートスポット」では、両システムとも比較的一定のスループットを提供しています。これはワークロードマネージメントなどの技術によってスラッシングを回避しているためです。
- 青い丸の部分は、ワークロードマネージメント技術がシステムのオーバーロードを防ぎきれなくなったときにSystem Aが陥る険しい「崖」を示しています。ここでは深刻なスラッシングが起こり始め、システムスループットが大幅に低下しています。
- 赤い丸の部分は2つのことを示しています。第一に、System Bのパフォーマンスカーブは時間経過に伴うシステムロードの増加に対して、System Aよりも緩やかな下降線を描いています。第二に、System Bのパフォーマンスの下降はSystem Aよりも後に始まっています。つまり、このテストでは、System BのワークロードマネージメントはSystem Aより長時間にわたって高水準のスループットを維持することができました。
では問題の核心に迫りましょう。このデータベースシステムAとBでは、どちらの方がよりロバストなのでしょうか? またどちらがより良いシステムなのでしょうか? ユーザーであるあなたは、高いパフォーマンス(つまりSystem A)と優れたロバストネス(大方の意見はSystem Bでしょう)を天秤にかけた場合、ロバストネスをどの程度重視するでしょうか?
これらは興味深い質問であり、ワークショップの期間中、我々もなんとか答えを出すべく果敢に取り組み、いくつかのグループはそれなりに成果を上げました。このワークショップの内容から、ベンチマーク、特にミックスワークロードにおけるベンチマークの提案書がまとめられるでしょう。これはデータベースベンダがより優れたロバストネスを提供するシステムを設計する際に役立つと思われます。
このワークショップについては、別の投稿で引き続き取り上げたいと思います。