はじめに
「人類が使うすべての情報を集め整理する」
この壮大なミッションを掲げ設立されたGoogleは、そのミッションを遂行するべく、マシン・ネットワークなどのインフラ環境に莫大な金額を投資し、独自の技術を開発し続けています。Googleは検索エンジンだけにとどまらず、Gmail、Google Calendar、Google Maps、Google Analystics、Youtube、Google Apps、Google Earthなど、いまや全世界のユーザーが使用するサービスをリリースしており、その扱うデータ量、アクセス数は天文学的な数になることが予想されます。Googleはそれらのデータ量、アクセス数を高速にさばき、なおかつ耐障害性の高いスケーラブルな大規模分散システムを構築しています。
そんな中、2008年4月にGoogle App Engineがリリースされました。Googleが巨額を投じて構築したスケーラブルなインフラ環境の上で、開発したアプリケーションを無料で公開することができるということで、Google App Engineは、世界中のエンジニアに瞬く間に注目を浴びました。本稿の前編では、主にGoogle App Engineの概要と特徴、そしてWebシステムをスケールするための手法、考え方について説明します。中編・後編では、Google App Engine上で動作する、twitterと連携したアプリケーションを紹介し、Google App Engine上でのアプリケーション構築方法について説明します。
対象読者
- Google App Engineに興味がある方
- Webアプリケーション構築の経験がある方
- Googleに興味がある方
Google App Engineの特徴
Google App Engineの特徴を以下にあげてみます。
- 自動スケーリング・負荷分散。
- Key-Value StoreであるBigtableをデータストアとして使用。
- サーバ構築作業不要。アプリケーションをデプロイするだけで公開できる。
- ある一定のリソース使用量までは、無料で使用できる。有料の場合も、格安の使用料。
- サポートしているプログラミング言語は、PythonとJava
また、JRuby、Groovy、Scala、PHPなどJava VM上で動作する言語もJava版のリリースによってGoogle App Engine上で動作するようになりました。
並列分散によるスケールアウト
Google App Engineの特徴の中でも自動スケーリングは一際目をひきますが、その具体的な話に入る前に、まずは一般的なWebシステムをスケールさせる方法について考えてみることにします。
簡易なWebシステムのアーキテクチャ
図1に一般的な小規模Webシステムの構成を示しました。
Webサーバ1台、アプリケーションサーバ1台、DBサーバ1台の構成です。システムによっては、Webサーバとアプリケーションサーバが同じサーバということもあるでしょう。図1をスタート地点として、システム全体の性能を向上していくための手法について考えていきます。
スケールアップとスケールアウト
図1のようなシステム構成では、アクセス数やデータ量が増加するにつれ、システムの負荷が高まり、なんらかの手段により、システム全体の処理性能向上が必要となります。その際の処理性能向上のための一般的な考え方として、「スケールアップ」と「スケールアウト」という2つの考え方があげられます。
まずスケールアップとは単純にマシン1台1台の処理性能を高めることにより、性能を向上させる考え方のことをいいます。それに対し、スケールアウトとは、サーバの数を並列に増やすことで、負荷を分散し、システム全体の処理性能を向上させるのがねらいです。
スケールアップは、マシンの性能向上には限界があるので、必然的に性能向上に限界が出てきますが、後者のスケールアウトは、並列にマシンを増やせば、それに比例して性能をアップできることから、スケールアウトできるような設計を用いることがWebシステムの性能向上では、常套手段となってきています。
Webサーバ、アプリケーションサーバのスケールアウト
まずは、Webサーバ、アプリケーションサーバのスケールアウトについて考えてみます。図2に構成を示しました。
Webサーバ、アプリケーションサーバは、並列に同様のサーバを追加することで容易に負荷分散し、システム全体の性能を上げることができます。後に述べるDBサーバのスケールアウトに比べると、容易に実現することができることが特徴です。