はじめに
Google App EngineはGoogleのインフラを使用し、開発したアプリケーションをインターネットで公開できるサービスです。Google App Engineの特徴はアクセスや負荷に応じてシステムが自動にスケールする仕組みと、Google独自のスケーラブルなデータベースであるBigtableを使用できることです。BigtableはKey-Value方式のデータベースで、ペタバイト級のデータを扱うことができます。そのようなスケーラブルな環境を使用できるのですから、大量のアクセスや大量のデータを扱うアプリケーションのインフラとしてGoogle App Engineを使用することで、その潜在能力を活かしてみたいところです。
本稿の前編では、Webシステムをスケールさせるための一般的な手法や考え方、そしてGoogle App Engineの概要と特徴について説明しました。中編となる本稿ではミニブログサービスのTwitterとGoogle App Engineを連携させるレコメンドアプリケーションの設計について説明し、後編では実装編として実際のソースコードに基づき説明します。
対象読者
- Google App Engineに興味がある方
- Webアプリケーション構築の経験がある方
- Googleに興味がある方
必要な環境
本稿のアプリケーションは以下の環境で検証しています。(Google App Engineが2010年1月9日現在、サポートしているpythonのバージョンは2.5です)
- Windows XP
- Google App Engine SDK 1.3.0
- Python 2.5
アプリケーション全体の概要
本稿で紹介するアプリケーションは、Twitterのユーザーで、自分と嗜好が似ているオススメユーザーを表示してくれるレコメンドアプリケーションです。図1にアプリケーション全体の概要を示します。
図1に示すようにアプリケーションの処理は、Twitter APIからユーザーデータを取得する処理と、オススメユーザーを画面に表示する処理の2つの部分から構成されます。それぞれの処理の内容については後述します。
Twitterとは
Twitterは、ミニブログと呼ばれるサービスで、会員同士がつぶやきと呼ばれる140文字以内の投稿をすることでコミュニケーションを図ったり、情報を収集したりすることできるWebサービスで、世界中で多くの人たちが利用しています。
Twitterでは、サイト内のつぶやき情報などを取得できる手段としてAPIを提供していて、Twitter内のデータを外部のアプリケーションが利用できるような仕組みを用意しています。本稿のアプリケーションもこのTwitter APIにアクセスしてデータを取得し、アプリケーションで使用します。またTwitterでは、気になるユーザーがいたらフォローすることができ、フォローすると、そのユーザーのつぶやきが自分のタイムラインと呼ばれるインターフェイスに表示されるようになります。図2にTwitterのフォローの概念について示しました。
Twitterでは、自分がフォローしているユーザーのことを「friends」、自分のことをフォローしているユーザーのことを「followers」と言います。本稿のアプリケーションでは「friends」の関係を使用します。