Webアプリケーションとして公開しよう
FlaskでWebアプリケーションをつくろう
それでは、Instagramのユーザー名を入力するとそのユーザーの性別を推定するWebアプリケーションを作っていきましょう。まず、アプリケーションのフローを確認します。
- 利用者が性別を判定したいユーザーIDを入力
- ユーザーIDを基にInstagramから対象ユーザーの直近3枚の写真を取得
- 取得した写真を1枚ずつAlchemyAPIに送り、写真に写っている物体をタグとしてを取得
- 推定に用いる特徴量ベクトル(タグ)のみ抽出、特徴量ベクトルの整理(識別期の作成時と同様に不要なタグの削除、タグの統合)
- 整理された特徴量ベクトルを識別器に入力し、性別を推定
このフローに沿ったWebアプリケーションを実装するためにFlaskというPython用Webアプリケーションフレームワークを用います。まずは、こちらを参考にFlaskをインストールしましょう。FlaskでWebサーバを構築する場合は、pythonファイルとテンプレートとしてのHTMLファイルが必要になります。今回のWebアプリケーションの構成は下図のようになっています。詳細は、こちらを参照してください。
まずFlaskが実行されるmain.pyとtemplates/index.htmlおよびtemplates/layout.htmlとの関係を見てみましょう。main.pyでは、Flaskを呼び出してGETリクエストとPOSTリクエストの場合分けなど、サーバの挙動を決めることができます。また、Flaskのrender_template関数で、変数を引数としてtemplates/index.htmlに渡して表示します。templates/内のindex.htmlとlayout.htmlを見てみましょう。index.htmlで、頭でlayout.htmlを呼び出しています。layout.htmlはhead部を、index.html はbody部を宣言します。これらのHTMLファイルで{{ main.py上の変数名 }}とすることで、main.pyの変数を表示することができます。
そして、main.pyで整理された変数をlayout.htmlおよびindex.htmlできれいに表示していきましょう。Webアプリケーションとして公開する以上は、やはり見栄えも気になります。そこで、BootstrapというCSSフレームワークを使います。layout.htmlのhead部でCSSを読み込みます。そして、BootstrapのCSSチュートリアルなどを参考にして、index.htmlでスタイルシートを呼び出します。例えば、index.htmlの11行目では、classを指定することでボタンのデザインをBootstrapから呼び出します。これで、HTMLテンプレートは完成です。
次は、main.pyの処理を見てみましょう。main.pyはサーバの入出力などを制御しています。順に見ていきましょう。
13~41行目:ユーザー名が入力され、受信後の処理(POST応答)を実行します。利用者からInstagramのユーザー名の入力を受け取り、そのユーザー名からそのユーザー情報を呼び出します。ユーザの特徴量部ベクトルを生成し、識別器で性別推定を行います。この部分が主になるのでコードを追って細かく見てみましょう。コード内に(1)~(6)まで番号を振った箇所について、説明します。
if request.method == 'POST': # POST応答 if request.form['message'] == '': #例外処理:ユーザー名未入力時 #………(1)ここから message = "Please input your Instagram User name in the box" return render_template('index.html', title="Your gender?", method=request.method, message=message) #………(1)ここまで else: message = "Your Instagram data" insta = InstagramAPI(access_token=instgram_access_token) user_name = request.form['message'] # ユーザー名を変数に代入 #………(2)ここから user_id = insta.user_id(user_name=user_name) # ユーザー名からユーザーIDを取得 profile_image = insta.profile_image(user_id) # プロフィール画像を取得 user = {'user_name': user_name, 'user_id': user_id, 'image': profile_image} # ユーザー情報をまとめる user_summary = insta.user_info(user=user) #………(2)ここまで # 特徴量ベクトルの整理 ………(3)ここから test = {'nail': 0, 'hair': 0, 'person': 0, 'sport': 0, 'food': 0, 'night': 0, 'coffee': 0, 'wedding': 0, 'cake': 0, 'beer': 0, 'dog': 0, 'animal': 0, 'tree': 0, 'blossom': 0, 'cat': 0, 'flower': 0, 'sky': 0, 'nature': 0, 'cherry': 0, "user_name": "test", "user_id": "test"} X = pd.DataFrame([user_summary, test]).fillna(0) X['animal'] = X['animal']+X['dog']+X['cat'] X['cosme'] = X['hair']+X['nail'] X['nature'] = X['nature']+X['sky']+X['flower']+X['tree']+X['blossom']+X['cherry'] X = X[X['user_name'] == user_name] X = X[['person', 'sport', 'food', 'night', 'coffee', 'wedding', 'cake', 'beer', 'animal', 'nature', 'cosme']] user_vec = X.values.tolist()[0] #………(3)ここまで model_path = os.path.join(os.path.dirname(__file__), "clf/clf.pkl") #………(4)ここから clf = joblib.load(model_path) # 識別器の読み込み #………(4)ここまで result = clf.predict(user_vec) # 性別推定 ………(5) return render_template('index.html', title="Your gender?", method=request.method, userinfo=user_summary, result=result, message=message) #………(6)
(1)14~16行目:ユーザー名が空だった場合はエラーとなってしまいますの、エラー処理を実行します。入力されたユーザー名が空でない場合に、17~41行目のelse部の処理を実行します。
(2)20~24行目:APIで取得したユーザー名やアイコンなどユーザーの基本的な情報を整理して、各変数に代入しています。
(3)25~35行目:識別器をつくった際の処理と同様にタグを結合させるなどして、ユーザーの特徴量ベクトルを計算しています。
(4)37、38行目:識別器ファイルclf.pklを読み込みます。
(5)39行目:特徴量ベクトルを識別器に渡し、推定した値(0・1)を返します。この値は、index.html上で1ならばmale、0ならばfemaleと表示されるようにしています。
(6)41行目:ユーザー情報や、推定結果などの各変数をFlaskのHTMLテンプレートに渡します。
そして、49~51行目でFlaskによるWebサーバーを起動します。このPythonファイルのメイン部です。main.pyの他にも、Webアプリケーションとして実行するためにInstagram APIとAlchemyAPIを呼びたすapi.pyや、これらのAPIを使うためにInstagram APIのアクセストークンとAlchemyAPIのAPIキーをそれぞれOSの環境変数から読み込むsettings.pyが必要になります。
また、今回はローカルPCにあるUbuntuでmain.pyを実行('python main.py')し、そのUbuntuの5000番ポートにWindowsからアクセスしてみます。同様にしてAWS EC2やHerokuで実行して、ブラウザでアクセスすることも可能です。
まとめ
Instagramのユーザー名からそのユーザーが過去に投稿した写真を取得して、AlchemyAPIを用いてユーザーの特徴量ベクトルと計算して、作成したモデルによって性別推定を行うWebアプリケーションを開発しました。その際に、機械学習部分ではscikit-learn、Webアプリケーション部分ではFlaskを用いて開発を進めました。どちらも、今回の開発ではほんの一部の機能しか使っていませんが、それでもこれだけのアプリケーションを開発することができます。5日間という短い期間で初めて機械学習技術を活用したWebアプリケーションの開発を行いました。推定精度も見栄えもそれほど良いわけではありませんが、考えたものを一度形にすることで、「もっとこうしてみよう!」というアイデアが不思議と湧いてきて面白かったです。
このアプリケーションのソースコードはすべて私のGitHubで公開していますので、参照してみてください。
参考資料
今回の開発および記事を書くにあたって参考にしたものを紹介させていただきます。
『Pythonで機械学習アプリケーションの開発環境を構築する』や、scikit-learnで機械学習を始めるチュートリアルが書かれているscikit-learn-notebook、『機械学習を利用したアプリケーション開発をはじめよう(自習編)』などを参考にさせていただきました。