SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

近未来の技術トレンドを先取り! 「Tech-Sketch」出張所

写真共有SNSのユーザーの性別を機械学習で推定するWebアプリケーションをPythonで作ってみよう

近未来の技術トレンドを先取り! 「Tech-Sketch」出張所 第21回

  • X ポスト
  • このエントリーをはてなブックマークに追加

Webアプリケーションとして公開しよう

FlaskでWebアプリケーションをつくろう

 それでは、Instagramのユーザー名を入力するとそのユーザーの性別を推定するWebアプリケーションを作っていきましょう。まず、アプリケーションのフローを確認します。

  1. 利用者が性別を判定したいユーザーIDを入力
  2. ユーザーIDを基にInstagramから対象ユーザーの直近3枚の写真を取得
  3. 取得した写真を1枚ずつAlchemyAPIに送り、写真に写っている物体をタグとしてを取得
  4. 推定に用いる特徴量ベクトル(タグ)のみ抽出、特徴量ベクトルの整理(識別期の作成時と同様に不要なタグの削除、タグの統合)
  5. 整理された特徴量ベクトルを識別器に入力し、性別を推定

 このフローに沿ったWebアプリケーションを実装するためにFlaskというPython用Webアプリケーションフレームワークを用います。まずは、こちらを参考にFlaskをインストールしましょう。FlaskでWebサーバを構築する場合は、pythonファイルとテンプレートとしてのHTMLファイルが必要になります。今回のWebアプリケーションの構成は下図のようになっています。詳細は、こちらを参照してください。

図 Webアプリケーションのソース構成
図 Webアプリケーションのソース構成

 まずFlaskが実行されるmain.pyとtemplates/index.htmlおよびtemplates/layout.htmlとの関係を見てみましょう。main.pyでは、Flaskを呼び出してGETリクエストとPOSTリクエストの場合分けなど、サーバの挙動を決めることができます。また、Flaskのrender_template関数で、変数を引数としてtemplates/index.htmlに渡して表示します。templates/内のindex.htmlとlayout.htmlを見てみましょう。index.htmlで、頭でlayout.htmlを呼び出しています。layout.htmlはhead部を、index.html はbody部を宣言します。これらのHTMLファイルで{{ main.py上の変数名 }}とすることで、main.pyの変数を表示することができます。

図 Flask(Pythonファイル)とHTMLファイル間のやりとり
図 Flask(Pythonファイル)とHTMLファイル間のやりとり

 そして、main.pyで整理された変数をlayout.htmlおよびindex.htmlできれいに表示していきましょう。Webアプリケーションとして公開する以上は、やはり見栄えも気になります。そこで、BootstrapというCSSフレームワークを使います。layout.htmlのhead部でCSSを読み込みます。そして、BootstrapのCSSチュートリアルなどを参考にして、index.htmlでスタイルシートを呼び出します。例えば、index.htmlの11行目では、classを指定することでボタンのデザインをBootstrapから呼び出します。これで、HTMLテンプレートは完成です。

 次は、main.pyの処理を見てみましょう。main.pyはサーバの入出力などを制御しています。順に見ていきましょう。

 13~41行目:ユーザー名が入力され、受信後の処理(POST応答)を実行します。利用者からInstagramのユーザー名の入力を受け取り、そのユーザー名からそのユーザー情報を呼び出します。ユーザの特徴量部ベクトルを生成し、識別器で性別推定を行います。この部分が主になるのでコードを追って細かく見てみましょう。コード内に(1)(6)まで番号を振った箇所について、説明します。

if request.method == 'POST': # POST応答
    if request.form['message'] == '': #例外処理:ユーザー名未入力時 #………(1)ここから
        message = "Please input your Instagram User name in the box"
        return render_template('index.html', title="Your gender?", method=request.method, message=message) #………(1)ここまで
    else:
        message = "Your Instagram data"
        insta = InstagramAPI(access_token=instgram_access_token)
        user_name = request.form['message'] # ユーザー名を変数に代入 #………(2)ここから
        user_id = insta.user_id(user_name=user_name) # ユーザー名からユーザーIDを取得
        profile_image = insta.profile_image(user_id) # プロフィール画像を取得
        user = {'user_name': user_name, 'user_id': user_id, 'image': profile_image} # ユーザー情報をまとめる
        user_summary = insta.user_info(user=user) #………(2)ここまで
        # 特徴量ベクトルの整理 ………(3)ここから
        test = {'nail': 0, 'hair': 0, 'person': 0, 'sport': 0, 'food': 0, 'night': 0, 'coffee': 0,
                'wedding': 0, 'cake': 0, 'beer': 0, 'dog': 0, 'animal': 0, 'tree': 0, 'blossom': 0,
                'cat': 0, 'flower': 0, 'sky': 0, 'nature': 0, 'cherry': 0, "user_name": "test", "user_id": "test"}
        X = pd.DataFrame([user_summary, test]).fillna(0)
        X['animal'] = X['animal']+X['dog']+X['cat']
        X['cosme'] = X['hair']+X['nail']
        X['nature'] = X['nature']+X['sky']+X['flower']+X['tree']+X['blossom']+X['cherry']
        X = X[X['user_name'] == user_name]
        X = X[['person', 'sport', 'food', 'night', 'coffee', 'wedding', 'cake', 'beer', 'animal', 'nature', 'cosme']]
        user_vec = X.values.tolist()[0] #………(3)ここまで

        model_path = os.path.join(os.path.dirname(__file__), "clf/clf.pkl") #………(4)ここから
        clf = joblib.load(model_path) # 識別器の読み込み #………(4)ここまで
        result = clf.predict(user_vec) # 性別推定 ………(5)

        return render_template('index.html', title="Your gender?", method=request.method, userinfo=user_summary, result=result, message=message) #………(6)

 (1)14~16行目:ユーザー名が空だった場合はエラーとなってしまいますの、エラー処理を実行します。入力されたユーザー名が空でない場合に、17~41行目のelse部の処理を実行します。

 (2)20~24行目:APIで取得したユーザー名やアイコンなどユーザーの基本的な情報を整理して、各変数に代入しています。

 (3)25~35行目:識別器をつくった際の処理と同様にタグを結合させるなどして、ユーザーの特徴量ベクトルを計算しています。

 (4)37、38行目:識別器ファイルclf.pklを読み込みます。

 (5)39行目:特徴量ベクトルを識別器に渡し、推定した値(0・1)を返します。この値は、index.html上で1ならばmale、0ならばfemaleと表示されるようにしています。

 (6)41行目:ユーザー情報や、推定結果などの各変数をFlaskのHTMLテンプレートに渡します。

 そして、49~51行目でFlaskによるWebサーバーを起動します。このPythonファイルのメイン部です。main.pyの他にも、Webアプリケーションとして実行するためにInstagram APIとAlchemyAPIを呼びたすapi.pyや、これらのAPIを使うためにInstagram APIのアクセストークンとAlchemyAPIのAPIキーをそれぞれOSの環境変数から読み込むsettings.pyが必要になります。

 また、今回はローカルPCにあるUbuntuでmain.pyを実行('python main.py')し、そのUbuntuの5000番ポートにWindowsからアクセスしてみます。同様にしてAWS EC2やHerokuで実行して、ブラウザでアクセスすることも可能です。

図 起動直後の画面
図 起動直後の画面
図 ユーザー名"yiori_s"を入力した時の結果画面
図 ユーザー名"yiori_s"を入力した時の結果画面

まとめ

 Instagramのユーザー名からそのユーザーが過去に投稿した写真を取得して、AlchemyAPIを用いてユーザーの特徴量ベクトルと計算して、作成したモデルによって性別推定を行うWebアプリケーションを開発しました。その際に、機械学習部分ではscikit-learn、Webアプリケーション部分ではFlaskを用いて開発を進めました。どちらも、今回の開発ではほんの一部の機能しか使っていませんが、それでもこれだけのアプリケーションを開発することができます。5日間という短い期間で初めて機械学習技術を活用したWebアプリケーションの開発を行いました。推定精度も見栄えもそれほど良いわけではありませんが、考えたものを一度形にすることで、「もっとこうしてみよう!」というアイデアが不思議と湧いてきて面白かったです。

 このアプリケーションのソースコードはすべて私のGitHubで公開していますので、参照してみてください。

参考資料

 今回の開発および記事を書くにあたって参考にしたものを紹介させていただきます。

 『Pythonで機械学習アプリケーションの開発環境を構築する』や、scikit-learnで機械学習を始めるチュートリアルが書かれているscikit-learn-notebook、『機械学習を利用したアプリケーション開発をはじめよう(自習編)』などを参考にさせていただきました。

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
近未来の技術トレンドを先取り! 「Tech-Sketch」出張所連載記事一覧

もっと読む

この記事の著者

yiori(yiori)

2015年現在、大学院修士2年生です。大学院では教育工学を専門として学んでいますが、学部時代は情報系学部に所属し、データ分析やソフトウェアに興味があります。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/8953 2015/09/29 14:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング