SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

テキスト・ネットワーク分析統合プラットフォームを学ぶ(AD)

テキスト・ネットワーク分析統合プラットフォーム
第2回:分析アプリケーションおよびTENA APIの使い方

TENAが実現する分析アプリケーションの実例

  • このエントリーをはてなブックマークに追加

行動履歴に基づいたブログサポーター機能

 ブログサポーター機能は、あるブログを書いているブロガーのブログに対する行動やコメントの内容などから、ブロガーの熱心なファンである度合いを算出し、ランキングするアプリケーションです。このアプリケーションでは、ブロガーがブログを書いてから読者が読むまでの時間、コメント履歴とその内容、ブロガーと読者の近さなど、いろいろな観点からファン度合いを表すスコアが計算され、最終的にはこれらのスコアを統合することによってランキングが決定します。

 このアプリケーションでは、ブログ推薦と同様に2部グラフなどの分析フレームワークを用いてスコアを求める手法と、直接TENAコモンストアにアクセスして情報を取得しスコアを求める手法と2種類あります。TENAコモンストアには、ソーシャル・コンピューティング上のすべての情報が、抽象的なネットワーク構造として蓄積されています(TENAコモンストアのデータ構造の詳細については、前回の記事を参考にしてください)。ここでは、コメント履歴とその内容を基にしてスコアを計算する方法を例にとり、どのようにして「ブログサポーター度」を計算しているかを説明します。

ブログサポーター度:計算例

 図2にブログサポーターの計算例を示します。ここでは、あるブロガーAに対してのブログサポーター度を計算しているとします。まず、ブロガーAのブログのテキストコンテンツノードを取得します。これは、ブロガーAのノードを取得し、Outlinkの中から[LinkType:書く]で終点がテキストコンテンツノードであるものを取得すればよいわけです。同様に、ブログコンテンツに対してコメントをしている「コメントノード」を取得し、各コメントに対してコメントをした読者のノードを取得します。そのコメントのタイミング(ブログコンテンツが作成されてからコメントが作成されるまでの時刻)と内容の重なり(ブログコンテンツとコメントのキーワードの重なり)から、各読者のブロガーAに対するブログサポーター度が計算されます。

図2 ブログサポーター度の計算
図2 ブログサポーター度の計算

ブログサポーター度の分散によるファン分布の比較

 ブログサポーターでは、各ブロガーのファンのランキングを取得するだけではなく、そのブロガーのファンがどのような性質を持っているのか、またそのファンの数はどのくらいか、といったことを知ることができます。例えば、閲覧によるスコアが高い人は多いが、ブロガーと関連した内容のブログを書いているのかという観点でのスコアは低いといった場合、そのブロガーは閲覧数の割には影響力が低いのではないか、といった推察をすることができます。

 また、一般的にブログサポーター度は図3に示すように点数が高くなるほど人数が少なくなる傾向にあります。ブログサポーター度に基づいて、ブログの読者をA,B,Cといったクラスわけを行えば、ブロガー同士の熱心なファンの数字の比較を行うことが可能になります。

図3 ブログサポーター度による読者のクラスわけの例:
(横軸はスコア、縦軸は読者の数を示す)
図3 ブログサポーター度による読者のクラスわけの例:(横軸はスコア、縦軸は読者の数を示す)

 このように、ブログサイトにおけるブロガーの真の人気を計ることのできる機能は、次の章で紹介するようなサイトオーナー様向けのアプリケーションの一つとして捉えることができるでしょう。

次のページ
ネット上での議論を分析する:オンラインディスカッション分析

この記事は参考になりましたか?

  • このエントリーをはてなブックマークに追加
テキスト・ネットワーク分析統合プラットフォームを学ぶ連載記事一覧
この記事の著者

村上 明子(ムラカミ アキコ)

日本アイ・ビー・エム(株)東京基礎研究所 主任研究員1999年日本アイ・ビー・エム(株)入社。以後、同社東京基礎研究所において自然言語処理の研究に従事。テキスト・マイニング・ツールIBM TAKMIの研究開発において、品詞管理や辞書作成などを担当した。昨今では、電子メールや掲示板など人と人のコミュニケーションの文書を対象としたコミュニケーション分析をなどを行っている。ほかに著書として「チャンス発見の情報技術(東京電機大学出版)(共著)」、訳書として「Google Hacks 第2版、第3版(オライリージャパン)(共訳)」がある。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/4427 2009/09/24 16:33

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング