SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

テキスト・ネットワーク分析統合プラットフォームを学ぶ(AD)

テキスト・ネットワーク分析統合プラットフォーム
第2回:分析アプリケーションおよびTENA APIの使い方

TENAが実現する分析アプリケーションの実例

  • X ポスト
  • このエントリーをはてなブックマークに追加

ネット上での議論を分析する:オンラインディスカッション分析

 ネット上での情報発信には、ブログのように自分の領域で自分の意見を発信する他に、掲示板のようなパブリックな場所へ意見を書き込むといった方法もあります。ブログに比べ、掲示板などでは同じ目的や話題を持った人たちが集まり、お互いの情報によりよい意見としてまとまったりすることがあります。このような掲示板は、人とコンテンツの関係のほかに、コンテンツ同士の関係(返答や時系列など)を持ちますので、関係を扱うことが特徴のTENAによる分析が有効です。ここでは、オンラインディスカッションの一つである、Jamを分析するJam分析機能を紹介しましょう。

大規模オンラインディスカッション:Jam

 IBMではオンラインで行うディスカッションを数多く開催しています。オンラインディスカッションの中には、全世界100以上、15万人以上が参加するものもあり、3-4日間という短い間に数万の発言が投稿されます。IBMではこのようなオンラインディスカッションをJamと呼んでいます。過去に開催されたJamの詳細や今まで行われた分析はこちらこちら(PDF)に詳しく記載されています。

Jam分析ツール:JASMIN(Jam AnalysiS and MINing)

 Jamは全世界にわたって開催されるため、前日に発言した内容が次の日の朝には大きな議論となって発展していたり、前の日に注目していた話題に返答が付きすぎて話題についていけなくなったりといった現象がおきてしまいます。2008年に開催されたInnovationJamでは、議論にアドバイザーとして参加する人や、議論を調停する役割の人など、Jamの運営側が議論の中身を理解するためにJASMIN(Jam AnalysiS and MINing)というツールを用いました。JASMINはテキストマイニングの技術(ICA:前回の記事参照)とTENAの技術を統合して作られたツールです。Jamでは、発言に対する返答でまとめられた一連の議論をスレッドと呼んでいますが、スレッドにおいて議論の流れや、スレッドに関連する情報を可視化するところでTENAが使われています。

 図4はJASMINのスレッド可視化ツールを示しています。スレッド表示の右には、このスレッドと関連の深いスレッドが表示されています。これは、このスレッドに書き込んだ人たちが書き込んだ他のスレッドです。この出力もTENAによって計算されたもので、「協調フィルタリング」と呼ばれる手法を用いたものです。この協調フィルタリングは、手法として前章で述べたネットワーク分析によるブログ推薦とよく似ています。

図4 JASMIN スレッド可視化ツール
図4 JASMIN スレッド可視化ツール

 中央には、ノードを一つのJamの発言、リンクを返答構造である木構造として、スレッドが視覚化されています。ノードの大きさは、次節で解説する手法で計算された「重要度」を示しています。スレッド表示の左側には、その重要度順に発言がリストされています。このリストあるいはスレッドのノードをクリックすることにより、発言のテキストが左下に表示されます。

 次節ではTENAの技術を用いてこの重要度をどのように求めるのか、詳しく解説します。

発言の重要度の計算方法

 Jamのデータは、発言および発言を行った人をノードとして扱います。また、人と発言は「書く」というリンク、発言と発言は返答関係というリンクとして扱います。テキストノードだけをこのデータから取り出すと、Jamでは同じ発言に複数の返答を付けられるため、構造は一つの発言から広がる木構造となります。これがJamでのスレッドに値します。

 このような構造とテキストの内容から、どの意見が参加者によって重要とみなされたかを計算することができます。まず、テキスト中から抽出された意見などの表現を抽出し、それに基づいてその発言が返答元に対し「賛成」あるいは「反対」しているかどうか判断します(賛成、反対以外の表現も用いますがここでは説明しません)。また、発言自身の内容より、その発言自身の価値も求めておきます。多くの人に「賛成」された意見は重要、「反対」された意見は重要ではないという指標に基づき、再帰的に重要度を計算します。

 重要度の計算について図5に示します。この図の例では、発言3には「賛成」2つ(発言6および7)、「提案」1つ(発言8)の計3つ返答があります。それぞれの返答には返答がないため、発言3の最終的な価値は発言6,7の価値に賛成の係数(価値を発言元に伝えるため正の値)を掛けたもの、および発言8の価値に提案の係数を掛けたもの、および発言3自身の価値、すべてを足したものになります。それを新しい発言3の価値として、発言1の価値を求めるといった方法で、最終的にすべての発言の価値、すなわち重要度を計算します。反対意見の場合、返答もとの価値を下げるという意味ですから、係数は負の値になります。重要度の詳しい計算方法について詳しく知りたい場合は、こちらを参照してください。

図5 Jamにおける発言の重要度の計算方法
図5 Jamにおける発言の重要度の計算方法

テキスト・ネットワーク分析プラットフォーム:今後の展望

 TENAで扱うデータ構造および分析フレームワークを用いれば、ソーシャル・コンピューティングに対するさまざまな分析アプリケーションを構築することが可能になります。今回は主にインターネット上におけるソーシャル・コンピューティング上でのアプリケーションを取り上げましたが、今後はエンタープライズにおけるソーシャル・コンピューティングの利用も多く考えられます。

エンタープライズにおけるソーシャル・コンピューティングの役割

 現在、ブログやコミュニティといったSNSの要素が、社内のナレッジ共有のツールとして浸透しつつあります。IBMでは、Lotus Connectionsというブログ、プロフィール、ブックマーク共有、アクティビティ管理、コミュニティ、wikiといったソーシャルコンピューティング・ソフトウエアの統合プラットフォームを提供しており、情報共有のみならず知的共同作業やタスク管理といった用途にまでその可能性を広げています(Lotus Connectionsについての詳しい情報はこちらこちら、またはこのページなどをご覧ください)。TENAの技術を用いることにより、Lotus Connectionsでのユーザーの行動を、コンテンツを含めて分析することが可能になります。それにより、例えば、社内で役員が発信したメッセージがどのくらい浸透しているのか知ることができたり、社内で同じ興味を持つ社員を理解してプロジェクトのチーミングに役立てたりすることができます。ソーシャル・コンピューティングをエンタープライズで活用するには、ただ情報共有の場としてツールを用意するだけではなく、そのツールの上での情報(コンテンツ、行動履歴共に)活用することを視野にいれることにより、ツールの利用率の向上や、導入によるビジネスへの効果を期待することができるようになるでしょう。

終わりに

 この記事では、2回に分けてTENAが可能にするさまざまな分析アプリケーションを通じ、TENAの扱うデータ構造とそれにアクセスするためのAPIを解説しました。ソーシャル・コンピューティングは、コミュニケーションの場を提供するにとどまらず、コンテンツおよびそれに対する行動を分析することでより強力なツールとなったり、ビジネス上での意思決定を可能としたりすることが可能となります。テキストと行動を統合的に扱えるTENAでは、ソーシャル・コンピューティングで考えられるさまざまな手法を、データの構造の作りこみなしに試すことができます。私たちはTENAのような技術で分析が容易になることにより、ソーシャル・コンピューティングの利用範囲がさらに拡大していくことを期待しています。

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
テキスト・ネットワーク分析統合プラットフォームを学ぶ連載記事一覧
この記事の著者

村上 明子(ムラカミ アキコ)

日本アイ・ビー・エム(株)東京基礎研究所 主任研究員1999年日本アイ・ビー・エム(株)入社。以後、同社東京基礎研究所において自然言語処理の研究に従事。テキスト・マイニング・ツールIBM TAKMIの研究開発において、品詞管理や辞書作成などを担当した。昨今では、電子メールや掲示板など人と人のコミュニケーションの文書を対象としたコミュニケーション分析をなどを行っている。ほかに著書として「チャンス発見の情報技術(東京電機大学出版)(共著)」、訳書として「Google Hacks 第2版、第3版(オライリージャパン)(共訳)」がある。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/4427 2009/09/24 16:33

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング