SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

イベントレポート

「膨大なデータを分析して見えてくること」ニコニコ動画データ分析研究発表会


  • このエントリーをはてなブックマークに追加

χ2乗値を関連度としたニコニコ動画タグ関連ネットワークの解析

 ニコニコ大百科の開発者でもあるグニャラくんは、タグとタグの関連度を明らかにし、タグネットワークを図示するという発表を行った。

 調査では、1000本以上の動画に付与されているタグを抽出し、

  • 「A」というタグがついている動画数
  • 「B」というタグがついている動画数
  • 「A」「B」両方のタグがついている動画数

 を調べて関連度を割り出し、ある一定以上の数値を超えたものについて「関連している」と定義した。そのうえで各タグの関連をネットワーク図で描き、可視化した。

タグネットワーク図
タグネットワーク図
拡大したところ。「歌ってみた」に関連の近いタグが周囲に表示される。
拡大したところ。「歌ってみた」に関連の近いタグが周囲に表示される。

 さらに、動画の本数に応じて重みを付け、関連の近いタグ同士を並べた「Voronoi Treemaps(重み付きボロノイ図)」についても作成した。

Voronoi Treemaps
Voronoi Treemaps
拡大したところ。重みによってタグの面積が変わる。「動物」タグの近くに「犬」「猫」などがある。
拡大したところ。重みによってタグの面積が変わる。「動物」タグの近くに「犬」「猫」などがある。

 タグの共起関係を調べることで、「例えば『おっさんほいほい』というタグは、実はVOCALOID関連によくつけられることがわかる」とグニャラくん。単にこの図を眺めているだけでもいろいろな発見があっておもしろいという。

 なお、これらの集計方法について、「さまざまな論文を参考にしたので、そちらもぜひ見て欲しい」と紹介していた。論文は以下のとおりで、それぞれインターネット上で閲覧できる。

  • Graph-based Word Clustering using Web Search Engine(Yutaka Matsuo et. al. 2006)
  • Web上の情報を用いた関連語のシソーラス構築について(榊 剛史ら 2007)
  • A Clauset, MEJ Newman, C Moore:Finding community structure in very large networks (2004)
  • Michael Balzer , Oliver Deussen, Voronoi Treemaps(2005)

ニコニコ動画上の初音ミク動画間の引用関係を見てみた

 濱崎雅弘氏は、ニコニコ動画で「ある動画の一部が再利用され、また別の動画が投稿される」という事象に注目、ジャンルを初音ミクに絞り、調査結果を発表した。

 手法としては、まず最初に動画説明文に書かれている「素材は○○からお借りしました」(○○の部分には動画のハイパーリンクが入る)という文章を手がかりにして、動画ネットワークを構築する。そして、各動画の作者を調べ、それぞれがどんな関わり方をしているかを調べた「作者ネットワーク」を作成した。この中では、動画作者を次の4つに分類している。

  • 「作曲」…初音ミクを用いて作成したオリジナル曲(赤色)
  • 「調教」…チューニング、カバー曲など(青色)
  • 「作画」…イラストや3DCGを用いたPVなど(緑色)
  • 「編集」…ランキングやアルバムなど(白色)
作者ネットワーク
作者ネットワーク

 色分けした図を細かく見てみると、楽曲によってコミュニティの形成に違いがあるものの、「作曲者の動画がコミュニティの中心となり、発展していくことがわかる」という。つまり、楽曲が投稿され、それにイラストがついたりリミックスされていくパターンが多く、逆にイラストや動画が投稿され、それに楽曲がつくことは比較的少ないという。これは、VOCALOIDがDTMソフトだということを考えると、自然の流れなのかもしれない。

 また、時系列によってコミュニティやタグがどう派生していくかを可視化する方法としてs.o.c.i.a.r.i.u.mを用いたデモも行われた。「時間が進むごとに新たな楽曲が投稿され、作者同士がマッシュアップしているのがわかる。入れ替わりも流動的に行われており、全体的にコミュニティを盛り上げている印象がある」(濱崎氏)

s.o.c.i.a.r.i.u.mの実演。作者間の関連がアニメーションで表示される。
s.o.c.i.a.r.i.u.mの実演。作者間の関連がアニメーションで表示される。

ニコニコ動画を俯瞰した発表会

 ニコニコ動画がリリースされた当初は毎日投稿される動画全てを見ることも可能だった。しかし2年間経ち、参加ユーザーが増えた結果、もはやどんな動画があるかも把握しきれない巨大サービスになってしまった。漠然と「たくさんの種類の動画がある」「盛り上っているコミュニティがある」と思われている中で、どんな種類の動画があるか、また、盛り上がったときの勢いはどの程度なのかが見えてきた発表会だった。

 Web 2.0時代はCGMを通じ、大量の情報をとにかく集めることに成功したが、一方で集まりすぎてしまい、「自分にあった情報を見つけられない」「規模や起きていることがわかりづらい」といった課題がある。今回のような分析手法を通じて、消費しきれない情報を分類して俯瞰するというのも面白い試みだと言えるだろう。

 発表会ではこのほかにもミニプレゼンが行われた。各発表者のプレゼン資料はネットに公開されており、以下のサイトで閲覧できる。

関連リンク

この記事は参考になりましたか?

  • このエントリーをはてなブックマークに追加
イベントレポート連載記事一覧

もっと読む

この記事の著者

飯岡 幹雄(編集部)(イイオカ ミキオ)

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/3516 2009/01/27 10:21

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング