ニュース

新規
会員登録

特集記事

高速かつ省メモリで文字列を扱うデータ構造「wavelet tree」

大規模な文字列データの文字検索／カウントを効率的に行う

岡野原大輔[著]

更新日: 2006/06/29
公開日: 2006/01/26

ポスト

ダウンロードソースコード (6.8 KB)
ダウンロードバイナリファイル (51.6 KB)

本記事では大規模なデータを扱うためのデータ構造であるwavelet tree（WT）を紹介します。WTは文字列が与えられた時、文字cのi番目の出現位置や、文字cの位置pまでの出現回数を定数時間で答えるデータ構造です。作業領域量は元テキストの約2倍です。WTはsucBVの延長上にあるデータ構造であり、WTを用いることで圧縮索引やsuccinct data structureなどを実装できます。

ポスト

Page 1
Page 2

※印刷用ページ表示機能はメンバーのみが利用可能です（登録無料）。

新規会員登録無料

この記事は参考になりましたか？

WEB用を表示

ポスト

特集記事連載記事一覧: 【随時更新・まとめ読み】開発者のための「AWS re:Invent 2024」関連記事

開発者のための「WWDC 2024」関連発表まとめ

LeSSやSAFeなど、大規模アジャイルにおけるソフトウェア品質の課題とは？

もっと読む

この記事の著者: 岡野原大輔（オカノハラダイスケ）

データ圧縮やデータ構造、またそれらの応用としての自然言語処理、機械学習に興味があります。http://hillbig.cocolog-nifty.com/(blog)

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

この記事は参考になりましたか？

この記事をシェア

ポスト

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料

アクセスランキング

アクセスランキング