ダウンロード ソースファイル (3.9 KB)
ダウンロード バイナリファイル (33.8 KB)
本記事ではデータ圧縮の基盤である最小冗長符号を実現するCanonical Huffman Code(以下、CHC)を紹介します。最小冗長符号は、各文字の出現確率が分かっている場合にそのデータを最小長で表現可能な符号です。CHCは良く知られたHuffman符号の一種ですが、木を用いずに表引きのみで処理を行うので高速に符号/復号が可能です。また、符号の長さ制限をつけた場合の最適な符号を求めるreverse package merge法も紹介します。
この記事は参考になりましたか?
- この記事の著者
-
岡野原 大輔(オカノハラ ダイスケ)
データ圧縮やデータ構造、またそれらの応用としての自然言語処理、機械学習に興味があります。http://hillbig.cocolog-nifty.com/(blog)
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です