直近一年間の累計
アクセス数 : ?
ダウンロード数 : ?
ID 115416
タイトル別表記
Efficient String Dictionary Compression Using String Dictionaries
著者
神田, 峻介 徳島大学
資料タイプ
学術雑誌論文
抄録
文字列集合を保管するためのデータ構造である文字列辞書に関して,近年,多くの用途でコンパクト性が求められるという実例が報告されている.また,その背景に応じて,Trie や Front-Coding などの辞書を実現するための優れた技法に,Re-Pair などの強力な文書圧縮技法を組み合わせた圧縮文字列辞書が提案されている.本稿では,既存の圧縮文字列辞書の改良を目的とし,文字列辞書の圧縮に文字列辞書を用いるという方策に基づいた辞書構造を提案する.実データを用いた実験より,提案による文字列辞書はRe-Pair により圧縮した辞書と比べ,メモリ効率や検索・復元速度のトレードオフに関して同等の性能を示しつつ,短い時間で構築できることを示した.
抄録別表記
A string dictionary is a data structure to store a set of strings. Recently, instances have emerged in practice where the size of string dictionaries has become a critical problem in many applications. Consequently, compressed string dictionaries have been proposed by leveraging efficient implementation techniques, such as Trie and Front-Coding, and powerful text compression techniques, such as Re-Pair. In this paper, we propose new dictionary structures based on a strategy using string dictionaries for the compression in order to improve existing compressed ones. We show that our string dictionaries can be constructed in a shorter time compared to the Re-Pair versions with competitive space usage and operation speed, through experiments on real-world datasets.
掲載誌名
日本データベース学会和文論文誌
ISSN
21890366
21890374
出版者
日本データベース学会
16-J
開始ページ
7
発行日
2018-03
EDB ID
出版社版URL
フルテキストファイル
言語
jpn
著者版フラグ
出版社版
部局
理工学系