egrep と fgrep の性能比較

英文テキストから、 ランダムに選んだ複数の英単語のどれかを含む行を抽出する時間を測ってみる例。

計測環境

計測結果

パターンで指定した単語数の増加に従って、 使った CPU 時間がどのように変化したかを以下に示す。

単語数が多くなるにつれ、 Aho-Corasick アルゴリズムを採用している fgrep の方が有利になることが観察できる。

参考文献


渡邊克宏
katsu@watanabe.name