2007年6月14日木曜日

fgrep

CBL のデータは以下より取得できる。

rsync://rsync.cbl.abuseat.org/cbl/list.txt

上記データを取得し、
チェックしたいアドレスのリストを作ってgrep してみると、
遅い。非常に遅い。数分かかる。
どうしたもんか、、と思ったけど、fgrep がよいようのなので
試す。結果、1秒かからず。

・ip_lists -> チェックしたいアドレスのリスト
・cbl_list.txt -> CBL のデータ (500万行)
% wc -l cbl_list.txt
5108698 cbl_list.txt

time の結果
fgrep -f ip_lists cbl_list.txt 0.76s user 0.07s system 99% cpu 0.834 total


固定の文字列しか検索することができないおかげ(?)で高速。

んー。無知は罪だ。

0 件のコメント:

コメントを投稿