左のテキストBOXに正規表現、
右のテキストBOXに値を入力します。
正規表現では、
「.」は「.」に一致します。
「?」は「?」に一致します。
「*」はすべての文字列に一致します。
値は、
アドレスの取得に適用されたフィルタでは無視され、
正規表現に一致したらすべて除外されます。
各ファイル用のフィルタの場合、値が無い場合は除外。
値がある場合は値がファイルに挿入されます。
値は、サイトマップ生成のために存在します。
説明難しいんで、BIG-BONUS.NETの例で説明します。
フィルタ0
http://www.big-bonus.net/sdb/list/*
http://www.big-bonus.net/search/*
http://www.big-bonus.net/shop/search/*
http://www.big-bonus.net/shop/bidders/list/*
http://www.big-bonus.net/shop/amazon/search.cgi*
http://www.big-bonus.net/update/*
http://www.big-bonus.net/i/
フィルタ0はアドレスの取得に使われ、
動的なリストページとモバイルページのインデックスを除外しています。
動的なリストページは大量のURLが取得されてしまう可能性があるので除外しています。
フィルタ1
http://www.big-bonus.net/
http://www.big-bonus.net/sdb/
http://www.big-bonus.net/shop/
http://www.big-bonus.net/shop/amazon/
http://www.big-bonus.net/shop/bidders/
http://www.big-bonus.net/dict/list/*
http://www.big-bonus.net/bbs/*
http://www.big-bonus.net/antenna/
http://www.big-bonus.net/antenna/log/*
フィルタ1はサイトマップ以外のファイルに使われ、
リストページを除外しています。
更新履歴は記事ページのみから生成したいが、更新履歴はリストページから取得するので、
最低限のリストページはフィルタ0に入れていません。
フィルタ0により取得されたアドレスからさらにリストページを除外する設定をしています。
フィルタ2
http://www.big-bonus.net/ 1.0
http://www.big-bonus.net/antenna/content/* 0.8
http://www.big-bonus.net/sdb/html/* 0.9
http://www.big-bonus.net/shop/amazon/asin/* 0.8
http://www.big-bonus.net/shop/bidders/item/* 0.8
http://www.big-bonus.net/bbs/* 0.5
http://www.big-bonus.net/dict/html/* 0.8
* 0.6
サイトマップようのフィルタです。
取得されたすべてのアドレスを含めるため、すべてに値をつけています。
上位から比較されて一致したら終了するため、「*」は最後。
リストにないページは0.5になると思われるため0.5↑の値で設定しています。
サイトマップは、
Googleウェブマスター ツール
Yahoo!検索 サイトエクスプローラー
Webmaster Center - Live Search
で登録できます。

