siteconf: サイト別カスタマイズ siteconf は、 URL のパターンと、それに紐付けられた設定から成ります。 siteconf を使うと、サイト毎に文字コードを指定して "decode_url" の出力を改善したり、 Google のリダイレクタを迂回して性能や プライバシーを向上させたりすることができます。 デフォルトでは siteconf は ~/.w3m/siteconf から読み込まれます。 ===== 構文 ===== url |//|m@@i [exact] substitute_url "" url_charset no_referer_from on|off no_referer_to on|off user_agent "string" 後ろの方に書かれたものが優先されます。 ===== 例 ===== url m!^https?://([a-z]+\.)?twitter\.com/! substitute_url "https://nitter.net/" twitter.com を代替サイトに転送します。 url "http://your.bookmark.net/" no_referer_from on your.bookmark.net から張ったリンクを辿る際に、 HTTP referer を 送らないようにします。 url "http://www.google.com/url?" exact substitute_url "file:///cgi-bin/your-redirector.cgi?" Google のリダイレクタを local CGI に転送します。 url /^http:\/\/[a-z]*\.wikipedia\.org\// url_charset utf-8 同時に "decode_url" オプションをオンにすると、 Wikipedia への リンクを UTF-8 としてデコードして表示します。 url m@^https?://(.*\.)google\.com/@ user_agent "Lynx/2.8.8dev.3 libwww-FM/2.14 SSL-MM/1.4.1" Google に Lynx であると告げます。(これによりテキストブラウザ向けページが 返ります) url m!^https?://([a-z]+\.)?twitter\.com/! user_agent "Googlebot/2.1" Twitter に Googlebot であると告げます。(これによりJavaScriptが無効の ブラウザが拒否されずにページが返ります) ===== 正規表現について ===== 次の正規表現はいずれも同じ意味を表します。 /http:\/\/www\.example\.com\// m/http:\/\/www\.example\.com\// m@http://www\.example\.com/@ m!http://www\.example\.com/! 最後に 'i' 修飾子を付けると、大文字小文字を区別せずに照合を行います。 例えば、 m@^http://www\.example\.com/abc/@i は以下のいずれとも一致します。 http://www.example.com/abc/ http://www.example.com/Abc/ http://www.example.com/ABC/ ただし、ホスト名の部分は常に小文字に変換してから比較します。