blob: d638a9a163fff0aa97f5a58b3fbf0e97215099cb (
plain) (
tree)
|
|
siteconf: サイト別カスタマイズ
siteconf は、 URL のパターンと、それに紐付けられた設定から成ります。
siteconf を使うと、サイト毎に文字コードを指定して "decode_url"
の出力を改善したり、 Google のリダイレクタを迂回して性能や
プライバシーを向上させたりすることができます。
デフォルトでは siteconf は ~/.w3m/siteconf から読み込まれます。
===== 構文 =====
url <url>|/<re-url>/|m@<re-url>@i [exact]
substitute_url "<destination-url>"
url_charset <charset>
no_referer_from on|off
no_referer_to on|off
user_agent "string"
後ろの方に書かれたものが優先されます。
===== 例 =====
url m!^https?://([a-z]+\.)?twitter\.com/!
substitute_url "https://nitter.net/"
twitter.com を代替サイトに転送します。
url "http://your.bookmark.net/"
no_referer_from on
your.bookmark.net から張ったリンクを辿る際に、 HTTP referer を
送らないようにします。
url "http://www.google.com/url?" exact
substitute_url "file:///cgi-bin/your-redirector.cgi?"
Google のリダイレクタを local CGI に転送します。
url /^http:\/\/[a-z]*\.wikipedia\.org\//
url_charset utf-8
同時に "decode_url" オプションをオンにすると、 Wikipedia への
リンクを UTF-8 としてデコードして表示します。
url m@^https?://(.*\.)google\.com/@
user_agent "Lynx/2.8.8dev.3 libwww-FM/2.14 SSL-MM/1.4.1"
Google に Lynx であると告げます。(これによりテキストブラウザ向けページが
返ります)
url m!^https?://([a-z]+\.)?twitter\.com/!
user_agent "Googlebot/2.1"
Twitter に Googlebot であると告げます。(これによりJavaScriptが無効の
ブラウザが拒否されずにページが返ります)
===== 正規表現について =====
次の正規表現はいずれも同じ意味を表します。
/http:\/\/www\.example\.com\//
m/http:\/\/www\.example\.com\//
m@http://www\.example\.com/@
m!http://www\.example\.com/!
最後に 'i' 修飾子を付けると、大文字小文字を区別せずに照合を行います。
例えば、 m@^http://www\.example\.com/abc/@i は以下のいずれとも一致します。
http://www.example.com/abc/
http://www.example.com/Abc/
http://www.example.com/ABC/
ただし、ホスト名の部分は常に小文字に変換してから比較します。
|