WwwSearch 4.0 利用メモ - とほほのWWW入門
目次
WwwSearchとは?
WwwSearch は、Webサーバー上のファイルから、特定の文字を含むファイルを検索する機能をもった CGI スクリプトです。フリーソフトとして配布しています。商用・使用を問わず、利用・改造・流用・再配布はご自由にどうぞ。
ダウンロード
下記からダウンロードできます。
実行イメージ
実行イメージは、「掲示板実行イメージ」をご覧ください。「CGI」とか「アイコン」とかの検索用語を入力してみてください。
注意事項
- Perl 5.8以上が必要です。
- あらかじめ検索用のインデックスを作成しておくタイプではなく、検索の都度、全文を検索するタイプですので、設置は簡単ですが、Webサーバーには多大な負荷をかけてしまいます。多量のファイルを対象に検索を行う場合は、Solar, Elasticsearch, Fess などの本格的な検索エンジンを利用してください。
- 検索対象ファイルは、同じWebサーバー上にあるもののみとなります。他のサーバーにあるファイルを検索することはできません。どうしても検索したい場合は、後述の説明を参照してください。
- 速度向上やサーバー負荷低減のため、あまり厳密な検索を行っていません。たまに、誤った語句が検索されたり、検索されなかったり、検索結果が文字化けすることもありますので、ご了承ください。
- 文字コードは、UTF-8、Shift_JIS、EUC-JPに対応しています。
- 検索ワードが半角英数記号のみの場合は、大文字小文字を無視した検索を行います。
- 検索結果には、ヒットしたファイルのタイトル、ファイル名、最初にヒットした部分の数行が表示されます。ヒットしたすべての行が表示されるわけではありません。
- <title>~</title>は1行で記述してください。
- 検索対象とできるのは、.htm や .txt などのテキストファイル(Windowsのメモ帳などで編集できる形式)のみです。Excel や Word のファイルを検索することはできません。
更新履歴
- Ver4.0.1 - 説明文書(本書)の更新飲み。(2025.1.7)
- Ver4.0 - 全面改訂。UTF-8に対応。スタイルシート分離。(2021.5.9)
- Ver3.15 - Ver3.14のバグ修正。(2004.8.8)
- Ver3.14 - 複数語指定時、すべてを太字で表示する。(2004.6.20)
- Ver3.13 - 検索用語に " を含む場合に対処。(2002.3.24)
- Ver3.12 - デザインの変更など。(2001.12.2)
- Ver3.11 - SSIをサポートするサーバーにおけるセキュリティホールに対応。また、ロギングファイル名を変更可能に。(2001.11.25)
- Ver3.10 - スクリプトの漢字コードと検索ファイルの漢字コードが異なると検索ができないバグ修正。(2001.9.23)
- Ver3.09 - 検索の高速化やバグ修正など。(2001.5.9)
- Ver3.08 - サイト移転に伴う説明などの修正。
- Ver3.07 - @ARGVで引数を受け取れないサーバーに対応。
- Ver3.06 - 複数の全角スペースがあるときの不具合を修正。
- Ver3.05 - Ver3.04修正時の不具合を修正。
- Ver3.04 - perl4で、ファイルの検索が途中で終わってしまうことがあるという問題に対応。
- Ver3.03 - $how_many_linesの指定が無視されるというバグを修正。
- Ver3.02 - 検索結果のタイトルが文字化けすることがあるというバグを修正。検索結果が太字にならないことがあるというバグを修正。Macintosh形式の改行コードの場合に検索結果が全文になるというバグを修正。
- Ver3.01 - perlのバージョンにより、検索結果が文字化けすることがあるというバグを修正。
- Ver3.00 - 「ブラウブ」が「ブラウザ」にマッチしてしまうというバグに対処。その代わり若干処理速度に影響有り。JISコードの検索対象ファイルにも対応。
設置方法
CGIの設置経験の無い方は、まず、「とほほのCGI入門」などを参考に、簡単なCGIの設置練習を行ってください。
wwwsrch.cgi を、メモ帳などのテキストエディタで開き、★ 印の項目を説明に従って変更してください。
下記のファイルをサーバーに転送してください。この時、それぞれのファイルの改行コードが、サーバーに適したものになるようにしてください。サーバーがUNIXの場合はパーミッションも変更してください。
ファイル | パーミッション |
wwwsrch.cgi | 755(rwxr-xr-x) |
wwwsrch.log | 666(rw-rw-rw-) |
検索窓を貼り付けたいページに、以下の記述を追加してください。wwwsrch.cgi の部分は、wwwsrch.cgi を設置したフォルダに合わせて適切に変更してください。例えば、cgi-bin の下に設置した場合は cgi-bin/wwwsrch.cgi となります。
<form method="POST" action="wwwsrch.cgi">
<input type="text" name="word">
<button>検索</button>
</form>
もしくは単に、wwwsrch.cgi へのリンクを追記してください。
<a href="wwwsrch.cgi">このサイトを検索</a>
検索結果のアドレスが異なる場合の対処
検索結果のジャンプ先のアドレス(URL)が、期待したものと異なる場合、例えば、http://xx.yy.zz/aa/bb/index.htm へのリンクになって欲しいのに、../cc/dd/index.htm へのリンクになってしまう場合は、wwwsrch.cgi の382行目あたりの
# $target =~ s|○○|△△|;
という行を次のように変更してください。
$target =~ s|../cc/dd|http://xx.yy.zz/aa/bb|;
ここで、「$target =~ s|文字列A|文字列B|;」は、「文字列A」を「文字列B」に置換することを意味します。
置換は、リンクにマウスを乗せたときにステータスバーに表示されるものではなく、必ず、HTMLソースの、「<a href="○○">」の ○○ の部分に対して行ってください。
Copyright (C) 1996-2025 杜甫々
初版:1997年9月28日、最終更新:2025年1月7日
https://www.tohoho-web.com/soft/wwwsearch/readme.html