wwwsrch「写」でエラー?

[上に] [前に] [次に]
うひ [E-Mail] 2000/05/29(月) 11:40:29
はじめまして。wwwsrchをカスタマイズして使用をはじめましたが
「写」の一文字検索の場合、検索文字列「半角のハ」該当なし、
と返されます。
とほほさんの内部検索、
山口新聞ダイジェストの検索
http://www.minato-yamaguchi.co.jp/yama/digest/ysearch.html
では再現されませんが、
香川県観音寺市http://www.city.kanonji.kagawa.jp/
横浜市立大学http://www.yokohama-cu.ac.jp/
東京圏輸送管理システムhttp://www.age.ne.jp/x/sat231/
では再現されます。
ちなみに「写真」ではとおります。なしてでしょう?
さらに文字列によっては数十メガのcoreを吐き出してcgiが停止します。
(これはカスタマイズ箇所があやしいのですが)

アム [E-Mail] [HomePage] 2000/05/29(月) 18:13:17
文字コードの問題でEUCしか受け付けないのにShiftJISを
送りつけて出るエラーみたいですね。

余談ですが、
「写」は、半角の何かしらの文字と「半角のハ」で
構成されています。

これしか言うことがないのですが参考になりましたか?。

sadhiro 2000/05/29(月) 22:30:09
全く見当はずれかもれませんが…
横浜市立大学は一部のページに半角カナを使っているところから,
あるいは半角カナに対応できるように改造したのかも?

S-pore [HomePage] 2000/05/30(火) 00:45:42
ShiftJIS で送ってるのに内部では EUC で処理してるとか。
<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=euc-jp">
の指定を加えるとうまくいっちゃったりするのかもしれません。(って,関係なさそう^^;)

# ShiftJISの「写」 == EUCの「半角のハ」

うひ 2000/05/30(火) 15:22:59
[[解決]]
wwwsrch.cgi自体ををeucエンコードにしたところ「写」も通るように
なりました。みなさんありがとうございます。
でも、特定の文字列でcgiがcoreを吐いて中途停止するのは同じです。
(中途停止:ヒット結果のHTMLが途中で止まり「検索終了しました」
が表示されない)とほ〜

とほほ 2000/05/30(火) 23:55:49
すみません。wwwsrch.cgiは、速度優先(面倒というのもあって)
かなりいい加減な検索アルゴリズムになっています。
暇があれば改善しようと思いながらずるずる・・・・

[上に] [前に] [次に]