wwwsrch「写」でエラー?
[上に]
[前に]
[次に]
うひ
[E-Mail]
2000/05/29(月) 11:40:29
はじめまして。wwwsrchをカスタマイズして使用をはじめましたが
「写」の一文字検索の場合、検索文字列「半角のハ」該当なし、
と返されます。
とほほさんの内部検索、
山口新聞ダイジェストの検索
http://www.minato-yamaguchi.co.jp/yama/digest/ysearch.html
では再現されませんが、
香川県観音寺市http://www.city.kanonji.kagawa.jp/
横浜市立大学http://www.yokohama-cu.ac.jp/
東京圏輸送管理システムhttp://www.age.ne.jp/x/sat231/
では再現されます。
ちなみに「写真」ではとおります。なしてでしょう?
さらに文字列によっては数十メガのcoreを吐き出してcgiが停止します。
(これはカスタマイズ箇所があやしいのですが)
アム
[E-Mail]
[HomePage]
2000/05/29(月) 18:13:17
文字コードの問題でEUCしか受け付けないのにShiftJISを
送りつけて出るエラーみたいですね。
余談ですが、
「写」は、半角の何かしらの文字と「半角のハ」で
構成されています。
これしか言うことがないのですが参考になりましたか?。
sadhiro
2000/05/29(月) 22:30:09
全く見当はずれかもれませんが…
横浜市立大学は一部のページに半角カナを使っているところから,
あるいは半角カナに対応できるように改造したのかも?
S-pore
[HomePage]
2000/05/30(火) 00:45:42
ShiftJIS で送ってるのに内部では EUC で処理してるとか。
<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=euc-jp">
の指定を加えるとうまくいっちゃったりするのかもしれません。(って,関係なさそう^^;)
# ShiftJISの「写」 == EUCの「半角のハ」
うひ
2000/05/30(火) 15:22:59
[[解決]]
wwwsrch.cgi自体ををeucエンコードにしたところ「写」も通るように
なりました。みなさんありがとうございます。
でも、特定の文字列でcgiがcoreを吐いて中途停止するのは同じです。
(中途停止:ヒット結果のHTMLが途中で止まり「検索終了しました」
が表示されない)とほ〜
とほほ
2000/05/30(火) 23:55:49
すみません。wwwsrch.cgiは、速度優先(面倒というのもあって)
かなりいい加減な検索アルゴリズムになっています。
暇があれば改善しようと思いながらずるずる・・・・
[上に]
[前に]
[次に]