半角かなの識別について

[上に] [前に] [次に]
なそむ 1999/03/05(金) 11:24:58
文字コードの判別を nkf を使用しておこなっているのですが、
EUC半角カナを使用すると、文字が化けてしまいます。
いろいろHPをみたのですが、半角かなは使用しないのが一般的だ
そうですね。でも、半角カナを使用された場合はどう対処すれば
よいでしょうか?

sun 1999/03/06(土) 21:07:00
う〜ん、半角カナはインターネットの規格ではサポートされてい
ないはずなので、使わない方が無難です。
記入者にあらかじめ「半角カナは入力できません」の様に告知
すれば記入される回数は減らせるかも知れませんが、難しいでし
ょう。
#JavaScriptの正規表現で調べられないだろうか?
#どなたかフォロー願います。

BASIC [E-Mail] 1999/03/07(日) 04:48:11
正規表現で調べられなくもないですが、
調べたい文字を代入する必要があるので、
どっちにしろ、ソースの中に半角が混じる事になります。
コードでやる方法は、私がやった限り変数で指定できなかったので
実用的ではないし...
stringで文字コードを調べる方法はVer4以降のブラウザしか
サポートしてないし。
誰かもっとすご腕のかた!(^^;

とほほ 1999/03/08(月) 00:49:07
最近のバージョンの jcode.pl では、半角カタカナから全角カタカナへ
の変換ルーチン(h2z_xxx)がサポートされているようです。これを用いる
のも手かも。

B-Cus 1999/03/08(月) 05:32:04
> 文字コードの判別を nkf を使用して

これってどうやってるんですか? マニュアルを見ても、
判別方法についての記述はなかったので教えてください。

> 最近のバージョンの jcode.pl では、半角カタカナから全角カタカナへの変換

少くともnkf1.62以降では、デフォルトで 半角カナ->全角カナの変換を
行ってくれるようです(-xで抑制)

B-Cus 1999/03/08(月) 05:40:43
> デフォルトで 半角カナ->全角カナの変換を行ってくれるようです

ちょっと補足。SJISの半角カナはうまく変換できません。
EUCならOKのようです。

つまり、元データがEUCなら nkf<file で大丈夫ですが、
SJISなら、nkf -xe<file|nkf とか、nkf -xj<file|nkf
などと、二段重ねでやる必要があるようです。

ATOM [E-Mail] 1999/03/10(水) 16:05:12
> ...半角カナはインターネットの規格ではサポートされていないはず...

これってそうなんですか?
たぶん,RFC1468 (1993)を元にして書いているのだと思いますが,
このRFCは,
メールやニュースでは日本語のコードはISO-2022(Jis)を使いましょう,
と言っていて,shift JisやEUCはOKとかWWWではどうだということには
触れていないように思います.

現在日本語のコードをどうするべきか正式な文書を
ご存知の方がいましたら教えてください.

[上に] [前に] [次に]