Perlで全角文字の文字数を数えるには?
ふに
1998/09/28(月) 15:08:49
Perl5で全角文字の文字数を数えようとして、lengthを使ったところ
全角文字*2の数が帰ってきます。どうも純粋なバイト数を返しているようです。
全角・半角入り交じった文字列を数えなければいけないため、
単純に2で割る訳にもいかず困っています。
どなたか教えていただけますでしょうか。
perl -v
This is perl, version 5.004_04 built for sun4-solaris
文字コードはEUCです。
よろしくお願いします。
Tiot
[E-Mail]
1998/09/28(月) 17:42:19
jcode.plを使ってすべて全角にしておいてから、文字数を数えて2で割るというのはどうでしょう?
../199809/98090081.htm
を参照にしてください(まだ解決していませんが)。
あとは正規表現で半角だけ、全角だけと分離しておいてから、別々に数えておいて足しあわせてもいいかも。
ちなみにjperlを使ってもバイト数で返されてしまいます。
こういった用途の、ライブラリかモジュールかを探せば有るかも知れません。
ご存知の方がいらっしゃったら教えて下さい。
#solarisうらやましいな。
匿名希望
1998/09/28(月) 19:19:02
検査対象が$lineに入っているとして、
$n = $line =~ tr/\xa1-\xfe/\xa1-\xfe/;
この$nを2で割った値が全角文字の字数です。これはよく使われる
技法です。
manに載っている例では、*の個数を数えるには tr/*/*/
ふに
1998/09/28(月) 19:53:27
[[解決]]
Tiotさん、匿名希望さん 早速のお応えありがとうございました。
おかげさまで、全角文字の文字数を取り出すことができました。
この方法だと、半角文字はカウントされないんですね。気をつけなければ・・・
Tiot
1998/09/28(月) 21:40:05
>この方法だと、半角文字はカウントされないんですね。
$m = $a =~ tr/\x00-\x7f/\x00-\x7f/;
で、半角文字数です。
コントロール+英数字や空白を入れないなら\x21-\x7e。
念のため。
#とか言いながら僕もさっきまでこの方法を知りませんでした。
ありがとうございます。>匿名希望さん