Perlで日本語を使用するとき、正しく動かなくなる代表的なケースは次の2点です。 日本語を扱う時、文字コードを意識していない。 正規表現で、日本語の文字列を使うとエラーが出る。 日本語を扱う時には、文字コードを意識する必要があります。 代表的な文字コードには「7ビットJIS」「SJIS(シフトJIS)」「EUC(日本語EUC)」「UTF8(Unicode)」があります。 厄介なのは、同じ言葉でも、文字コードによってコンピューター内部での表現が違うことです。 例えば、WebブラウザからSJISで送られてきた「塚本」という言葉と、EUCコードのスクリプト中で設定した「塚本」という言葉を比較すると「別物だよ」という結果が出ます。 こうした問題が起きないように、普通は、以下のことに気をつけてスクリプトを作ります。 スクリプトを書くときに、どの文字コードを使うか決めておく。 データの入出力(CGIの
日本語文字列を切り詰めるPerlの関数 日本語文字列を切り詰めるPerlの関数。EUC-JP限定 Perlメモの文字が途切れているか判定するを参考にしました。 sub jtruncate{ my($str,$n)=@_; $n ||=200; return $str if(length($str) <= $n); my $substr = substr($str,0,$n-3); if($substr =~ /\x8F$/ or $substr =~ tr/\x8E?xA1-\xFE// % 2){ chop $substr; } $substr .= "..."; return $substr; } $short = &jtruncate($long,$length) CPANにはLingua::JA::Jtruncateというモジュールがありますが、これは、jcode.plを利用して文
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く