[B! 文字コード][perl] ono_matopeのブックマーク

ono_matope id:ono_matope

文字コードとperlに関するono_matopeのブックマーク (4)

Webページの文字コードをUTF-8にする方法(前編)
ono_matope 2007/04/11
明日に持ち越し。

perl

CGI

文字コード

トラブルシューティン
リンク
Perlメモ/日本語の扱い - Walrus, Digit.
Perlで日本語を使用するとき、正しく動かなくなる代表的なケースは次の2点です。日本語を扱う時、文字コードを意識していない。正規表現で、日本語の文字列を使うとエラーが出る。日本語を扱う時には、文字コードを意識する必要があります。代表的な文字コードには「7ビットJIS」「SJIS（シフトJIS）」「EUC（日本語EUC）」「UTF8（Unicode）」があります。厄介なのは、同じ言葉でも、文字コードによってコンピューター内部での表現が違うことです。例えば、WebブラウザからSJISで送られてきた「塚本」という言葉と、EUCコードのスクリプト中で設定した「塚本」という言葉を比較すると「別物だよ」という結果が出ます。こうした問題が起きないように、普通は、以下のことに気をつけてスクリプトを作ります。スクリプトを書くときに、どの文字コードを使うか決めておく。データの入出力(CGIの
ono_matope 2006/12/04
UTF-8でのsubstrとか。

perl

文字コード
リンク
日本語文字列を切り詰めるPerlの関数 : blog.nomadscafe.jp
日本語文字列を切り詰めるPerlの関数日本語文字列を切り詰めるPerlの関数。EUC-JP限定 Perlメモの文字が途切れているか判定するを参考にしました。 sub jtruncate{ my($str,$n)=@_; $n ||=200; return $str if(length($str) <= $n); my $substr = substr($str,0,$n-3); if($substr =~ /\x8F$/ or $substr =~ tr/\x8E?xA1-\xFE// % 2){ chop $substr; } $substr .= "..."; return $substr; } $short = &jtruncate($long,$length) CPANにはLingua::JA::Jtruncateというモジュールがありますが、これは、jcode.plを利用して文
ono_matope 2006/12/02
日本語は難しいにゃー

perl

文字コード

日本語
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx