[B! ひらがな] tohokuaikiのブックマーク

tohokuaiki id:tohokuaiki

ひらがなに関するtohokuaikiのブックマーク (2)

Produce by Sieg: [Perl での正規表現]
# 半角スペース $str = '\x20'; # 全角スペース $str = '(?:\xA1\xA1)'; # EUC-JP $str_sjis = '(?:\x81\x40)'; # SJIS # 全角数字 [０-９] $str = '(?:\xA3[\xB0-\xB9])'; # EUC-JP $str_sjis = '(?:\x82[\x4F-\x58])'; # SJIS # 全角大文字 [Ａ-Ｚ] $str = '(?:\xA3[\xC1-\xDA])'; # EUC-JP $str_sjis = '(?:\x82[\x60-\x79])'; # SJIS # 全角小文字 [ａ-ｚ] $str = '(?:\xA3[\xE1-\xFA])'; # EUC-JP $str_sjis = '(?:\x82[\x81-\x9A])'; # SJIS # 全角アルフ
tohokuaiki 2007/01/14
正規表現

php

ひらがな

カタカナ
リンク
phpでひらがな、カタカナの判別
phpでマルチバイト（日本語）の文字を判別にはmb_eregを使えば簡単なのですが、php4ではmb_eregはデフォルトでは使えず、phpのインストール時に「--enable-mbregex」としてconfigureしなければいけません。現状ではphp5がインストールされているサーバーや「--enable-mbregex」でconfigureされたphp4サーバーはまだ少ないので、mb_eregが使えない場合は、以下のようにpreg_match関数のPerl正規表現で文字コードを判別します。Perlプログラマでしたらおなじみですね。他のWebサイトではmb_eregを使った例ばかりなので、今更ではありますが、参考までにpreg_matchでの例を記述してみます。後述のサンプルスクリプトで使用する変数は以下です。文字コードはEUC-JP。 <?php $str1 = mb_conver
tohokuaiki 2007/01/14
php

正規表現

ひらがな

カタカナ

preg
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx