[B! 正規表現][PHP] tohokuaikiのブックマーク

tohokuaiki id:tohokuaiki

正規表現とPHPに関するtohokuaikiのブックマーク (4)

正規表現によるバリデーションでは ^ と $ ではなく \A と \z を使おう
正規表現によるバリデーション等で、完全一致を示す目的で ^ と $ を用いる方法が一般的ですが、正しくは \A と \z を用いる必要があります。Rubyの場合 ^ と $ を使って完全一致のバリデーションを行うと脆弱性が入りやすいワナとなります。PerlやPHPの場合は、Ruby程ではありませんが不具合が生じるので \A と \z を使うようにしましょう。はじめに大垣さんのブログエントリ「PHPer向け、Ruby/Railsの落とし穴」には、Rubyの落とし穴として、完全一致検索の指定として、正規表現の ^ と $ を指定する例が、Ruby on Rails Security Guideからの引用として紹介されています。以下の正規表現は、XSS対策として、httpスキームあるいはhttpsスキームのURLのみを許可する正規表現のつもりです。 /^https?:\/\/[^\n]+$/
tohokuaiki 2014/04/10
“正規表現のメタ文字 ^ と $ は「行」の先頭・末尾を指します。文字列の先頭と末尾を指定する場合は、\A と \z を使用します。”なるほどーー！！

PHP

正規表現
リンク
「PHP使いはもう正規表現をblogに書くな」と言わせないでくれ : 404 Blog Not Found
2009年03月19日18:00 カテゴリLightweight Languages 「PHP使いはもう正規表現をblogに書くな」と言わせないでくれああ、まただよ... かなり使えるPHPの正規表現まとめ - IDEA*IDEA 〜百式管理人のライフハックブログ〜正規表現って、プログラミング言語間の差が少ないサブ言語なのに、なぜ「PHP」がつくとダメ正規表現ばかり登場するのか。うんざりだ。かなり使えるPHPの正規表現まとめ - IDEA*IDEA 〜百式管理人のライフハックブログ〜メールアドレスは厳密にチェックしようとするとなかなか難しいのですが、簡単なチェックだったらこれでOKぽいですね。 /^[^0-9][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[@][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[.][a-zA-Z]{2,4}$
tohokuaiki 2009/03/19
PHPerさんへ $regexp = '@^(?:(?:(?:(?:[a-zA-Z0-9_!#\$\%&\'*+/=?\^`{}~|\-]+)(?:\.(?:[a-zA-Z0-9_!#\$\%&\'*+/=?\^`{}~|\-]+))*)|(?:"(?:\\[^\r\n]|[^\\"])*")))\\@(?:(?:(?:(?:[a-zA-Z0-9_!#\$\%&\'*+/=?\^`{}~|\-]+)(?:\.(?:[a-zA-Z0-9_!#\$\%&\'*+/=?\^`{}~|\-]+))*)|(?:\[(?:\\\S|[\x21-\x5a\x5e-\x7e])*\])))$@';

正規表現

php
リンク
Produce by Sieg: [Perl での正規表現]
# 半角スペース $str = '\x20'; # 全角スペース $str = '(?:\xA1\xA1)'; # EUC-JP $str_sjis = '(?:\x81\x40)'; # SJIS # 全角数字 [０-９] $str = '(?:\xA3[\xB0-\xB9])'; # EUC-JP $str_sjis = '(?:\x82[\x4F-\x58])'; # SJIS # 全角大文字 [Ａ-Ｚ] $str = '(?:\xA3[\xC1-\xDA])'; # EUC-JP $str_sjis = '(?:\x82[\x60-\x79])'; # SJIS # 全角小文字 [ａ-ｚ] $str = '(?:\xA3[\xE1-\xFA])'; # EUC-JP $str_sjis = '(?:\x82[\x81-\x9A])'; # SJIS # 全角アルフ
tohokuaiki 2007/01/14
正規表現

php

ひらがな

カタカナ
リンク
phpでひらがな、カタカナの判別
phpでマルチバイト（日本語）の文字を判別にはmb_eregを使えば簡単なのですが、php4ではmb_eregはデフォルトでは使えず、phpのインストール時に「--enable-mbregex」としてconfigureしなければいけません。現状ではphp5がインストールされているサーバーや「--enable-mbregex」でconfigureされたphp4サーバーはまだ少ないので、mb_eregが使えない場合は、以下のようにpreg_match関数のPerl正規表現で文字コードを判別します。Perlプログラマでしたらおなじみですね。他のWebサイトではmb_eregを使った例ばかりなので、今更ではありますが、参考までにpreg_matchでの例を記述してみます。後述のサンプルスクリプトで使用する変数は以下です。文字コードはEUC-JP。 <?php $str1 = mb_conver
tohokuaiki 2007/01/14
php

正規表現

ひらがな

カタカナ

preg
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx