Regular expression visualizer using railroad diagrams
正規表現によるバリデーション等で、完全一致を示す目的で ^ と $ を用いる方法が一般的ですが、正しくは \A と \z を用いる必要があります。Rubyの場合 ^ と $ を使って完全一致のバリデーションを行うと脆弱性が入りやすいワナとなります。PerlやPHPの場合は、Ruby程ではありませんが不具合が生じるので \A と \z を使うようにしましょう。 はじめに 大垣さんのブログエントリ「PHPer向け、Ruby/Railsの落とし穴」には、Rubyの落とし穴として、完全一致検索の指定として、正規表現の ^ と $ を指定する例が、Ruby on Rails Security Guideからの引用として紹介されています。以下の正規表現は、XSS対策として、httpスキームあるいはhttpsスキームのURLのみを許可する正規表現のつもりです。 /^https?:\/\/[^\n]+$/
Scriptular is a javascript regular expression editor. Inspired by Rubular it gives you a simple way to test javascript regular expressions as you write them. Start by entering a regular expression and then a test string. Or give this example a try. Learn more about regular expressions in javascript.
► 2017 (2) ► January (2) ► 2016 (10) ► August (1) ► April (3) ► February (4) ► January (2) ► 2015 (36) ► December (2) ► October (2) ► September (2) ► August (4) ► July (5) ► June (5) ► May (1) ► April (6) ► March (4) ► February (4) ► January (1) ► 2014 (34) ► December (1) ► October (1) ► September (2) ► August (4) ► July (1) ► June (1) ► May (5) ► April (4) ► March (7) ► February (6) ► January (2)
フォームのフリガナなどで全てひらがなのみ、またはカタカナのみかをチェックする方法です。 mb_ereg で判定する場合 mb_regex_encoding("UTF-8"); if (!mb_ereg("^[ぁ-ん]+$", $string)) { echo "ひらがなのみ"; } if (!mb_ereg("^[ァ-ヶー]+$", $string)) { echo "カタカナのみ"; } preg_match で判定する場合 mb_regex_encoding("UTF-8"); if (preg_match("/^[ぁ-ん]+$/u", $string)) { echo "ひらがなのみ"; } if (preg_match("/^[ァ-ヶー]+$/u", $string)) { echo "カタカナのみ"; } UTF-8 の文字コードの正規表現では u オプションをつけます。 参考
日本語を扱っていて困るのがgrep。正規表現パターンにマルチバイト文字を混ぜられなかったり、windowsで動かすと"表"の様に2バイト目にbackslashが混じる文字で動作しなくなったりします。 さらに複数のエンコーディングで書かれたファイルが散らばっていると一度のgrepで検索出来なかったりもします。 vimに限っては、内蔵のvimgrepを使う事で解決出来ますが、見つかったファイルをバッファに開いてしまうという挙動がある為、grepオリジナルの動作を求めている人にとっては都合の悪い物だったりもします。 vimgrepの様に複数のエンコーディングに対応していて、検索パターンにマルチバイト文字を含んだ正規表現が使えて、windowsでもちゃんと動いて、ついでといっちゃあなんだが、"**/*.txt"で再帰検索してくれる様なgrep無いかなぁと思ってたんですが、やっぱり無いので作りました
Grep: print lines matching a pattern Version 2.5.4 Description Grep searches one or more input files for lines containing a match to a specified pattern. By default, grep prints the matching lines. Homepage http://www.gnu.org/software/grep/grep.html Sources: http://ftp.gnu.org/gnu/grep Download If you download the Setup program of the package, any requirements for running applications, such as dyn
2011年7月6日(水)にShibuya Perl Mongersテクニカルトーク#16「夏の正規表現祭り」を開催しました。 http://shibuya.pm.org/blosxom/techtalks/201107.html 今回は株式会社ミクシィさんの新オフィスのセミナールームをお借りして開催することとなり、その後の懇親会も隣のコラボレーションルームで開催することができました。素敵なオフィス体験でした。 テーマ – 「夏の正規表現祭り」 日時 – 2011年7月6日(水) 18:45-21:00 (18:30 開場) 会場 – 〒150-0011 東京都渋谷区東1-2-20 住友不動産渋谷ファーストタワー 7F (株式会社ミクシィ) 料金 – 無料 定員 – 110名 (いちばん大きなセミナールーム) 事前登録 – http://atnd.org/events/17082 にて参加申
「Repl-Ace on .NET Ver.1.0.4」を本日公開いたしました。 BBSにご報告頂いた不具合のフィクスのみで、新機能追加はありません。 最小化や最大化したまま終了した場合でも、元のサイズに戻した場合の位置を再現できるようになりました。 ただし、最大化からの復元に関しては、メインウィンドウではうまくいくのですが、ツール子画面系ではうまくいきません(対応は未定)。 また、ズームでエラーとなり、強制終了する不具合を修正しました。 「Repl-Ace on .NET」のご使用にあたっては、別途「Microsoft .NET Framework 2.0」および「Microsoft Visual C++ 2008 再頒布可能パッケージ (x86)」のインストールが必要となります。 「Microsoft .NET Framework 2.0」は Microsoft Update などで入
Regarding the validity of a UTF-8 string when using the /u pattern modifier, some things to be aware of; 1. If the pattern itself contains an invalid UTF-8 character, you get an error (as mentioned in the docs above - "UTF-8 validity of the pattern is checked since PHP 4.3.5" 2. When the subject string contains invalid UTF-8 sequences / codepoints, it basically result in a "quiet death" for the pr
ウノウラボ Unoh Labs: PHPのちょっとしたコツ 最近のスクリプト言語は機能が多く、基本的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね(コーディングの効率的にも)。 自分にもそういったレベルで気をつけていることがいくつかあります。 -[早起き生活]PHPのパフォーマンスチューニング -[早起き生活]PHPのパフォーマンスチューニング その2:count()も使い過ぎると重くなる -[早起き生活]PHPのパフォーマンスチューニング その3:APC投入 あと、最近気づいたTIPSとしては、 日本語を正規表現検索したいときでもereg系の関数を使うのはやめとけ なんてのもあります。 PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系
前回のエントリではめんどくさくて結果だけにしちゃいましたが、一番言いたかったチューニングがあんまり注目されてないのでちゃんと書いてみます。 かなり面倒 Yahoo! Pipes の応答速度が結構遅くて、1箇所変更しては2?3秒待っては確認を繰り返す必要あり。根気が必要。 これ、私の場合は 20 秒でした。根気ってレベルじゃない。 ボトルネックは「Regex モジュール」 pipesエディタはよくできていて、選択した工程までの結果とかかった時間を表示してくれます。なのでどこがボトルネックなのかが一目瞭然です。 以下は上で紹介している「Yahoo! Pipes の Page Fetch モジュールでスクレイピングし放題」の「はてブ ブックマーク件数一括取得API」のpipesエディタ画面。 まずは Regex モジュールの前まで。 「Time taken: 0.377219s」と出てますね。
“Regular Expressions Cookbook manages to be simultaneously accessible and almost ridiculously comprehensive.” —Jeff Atwood Recommended regex tools: • RegexBuddy • RegexMagic • PowerGREP What is it? XRegExp provides augmented (and extensible) JavaScript regular expressions. You get modern syntax and flags beyond what browsers support natively. XRegExp is also a regex utility belt with tools to make
重箱の隅。 404 Blog Not Found:javascript+regexp - ていうか首都最強東京bookmarklet (function(e){ e.innerHTML = e.innerHTML.replace( /東京都?([\u3200-\u4DBF\u4E00-\u9FFF\uF900-\uFAFF]+)/g, '首都$1東京' ) })(document.body) 漢字を判定する正規表現が工夫のしどころでしょうか。[一-龠]はUnicode時代にはちょっと古い。grep CJK /usr/local/lib/perl5/5.10.0/unicore/Blocks.txtが参考資料代わりです。 404 Blog Not Found:javascript+regexp - ていうか首都最強東京bookmarklet \u3200-\u4DBF とあるけど、U+320
2008-01-14 カテゴリ: Client Side タグ: Tips JavaScript トラックバック [追記]404 Blog Not Found:javascript - \uXXXXを使わない理由を受けて追記 dankogaiさんはあまりJavaScriptのリテラルに詳しくないのかな? 404 Blog Not Found:regexp - 全角英数字を半角に var fascii2ascii = (function(){ var cclass = '['+String.fromCharCode(0xff01)+'-'+String.fromCharCode(0xff5e)+']'; var re_fullwidth = new RegExp(cclass, 'g'); return function(s){ return s.replace(re_fullwidth,
改訂:2017/07/22 Unicode 10.0に合わせて書き直し。正規表現を簡易にしようとしてやりすぎていたのを修正。 改訂:2023/03/21 U+30000以降を追加。InDesignの正規表現を追記。 正規表現で漢字の範囲指定をする場合、Unicodeではどうするかが悩ましいところです。 Unicodeの漢字の範囲として [一-龠] にしている例を見かけます。しかしこれは旧規格JIS X 0208の漢字が含まれる範囲をUnicodeの中から切り出しているだけです。互換漢字ブロックをまるごと取りこぼしているので、WindowsのシフトJIS(CP932)の拡張漢字に当たるものが含まれていません。現規格JIS X 0213の第3・第4水準漢字も考慮されていません。簡易な範囲指定だとしても、新常用漢字の「𠮟」が含まれておらず、今から見るとあまりに時代遅れです。 Unicodeのす
このドメインを購入する。 gkbr.me 2018 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy
php:正規表現を使って、HTMLタグの中以外の改行コードをBRに置き換える処理を教えてください。 今、正規表現を使って、HTML文章中の改行コードを、BRに置き換える処理をPHPにて実装しています。 が、この方法がわかりません。 最初は単純に改行コードをBRタグに置き換えればよいと思っていたのですが、、 この方法だと、HTMLタグ中に入っていた改行コードもBRに置き換えられてしまい。 例えば <img src="xxx" ¥n alt="xxx"> が <img src="xxx" <br> alt="xxx"> になってしまいます。 正規表現を使えば、タグの中の改行コード以外をBRに置き換えるという処理ができそうなのですが、処理方法がわかりません。 割と普通に使われそうな感じだったので、ググッて見たのですが、解りませんでした。 *ここは確認しましたが、これだけでは理解できませんでした。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く