[B! regex] shimookaのブックマーク

PHPの正規表現で^$より\A\zがいい理由 - Qiita

正規表現のメタ文字とエスケープシーケンスについておさらい。メタ文字 ^: (ハット記号) 検索対象（複数行モードでは行）の始まりを言明メタ文字 $: (ドル記号) 検索対象の終わりあるいは終端の改行文字の前（複数行モードでは行の終わり）を言明エスケープシーケンス \A: 検索対象文字列の始端（複数行モードとは独立）エスケープシーケンス \z: 検索対象文字列の終端（複数行モードとは独立）言明 \A, \Z, \z は、（アンカーで説明する）ハット記号やドル記号とは異なり、オプション設定によらず、文字列の始端または終端だけにマッチします。これらの言明は、PCRE_MULTILINE および PCRE_DOLLAR_ENDONLY オプションの影響を受けません。 \Z と \z との違いは、 \Z は文字列の末尾の改行の前の位置および文字列の終端にマッチするのに対し、\z は

$PHPの正規表現で^$より\A\zがいい理由 - Qiita$

shimooka 2019/01/24

php
regex

リンク

PHPでは正規表現コンパイル結果のキャッシュが暗黙に行われている - hnwの日記

筆者がPHPをさわり始めたころ、「PerlのコレはPHPではどうやるんだろう？」と思うことが頻繁にありました。一部の疑問については解説を見つけたり自分でソースコードを読んだりして解決したものの、考えるのをやめてしまったものもあります。その一つが正規表現コンパイル結果の保存に関するもので、最近まで完全に忘れていました。正規表現のコンパイルというのは与えられた正規表現を解釈して実行しやすいデータ構造に変換する作業のことを指します。具体的にはDFA（決定性有限オートマトン）を構成するか、正規表現エンジン内部で用いられるVM命令列に変換するかといった処理になります。これらは複雑な処理ですので、性能の観点で言えば同じ正規表現に対するコンパイル処理はできるだけ繰り返したくありません。 Perlの場合、/foobar/ のようなスタティックな正規表現のコンパイルは1回しか行われません。一方で、正規表現

shimooka 2016/10/31

リンク

PHPで学ぶVM型正規表現エンジンの仕組み

PHPカンファレンス福岡での発表資料です。

shimooka 2015/06/30

anatoo
regex

リンク

PHPの正規表現こう書くといいよ

if(preg_match('/^(?!(?:(?:\x22?\x5C[\x00-\x7E]\x22?)|(?:\x22?[^\x5C\x22]\x22?)){255,})(?!(?:(?: \x22?\x5C[\x00-\x7E]\x22?)|(?:\x22?[^\x5C\x22]\x22?)){65,}@)(?:(?:[\x21\x23-\x27\x2A\x2B\x2D\x2 F-\x39\x3D\x3F\x5E-\x7E]+)|(?:\x22(?:[\x01-\x08\x0B\x0C\x0E-\x1F\x21\x23-\x5B\x5D-\x7F]|(?:\x5C [\x00-\x7F]))*\x22))(?:\.(?:(?:[\x21\x23-\x27\x2A\x2B\x2D\x2F-\x39\x3D\x3F\x5E-\x7E]+)|(?:\x22( ?:[\x01-\x08\x0B

shimooka 2015/06/29

リンク

PHPで仮想マシンベースの正規表現エンジンを作ってみる第二回

こんにちは、久保田です。 PHPで仮想マシンベースの正規表現エンジンを作ってみる第二回です。前回の第一回では、PHPで作成する正規表現の仕様の紹介や正規表現のパーサの実装を行いました。今回の記事では、正規表現を実行する仮想マシンをPHPで実装します。正規表現を実行する仮想マシンまず、実装する仮想マシンの仕様について解説します。Regular Expression Matching: the Virtual Machine Approachでは仮想マシンについては以下のように記述しています。 To start, we'll define a regular expression virtual machine (think Java VM). The VM executes one or more threads, each running a regular expression

shimooka 2013/10/10

こういうの良いよね

リンク

Which is the correct shorthand - "regex" or "regexp"

Collectives™ on Stack Overflow Find centralized, trusted content and collaborate around the techno logies you use most. Learn more about Collectives Teams Q&A for work Connect and share knowledge within a single location that is structured and easy to search. Learn more about Teams

shimooka 2013/09/20

ベストアンサーが秀逸すぎる

neta
regex

リンク

bashの正規表現マッチングの使い方 - adsaria mood

あるフリーウェアのインストール用bashプログラムを見ていたら次の様なものがあった。（以下の例は簡略化してある。） STRING="abc" if [[ "$STRING" =~ "^ab[cd]$" ]]; then echo "matched" else echo "unmatched" fi if文の条件表現の中に“=~”というオペレータがある。manを見ると =~ オペレータは文字列を正規表現と比較するとある。知らなかった。bashの文字列比較で正規表現が使えるとは。私は正規表現比較が必要な時はgrepに喰わせて判断していたのだが、これを使えば簡単にできる。ところが、だ。上のプログラムが期待通りに動かない。上の例では =~ の左辺と右辺の正規表現はマッチするはずだが、結果は“unmatched”。色々と正規表現を変えてみたが、どれとしてマッチングしない。しかし、if文を次のように

shimooka 2013/08/05

リンク

正規表現の限界 @ Shibuya.pm

swatmac.info Buy this domain. 2020 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

shimooka 2012/10/10

リンク

正規表現の先読み・後読みを極める！ - あらびき日記

この記事は abicky.net の正規表現の先読み・後読みを極める！に移行しました

shimooka 2012/09/14

regex

リンク

電話番号、郵便番号にマッチする真の正規表現 : にぽたん研究所

Shibuya.pm #16 「夏の正規表現祭り」で、正規表現のお話をさせていただきました。まぁ、「電話番号にマッチする正規表現」とか「郵便番号にマッチする正規表現」とかよく書かれてるけど、「どれもこれも手緩いよね」って話。あ、だいぶはしょったかな。とりあえずスライドに書いたので、発表をご覧になってない方はスライドからご覧ください。ふと見返すと、このブログで電話番号の正規表現を公表するのは 3 度目ですが、あれからだいぶ経ってますね。今ではもっと厳密な正規表現を作っています。そして、Number::Phone::JP に続き、Number::ZipCode::JP という酔狂なモジュールが公開された記念で、郵便番号にマッチする正規表現を今回初めて公開しますが、そもそもここまで厳密な正規表現が公開されること自体、本邦初公開ってヤツでしょう。 Shibuya.pm でも言いましたが

shimooka 2011/07/07

すでに"ネタ"の域ではない。ある意味アート。この正規表現をどうやって生成してるかの方が気になる。まさか手書きじゃないよね。

リンク

Perl正規表現雑技

このページは Perl5.6 を対象としています． perl スクリプトは EUC-JP で書かれることを想定しています．このページは正規表現メーリングリストを参考に，私が独自にメモとしてまとめたものです．このページの正規表現やスクリプトについての詳しい説明，わかりやすい説明はおそらくできません．このページに書かれているスクリプトは，個人の責任において実行してください．このページに書かれているスクリプトの利用・改造は自由です．その際はどこかにこのページの URI( http://www.din.or.jp/~ohzaki/regex.htm )を参考として記述していただければ幸いです(任意)．ご意見・ご感想・ご要望などはにお願いします．こう書いた方がいい，動かん，わからん，バグってる，これ書け，などなどお待ちしています．このページへのリンクは自由に張ってく

shimooka 2010/03/31

regex
tips

リンク

特定の複数単語を含まない正規表現って意外と難しいなぁ。正規表現は奥が深い。 (?... by よしみ@かんかん泣き - Wassr [お気軽メッセージングハブ・ワッサー]

USER CHANNEL PHOTO TRAVEL 特定の複数単語を含まない正規表現って意外と難しいなぁ。正規表現は奥が深い。 (?!(?=.*(foo|bar))).* でできるっぽい。 by よしみ@かんかん泣き at 2009-05-01(Fri) 18:01:18 via api[wig.rb] レスイイネ: レス投稿レス投稿を行うにはまずログインしてください。新規登録はこちらから！

shimooka 2009/11/12

ﾋﾟｺｰﾝ

regex

リンク

正規表現の先読みと後読みはどっちがどっちだかわかりにくいんだよ！（追記あり） - chalcedony_htnの日記

といつも思うので、自分用にメモすることで覚えようという魂胆です。以下はInDesign CS4の正規表現について記述します（たしかCS3から使えたような気がする）。結論から名前英語で位置演算子後読み lookbehind マッチパターンより前の部分 (?<=)　肯定 (?<!)　否定先読み lookahead マッチパターンより後の部分 (?=)　肯定 (?!)　否定肯定の場合はパターンの前が「=」、否定の場合は「!」。英語を見ると「後読み」「先読み」の訳語も納得できそうな気はするのですが、やっぱりわかりにくいです。背後と前方……とか言うとまた混ざるし！「つぎの電車」と「こんどの電車」はどっちが早く発車するかみたいな感じに似ていますな。別に演算子さえ覚えてしまえば名前は意識しなくてもよさそうなのですが、せっかくInDesignには正規表現の記述支援機能がついてるので

shimooka 2009/11/12

regex

リンク

あまり知られていないけれど、HTML5では正規表現が使えるようになる

正規表現といえば、主にsedやawkといったUNIXのコマンドで、あるいはPerlやPHP、JavaScriptなどのスクリプト言語の中などで、プログラマーが文字列を操作するために使う道具でした。その正規表現がHTML5でサポートされる見通しです。いままで正規表現を使わずに済んでいたデザイナやコーダーといった職種の方々も、いずれ仕事としてきちんと正規表現を扱わなければならない時代がやってきます。 HTML5のどこに正規表現が使えるようになるの？正規表現は、input要素のpattern属性の中で使えることになる予定です。W3Cが2009年8月25日付け公開しているHTML5のワーキングドラフトの「4.10 Forms」の「4.10.4.2.8 The pattern attribute」では次のように記載されています。 The pattern attribute specifies a

shimooka 2009/10/01

へー

html5
regex

リンク

Javaで正規表現を活用する（java.util.regexパッケージ）

Javaで正規表現を活用する（java.util.regexパッケージ）：JavaTips ～Javaプログラミング編 PerlやUNIXのgrepなどで欠かせない正規表現ですが、Javaでもこれを扱うためのパッケージjava.util.regexがJ2SE1.4からコアAPIに導入されました。ここでは、正規表現自体の詳細には触れず、クラスとそのメソッドの使い方についてのみ言及することにします。まずは、具体的なサンプルを見てみましょう。サンプルは以下のような処理を行っています。「javaまたはclassという拡張子が付いたファイル名を表す正規表現」と、入力文字列全体がマッチするかを「matches（マッチ）」によって調べる入力文字列に正規表現にマッチする部分文字列があるかどうかを「find(検索)」により調べる存在した場合には「group, start, endの各メソッドによって

shimooka 2009/09/18

リンク

正規表現メモ

\x{} \pは後続する名前が表すクラス(プロパティ、スクリプト、ブロック)に属する文字にマッチし、 \Pは後続する名前のクラスに属さない文字にマッチします。クラスの名前が一文字のときはブレースを省略できます。クラス名の前に^を置くことにより否定形の指定を行うことも可能です。 Perl 5.8 での変更点 Perl5.8以降(5.6でも使えたようですが)では \pや\Pで始まるプロパティ指定に標準Unicode属性を使うこともできます。詳しくは perlunicode perlunicode - Perl における Unicode サポートを参照してください。日本語による説明が Unicodestandard にもあります。 Perl 5.8以降ではユーザーが任意のプロパティを作成することができます (IsまたはInを必ず前置)。詳しくは perlunicode perluni

shimooka 2009/09/03

リンク

regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found

2009年03月09日00:30 カテゴリLightweight LanguagesTips regexp - ^$でなくて\A\zを使おうまずは回答から。正規表現で「制御文字以外」のチェック - ockeghem(徳丸浩)の日記文字エンコーディングの妥当姓制御文字(\x00〜\x1f, \x7f)のチェック文字列長のチェックこのうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。こういう時には、「全文字がOKならOK」と考えるのではなく、「一文字でもNGならNG」と考えると楽になります。それは「スペースと非制御文字以外」なのですから、/[^ \S]/が求めていた正規表現で、=~ではなく!~が使うべき演算子ということになります。全角スペースもOKにしたければ、/[^ \x{3000}\S]/。[追記参照] [Run via Codepad] #!perl -

$regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found$

shimooka 2009/03/09

リンク

txt2re 文章から対話的に正規表現を作れる支援サービス

一週間のうちにいくつも正規表現のツールが話題になるのは、正規表現で悩むプログラマが多いということだろう。また面白いサービスが出てきた。 txt2reは、テキストボックスに入れたテキストを分解し、そこからどんな正規表現が作 […] 一週間のうちにいくつも正規表現のツールが話題になるのは、正規表現で悩むプログラマが多いということだろう。また面白いサービスが出てきた。 txt2reは、テキストボックスに入れたテキストを分解し、そこからどんな正規表現が作りたいのかを推測して提案してくれるというサービス。サンプルで入っているテキストでは、日付(の英語表現)のあとに引用文で英文、という入力。入れたものが要素ごとに分解された上で、まとまった部分が「文字列」なのか「月」なのか「アメリカの州」なのか、といった推測がされて、選択肢としてリンク表示される。「ここは月のつもりだった」ということでMonthを

shimooka 2008/03/30

面白いなこれ

リンク

re2c — re2c 3.0 documentation

re2c is a free and open-source lexer generator for C/C++, Go and Rust with a focus on generating fast code. It compiles regular expression specifications to deterministic finite automata and encodes them in the form of conditional jumps in the target language. This approach is generally faster than table-based lexers, and the generated code is easier to debug and understand. A flexible user interf

shimooka 2008/02/15

regex

リンク

はてなブックマーク

タグ

関連タグで絞り込む (16)

regexに関するshimookaのブックマーク (19)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス