[B! 正規表現] Cherenkovのブックマーク

Cherenkov id:Cherenkov

正規表現に関するCherenkovのブックマーク (40)

Regexper
Regular expression visualizer using railroad diagrams
Cherenkov 2019/02/19
正規表現

regex

tool

webservice
リンク
正規表現によるバリデーションでは ^ と $ ではなく \A と \z を使おう
正規表現によるバリデーション等で、完全一致を示す目的で ^ と $ を用いる方法が一般的ですが、正しくは \A と \z を用いる必要があります。Rubyの場合 ^ と $ を使って完全一致のバリデーションを行うと脆弱性が入りやすいワナとなります。PerlやPHPの場合は、Ruby程ではありませんが不具合が生じるので \A と \z を使うようにしましょう。はじめに大垣さんのブログエントリ「PHPer向け、Ruby/Railsの落とし穴」には、Rubyの落とし穴として、完全一致検索の指定として、正規表現の ^ と $ を指定する例が、Ruby on Rails Security Guideからの引用として紹介されています。以下の正規表現は、XSS対策として、httpスキームあるいはhttpsスキームのURLのみを許可する正規表現のつもりです。 /^https?:\/\/[^\n]+$/
Cherenkov 2018/04/05
正規表現

security

RegExp
リンク
Regex Crossword
A crossword puzzle game using regular expressions. Earn achievements completing puzzle challenges. Easy tutorials for people new to regular expressions.
Cherenkov 2013/07/18
正規表現

regex

game

PUZZLE
リンク
Scriptular - Javascript Regular Expression Editor
Scriptular is a javascript regular expression editor. Inspired by Rubular it gives you a simple way to test javascript regular expressions as you write them. Start by entering a regular expression and then a test string. Or give this example a try. Learn more about regular expressions in javascript.
Cherenkov 2012/03/21
firebug 素人入門者ホイホイぎりぎりのライン

javascript

正規表現

webservice

tutorial

idea
リンク
Berlin JS - RegExp Slides
► 2017 (2) ► January (2) ► 2016 (10) ► August (1) ► April (3) ► February (4) ► January (2) ► 2015 (36) ► December (2) ► October (2) ► September (2) ► August (4) ► July (5) ► June (5) ► May (1) ► April (6) ► March (4) ► February (4) ► January (1) ► 2014 (34) ► December (1) ► October (1) ► September (2) ► August (4) ► July (1) ► June (1) ► May (5) ► April (4) ► March (7) ► February (6) ► January (2)
Cherenkov 2012/02/23
正規表現

javascript

slide

RegExp
リンク
PHP で「全角ひらがな」や「全角カタカナ」かチェックする | Sun Limited Mt.
フォームのフリガナなどで全てひらがなのみ、またはカタカナのみかをチェックする方法です。 mb_ereg で判定する場合 mb_regex_encoding("UTF-8"); if (!mb_ereg("^[ぁ-ん]+$", $string)) { echo "ひらがなのみ"; } if (!mb_ereg("^[ァ-ヶー]+$", $string)) { echo "カタカナのみ"; } preg_match で判定する場合 mb_regex_encoding("UTF-8"); if (preg_match("/^[ぁ-ん]+$/u", $string)) { echo "ひらがなのみ"; } if (preg_match("/^[ァ-ヶー]+$/u", $string)) { echo "カタカナのみ"; } UTF-8 の文字コードの正規表現では u オプションをつけます。参考
Cherenkov 2012/02/02
全角ひらがな全角カタカナ preg_match("/^[ぁ-ん]+$/u" preg_match("/^[ァ-ヶー]+$/u"

正規表現

php
リンク
Big Sky :: 日本語grepが出来るjvgrepというのを作った。
日本語を扱っていて困るのがgrep。正規表現パターンにマルチバイト文字を混ぜられなかったり、windowsで動かすと"表"の様に2バイト目にbackslashが混じる文字で動作しなくなったりします。さらに複数のエンコーディングで書かれたファイルが散らばっていると一度のgrepで検索出来なかったりもします。 vimに限っては、内蔵のvimgrepを使う事で解決出来ますが、見つかったファイルをバッファに開いてしまうという挙動がある為、grepオリジナルの動作を求めている人にとっては都合の悪い物だったりもします。 vimgrepの様に複数のエンコーディングに対応していて、検索パターンにマルチバイト文字を含んだ正規表現が使えて、windowsでもちゃんと動いて、ついでといっちゃあなんだが、"**/*.txt"で再帰検索してくれる様なgrep無いかなぁと思ってたんですが、やっぱり無いので作りました
Cherenkov 2012/02/02
日本語検索 grep search / winはgithubのDownloadsからDLしてパス通す。jvgrep 表[現示] **/* でサブディレクトリも検索対象になる。

grep

Go

programming

vim

正規表現

jvgrep
リンク
Grep for Windows
Grep: print lines matching a pattern Version 2.5.4 Description Grep searches one or more input files for lines containing a match to a specified pattern. By default, grep prints the matching lines. Homepage http://www.gnu.org/software/grep/grep.html Sources: http://ftp.gnu.org/gnu/grep Download If you download the Setup program of the package, any requirements for running applications, such as dyn
Cherenkov 2011/08/25
BinariesとDependenciesを解凍、grep.exeと同じ場所にdllを置いて、パスを通す。

windows

grep

gnu

regexp

tool

正規表現
リンク
Shibuya.pm#16「夏の正規表現祭り」開催しました | TAKESAKO @ Yet another Cybozu Labs
2011年7月6日(水)にShibuya Perl Mongersテクニカルトーク#16「夏の正規表現祭り」を開催しました。 http://shibuya.pm.org/bl osxom/techtalks/201107.html 今回は株式会社ミクシィさんの新オフィスのセミナールームをお借りして開催することとなり、その後の懇親会も隣のコラボレーションルームで開催することができました。素敵なオフィス体験でした。テーマ – 「夏の正規表現祭り」日時 – 2011年7月6日(水) 18:45-21:00 (18:30 開場) 会場 – 〒150-0011 東京都渋谷区東1-2-20 住友不動産渋谷ファーストタワー 7F (株式会社ミクシィ) 料金 – 無料定員 – 110名 (いちばん大きなセミナールーム) 事前登録 – http://atnd.org/events/17082 にて参加申
Cherenkov 2011/07/10
perl

RegExp

Shibuya.pm

正規表現

JSON
リンク
Repl-Ace on .NET
「Repl-Ace on .NET Ver.1.0.4」を本日公開いたしました。 BBSにご報告頂いた不具合のフィクスのみで、新機能追加はありません。最小化や最大化したまま終了した場合でも、元のサイズに戻した場合の位置を再現できるようになりました。ただし、最大化からの復元に関しては、メインウィンドウではうまくいくのですが、ツール子画面系ではうまくいきません(対応は未定)。また、ズームでエラーとなり、強制終了する不具合を修正しました。「Repl-Ace on .NET」のご使用にあたっては、別途「Microsoft .NET Framework 2.0」および「Microsoft Visual C++ 2008 再頒布可能パッケージ (x86)」のインストールが必要となります。「Microsoft .NET Framework 2.0」は Microsoft Update などで入
Cherenkov 2011/06/17
文字列一括置換アプリケーション複数ファイル

正規表現

software

tool

windows
リンク
正規表現にUTF-8を使うには/uオプションをつける。: PHPの種ブログ
正規表現を組んでいて、なんだか思い通りの挙動をしないなーと思った時、思い出してください。マニュアル:パターン修飾子 u (PCRE_UTF8) この修正子は、Perl 非互換な PCRE の機能を有効にします。パターン文字列は、UTF-8 エンコードされた文字列として処理されます。この修正子は、UNIX では PHP 4.1.0 以降、Win32 では PHP 4.2.3 以降で使用可能です。また、PHP 4.3.5 以降では、パターンの UTF-8 としての妥当性も確認されます。 UTF-8な文字列をpreg系で使っている時は、uオプションを有効にしましょう！
Cherenkov 2011/04/29
「正規表現（パターン）にUTF-8を使う際は/uオプションをつける。UTF-8な文字列をpreg系で使っている時は、uオプションを有効にしましょう」マルチバイト文字コード

php

正規表現

RegExp
リンク
PHP: 正規表現パターンに使用可能な修飾子 - Manual
Regarding the validity of a UTF-8 string when using the /u pattern modifier, some things to be aware of; 1. If the pattern itself contains an invalid UTF-8 character, you get an error (as mentioned in the docs above - "UTF-8 validity of the pattern is checked since PHP 4.3.5" 2. When the subject string contains invalid UTF-8 sequences / codepoints, it basically result in a "quiet death" for the pr
Cherenkov 2011/04/22
日本語を含むパターンを使う場合は\uオプション必須。

php

RegExp

正規表現
リンク
[PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！
ウノウラボ Unoh Labs: PHPのちょっとしたコツ　最近のスクリプト言語は機能が多く、基本的な機能はほとんど実装されているので、アルゴリズムをどうこうするより、どの機能を使うか選ぶ方が重要だったりしますね（コーディングの効率的にも）。　自分にもそういったレベルで気をつけていることがいくつかあります。 -［早起き生活］PHPのパフォーマンスチューニング -［早起き生活］PHPのパフォーマンスチューニングその2：count()も使い過ぎると重くなる -［早起き生活］PHPのパフォーマンスチューニングその3：APC投入　あと、最近気づいたTIPSとしては、日本語を正規表現検索したいときでもereg系の関数を使うのはやめとけなんてのもあります。　PHPの組み込み正規表現関数にはPHP独自のereg系とPerl互換のpreg系がありますが、ヘルプに書いてあるとおり、ereg系
Cherenkov 2011/04/22
UTF-8な日本語に正規表現を使う場合は\uオプション必須。

php

正規表現

RegExp

Tips

文字コード
リンク
(pipes書く人向け)Yahoo Pipes のチューニング - m2
前回のエントリではめんどくさくて結果だけにしちゃいましたが、一番言いたかったチューニングがあんまり注目されてないのでちゃんと書いてみます。かなり面倒 Yahoo! Pipes の応答速度が結構遅くて、１箇所変更しては２?３秒待っては確認を繰り返す必要あり。根気が必要。これ、私の場合は 20 秒でした。根気ってレベルじゃない。ボトルネックは「Regex モジュール」 pipesエディタはよくできていて、選択した工程までの結果とかかった時間を表示してくれます。なのでどこがボトルネックなのかが一目瞭然です。以下は上で紹介している「Yahoo! Pipes の Page Fetch モジュールでスクレイピングし放題」の「はてブブックマーク件数一括取得API」のpipesエディタ画面。まずは Regex モジュールの前まで。「Time taken: 0.377219s」と出てますね。
Cherenkov 2011/01/25
pipes

performance

正規表現

regex

api

yahoo
リンク
JavaScript Regex :: XRegExp
“Regular Expressions Cookbook manages to be simultaneously accessible and almost ridiculously comprehensive.” —Jeff Atwood Recommended regex tools: • RegexBuddy • RegexMagic • PowerGREP What is it? XRegExp provides augmented (and extensible) JavaScript regular expressions. You get modern syntax and flags beyond what browsers support natively. XRegExp is also a regex utility belt with tools to make
Cherenkov 2010/12/27
john resig

browser

javascript

regexp

正規表現

library
リンク
東京都最強うんぬん - しろもじメモランダム
重箱の隅。 404 Blog Not Found:javascript+regexp - ていうか首都最強東京bookmarklet (function(e){ e.innerHTML = e.innerHTML.replace( /東京都?([\u3200-\u4DBF\u4E00-\u9FFF\uF900-\uFAFF]+)/g, '首都$1東京' ) })(document.body) 漢字を判定する正規表現が工夫のしどころでしょうか。[一-龠]はUnicode時代にはちょっと古い。grep CJK /usr/local/lib/perl5/5.10.0/unicore/Blocks.txtが参考資料代わりです。 404 Blog Not Found:javascript+regexp - ていうか首都最強東京bookmarklet \u3200-\u4DBF とあるけど、U+320
Cherenkov 2010/11/29
日本語文字コード漢字判定判別

正規表現

javascript

unicode

RegExp
リンク
[追記]JavaScriptには\uXXXXがあるんですよ / LiosK-free Blog
2008-01-14 カテゴリ: Client Side タグ: Tips JavaScript トラックバック [追記]404 Blog Not Found:javascript - \uXXXXを使わない理由を受けて追記 dankogaiさんはあまりJavaScriptのリテラルに詳しくないのかな？ 404 Blog Not Found:regexp - 全角英数字を半角に var fascii2ascii = (function(){ var cclass = '['+String.fromCharCode(0xff01)+'-'+String.fromCharCode(0xff5e)+']'; var re_fullwidth = new RegExp(cclass, 'g'); return function(s){ return s.replace(re_fullwidth,
Cherenkov 2010/11/29
サロゲートペアサロゲート・ペア文字コード日本語文字判定

unicode

javascript

正規表現

regexp
リンク
Unicodeで「漢字」の正規表現 – ものかの
改訂：2017/07/22 Unicode 10.0に合わせて書き直し。正規表現を簡易にしようとしてやりすぎていたのを修正。改訂：2023/03/21 U+30000以降を追加。InDesignの正規表現を追記。正規表現で漢字の範囲指定をする場合、Unicodeではどうするかが悩ましいところです。 Unicodeの漢字の範囲として [一-龠] にしている例を見かけます。しかしこれは旧規格JIS X 0208の漢字が含まれる範囲をUnicodeの中から切り出しているだけです。互換漢字ブロックをまるごと取りこぼしているので、WindowsのシフトJIS（CP932）の拡張漢字に当たるものが含まれていません。現規格JIS X 0213の第３・第４水準漢字も考慮されていません。簡易な範囲指定だとしても、新常用漢字の「𠮟」が含まれておらず、今から見るとあまりに時代遅れです。 Unicodeのす
Cherenkov 2010/11/29
々〇の次の文字、エディタにコピペして?のように文字化けするかもしれないので注意。

正規表現

unicode

regexp

javascript
リンク
gkbr.me
このドメインを購入する。 gkbr.me 2018 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy
Cherenkov 2010/11/16
webservice

programming

regexp

正規表現
リンク
php：正規表現を使って、HTMLタグの中以外の改行コードをBRに置き換える処理を教えてください。…
php：正規表現を使って、HTMLタグの中以外の改行コードをBRに置き換える処理を教えてください。今、正規表現を使って、HTML文章中の改行コードを、BRに置き換える処理をPHPにて実装しています。が、この方法がわかりません。最初は単純に改行コードをBRタグに置き換えればよいと思っていたのですが、、この方法だと、HTMLタグ中に入っていた改行コードもBRに置き換えられてしまい。例えば <img src="xxx" ￥n alt="xxx"> が <img src="xxx" <br> alt="xxx"> になってしまいます。正規表現を使えば、タグの中の改行コード以外をBRに置き換えるという処理ができそうなのですが、処理方法がわかりません。割と普通に使われそうな感じだったので、ググッて見たのですが、解りませんでした。＊ここは確認しましたが、これだけでは理解できませんでした。
Cherenkov 2010/10/14
php

正規表現
リンク
1 2 次のページ