タグ

正規表現に関するot2sy39のブックマーク (10)

  • シェル芸勉強会  AWK の基本 ­ パターンを使ったお手軽プログラミング 2015 年 12 月 26 日 斉藤 博文 (@hi_saito) Index 1. 自己紹介 2. 今回の内容 ­ 一行野郎 ­ 3. AWK の基本 ­ レコードとフィー��

    シェル芸勉強会  AWK の基 ­ パターンを使ったお手軽プログラミング 2015 年 12 月 26 日 斉藤 博文 (@hi_saito) Index 1. 自己紹介 2. 今回の内容 ­ 一行野郎 ­ 3. AWK の基 ­ レコードとフィールド ­ 3.1. レコードとフィールド ­ レコード ­ 3.2. レコードとフィールド ­ フィールド ­ 3.3. 覚えておいて欲しいこと ­ 1 オリジン言語 ­ 3.4. つまりどういうこと? 4. サンプルデータ 4.1. サンプルデータの取得 4.2. 今回のサンプルデータ ­ stars.txt ­ 4.3. 今回のサンプルデータ ­ 補足 ­ 4.4. AWK は行志向 4.5. サンプルデータを眺める ­ 1 ­ 4.6. サンプルデータを眺める ­ 2 ­ 4.7. サンプルデータを眺める ­ 3 ­ 4.8. サンプ

  • 正規表現

    jus共催、第3回今度はたぶん初心者向けに嘘はないでしょう午前のシェル勉強会/第21回未経験者大歓迎!誰でも働けるアットホームな職場ですシェル芸勉強会』の資料です。 スライド8ページ目 `tr' は `expr' のミスですので読み替えをお願いします。

    正規表現
    ot2sy39
    ot2sy39 2016/02/13
    “grep:すでに動詞として通用する”は言いすぎでは……
  • なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ - Qiita

    rex = /ごにょごにょ/ p "東京都文京区後楽1丁目3−61".match(rex).captures #=> ["東京都", "文京区", "後楽1丁目3−61"] みたいなやつ。なるべく短く。 実用性? そんなもの、うちにはないよ。 TL;DR 「読むのめんどくさい」という人用に最初に最終結果を置いておきます (...??[都道府県])((?:旭川|伊達|石狩|盛岡|奥州|田村|南相馬|那須塩原|東村山|武蔵村山|羽村|十日町|上越|富山|野々市|大町|蒲郡|四日市|姫路|大和郡山|廿日市|下松|岩国|田川|大村)市|.+?郡(?:玉村|大町|.+?)[町村]|.+?市.+?区|.+?[市区町村])(.+) あまり厳密ではないのでちゃんとしたとこでは使わないほうがいいです 住所データを用意する 郵便局からデータをダウンロードしておく。一ヶ月毎に更新されている。 → 郵便番号データ

    なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ - Qiita
    ot2sy39
    ot2sy39 2016/01/27
    楽しい。
  • sed メモ(第二版) - カビパン男と私

    HOME sed メモ(第二版) 2015-5-26(Tue) 私はこの小さな働き者が大好きだ。 〈目次〉 改行を挿入したい/ 空行を削除したい/ \n で改行にマッチする場合とマッチしない場合/ 2 行に渡るパターンを置換したい/ 特定の行を 1 行前に移動したい/ 特定の行を 1 行後ろに移動したい 特定の行を 1 行目に移動したい 特定の行を最終行に移動したい m行目とn行目を交換したい あるパターンに続く改行を削除したい/ あるパターンに先行する改行を削除したい/ 改行をすべて削除したい/ 段落内の改行を削除したい(その1)/ 段落内の改行を削除したい(その2)/ あるパターンを含む行の前行で置換をしたい/ マッチした文字列を抽出したい/ ファイルを通じて 1 回だけ置換したい/ 行内で置換の範囲を限定したい/ 改行コードの変換/ 行の長さを揃える/ さかさ言葉/ 文字グループの中

  • 正規表現:悪い表現、いい表現、最良の表現 | POSTD

    わずかな文字がいかにしてパフォーマンスに大きな違いを生めるかというお話 正規表現は、私たち開発者がことあるごとに駆使する呪文のようなものですが、私たちはそれをどんな時も巧みに使いこなしていると言えるでしょうか。正規表現は繊細で精密な言語です。入念な慎重さで記述してやれば、ボウリングで一瞬にして完璧なストライクを取るような強力なテキストとなり得ます。 しかし、正規表現が精密さに欠ける状態で投げ出されると、さながら酔っ払いがよろよろとつまずきながらテキストの上を歩くがごとく、そのボールはぎこちなくボウリングのレーンを転がり、ピンを1つか2つ倒すだけで終わってしまうのです。 これら2つの正規表現の違いは何なのか。何がいい表現と悪い表現を分けるのか。正規表現に素晴らしい力を与えるメカニズムを、この投稿で明かしてみようと思います。効果的な表現とそうでない表現との大きな違いをきっと分かってもらえるはず

    正規表現:悪い表現、いい表現、最良の表現 | POSTD
    ot2sy39
    ot2sy39 2015/08/03
    人間から見た記述の理解しやすさという尺度もある。
  • 正規表現入門 星の高さを求めて

    第13回日情報オリンピック(JOI2013/2014)春季トレーニング合宿での講義資料です. http://www.ioi-jp.org/camp/2014/2014-sp_camp-rules.html 【概要】 正規表現とはパターンマッチングのための記法であり,文字列検索の便利な道具として広く親しまれています.この講義では,正規表現の基礎から始め,「星の高さ」という性質に注目して正規表現の裏側に潜む数理構造に迫っていきます.1960年代から未解決である「星の高さ問題」に浪漫を感じてもらえると幸いです.

    正規表現入門 星の高さを求めて
  • 正規表現によるバリデーションでは ^ と $ ではなく \A と \z を使おう

    正規表現によるバリデーション等で、完全一致を示す目的で ^ と $ を用いる方法が一般的ですが、正しくは \A と \z を用いる必要があります。Rubyの場合 ^ と $ を使って完全一致のバリデーションを行うと脆弱性が入りやすいワナとなります。PerlPHPの場合は、Ruby程ではありませんが不具合が生じるので \A と \z を使うようにしましょう。 はじめに 大垣さんのブログエントリ「PHPer向け、Ruby/Railsの落とし穴」には、Rubyの落とし穴として、完全一致検索の指定として、正規表現の ^ と $ を指定する例が、Ruby on Rails Security Guideからの引用として紹介されています。以下の正規表現は、XSS対策として、httpスキームあるいはhttpsスキームのURLのみを許可する正規表現のつもりです。 /^https?:\/\/[^\n]+$/

    ot2sy39
    ot2sy39 2014/03/04
    デフォが単行のawkに死角はなかった。複数行モードのときは意識するしね。
  • スクリプト言語で重要な事はエロ画像集取で学んだ

    スクリプト言語で重要な事はエロ画像集取で学んだ 1. スクリプト言語で 重要な事は エロ画像集取で学んだ @shokai 大人のYAPC2013 2. 私 •@shokai (しょうかい) •趣味料理、glitch、RubyPerl書けないけど •LT応募したら通った… 3. Perl勉強した 4. Perl2.0の薄い 簡潔でわかりやすい! 5. 正規表現とか配列だけ でもだいぶ色々できる 6. 今日のお話 7. 画像いっぱい集めたい という欲求で いつのまにかRuby書ける ようになってた話をします 8. ぜんぜんPerlでてこ ないけど 9. たぶんPerlでも だいたい同じ感じで プログラミング学習で きると思うから許して 10. 2008年ごろ 11. Yahoo Pipesで 画像掲示板から RSS作りまくった 12. Web系やったこと なかったけど欲望 のまま100

    スクリプト言語で重要な事はエロ画像集取で学んだ
  • AWK Users JP :: gawk の 3 引数版 match 関数を使う

    awk には match 関数というものがあります。 通常の正規表現にマッチしたかどうかを判断する "~" (チルダ) 演算子と異なり、「開始位置」と「マッチした長さ」を変数 RSTART と RLENGTH に格納します。 これを用いることで、ある正規表現にマッチした部分だけを括弧で括るような場合にも使えます。 さて、gawk では match 関数が拡張され、引数を 3 つ取れるようになりました。 最後の引数は配列名を指定しますが、正規表現を括弧でグルーピングした際に、それぞれの開始位置とマッチした長さを個別に格納してくれます。 例えば、以下のように記述します。 #! /usr/local/bin/gawk -f # match.awk BEGIN { str = "toukyoutokkyokyokakyokukyokakyokutyou"; # 東京特許許可局許可局長 reg =

  • 正規表現練習ツール プロジェクト日本語トップページ - OSDN

    使い方 使い方は、正規表現文字列の欄に適応させてい正規表現文字列を入力し 適用欄をチェックして、変換される文字列の色を文字色欄のボタンから決定し 正規表現適用ボタンを押せば、下の空白欄に書かれている文字列に... 使い方を見る

    正規表現練習ツール プロジェクト日本語トップページ - OSDN
  • 1