タグ

正規表現に関するkabacsharpのブックマーク (3)

  • 先読みと後読みの可能な、O(N)の正規表現エンジンの実装

    https://cybozu.connpass.com/event/53121/ での発表資料です。

    先読みと後読みの可能な、O(N)の正規表現エンジンの実装
    kabacsharp
    kabacsharp 2017/04/01
    なるほど!
  • grepでこういう時はどうする? - Qiita

    文字列を抽出するときも、抽出除外するときも便利なGREP、LinuxでCUI操作をするには無くてはならない存在です ほとんど抽出にしか使いませんが、多少覚え書きがありましたので共有しておきます よく使う使い方 grep 検索したい文字列 検索したいテキストファイル コマンド | grep 検索したい文字列 grep -e 検索したい文字列1 -e 検索したい文字列2 検索したいテキストファイル grep -i 検索したい文字列 検索したいテキストファイル grep -E '正規表現' source.txt #利用できる正規表現 . 改行文字以外の任意の1文字 * 直前の1文字の0回以上の繰り返しに一致。直前の文字は正規表現でも構わない ^ 行の先頭 $ 行の末尾 [ ] かっこ内の任意の1文字に一致。ハイフン(-)で範囲指定もできる [^ ] かっこ内の任意の1文字に不一致。ハイフン(-)

    grepでこういう時はどうする? - Qiita
    kabacsharp
    kabacsharp 2017/03/14
    grepなつかし。sed -e 'g/regexp/p'か
  • 正規表現ばかりに頼ってはいけない - id:anatooのブログ

    文字列のパースをする必要がある時、どんな文字列にでも何でもかんでも正規表現で処理しようとするエンジニアをたまに見かける。 正規表現は確かに文字列を扱うための強力な手段だが、万能ではない。正規表現の性質上、そもそもパースできない文法があるからだ。従ってそういうケースの時には正規表現ではなく別の方法を使ったほうが良い。正規表現を無理やり使っても、バグを埋め込んだり、メンテナンスが難しかったり、正しく文字列をパース出来なかったりで良いことはあまりない。 正規表現がパースできない文字列 正規表現が苦手とする文法で一番よく言われるのは、再帰的な構文を含む文法である。例えば、括弧つきの数式なんかがそうで、1+1 でも (1+1) でも ( (1+1) ) でも ( ( (1+1) ) ) でも ( ( ( ( 1+1) ) ) ) でも、という風にいくらでも入れ子にできる。正規表現では、こういった文字

    正規表現ばかりに頼ってはいけない - id:anatooのブログ
    kabacsharp
    kabacsharp 2014/09/27
    んじゃ、TSVかCVSで。・・・ダメプログラマだ、漏れ・・・
  • 1