タグ

Rubyとプログラミングに関するs_hiiragiのブックマーク (1)

  • 正規表現で制御文字をフィルタする

    cles::blog 平常心是道 blogs: cles::blog NP_cles() « Solr1.4-devとcmecab-java :: php 5.3 リリース » 2009/06/30 正規表現で制御文字をフィルタする  ruby  regex 35 3へぇ Rubyでテキストファイルを大量に処理するプログラムを書いているのですが、元データの関係で文字列中に制御文字が入ってしまっていて、それが後続の処理に影響を及ぼしてしまうことがわかったので、正規表現を使って下記のような処理を書いてみました。 00.chr+"hoge" # => "\000hoge" (00.chr+"hoge").gsub(/[[:cntrl:]]/,"") # => "hoge" ところが、このままだと制御文字が無条件に取り除かれてしまうので改行もなくなってしまいます。 "hoge\nhoge".gsu

    正規表現で制御文字をフィルタする
  • 1