タグ

textとcharcodeに関するkenjiro_nのブックマーク (3)

  • Perl5 において chomp() とはなにをするものか - tokuhirom's blog

    えてして、プログラミングにおけるバグの発生源は、使い方をまちがえていることに起因するものも多い。 を電子レンジでかわかす人がいるように。 そもそも chomp() という組み込み関数はなぜ必要なのか。 Perl5 では、データを行単位で処理するということが重視されたインターフェイスになっている。これは一般的なテキスト処理の頻出パターンだからだ。 while (<>) { chomp; say if /foo/; } これは、入力データを行ごとにとりだし、改行をとりのぞき、/foo/ という正規表現にマッチする行だけを表示するというプログラムだ。 Perl5 を知っている人なら、だれもが簡単に理解できる。 ここで $/ という変数が問題となる。$/ は、行の区切りがはいっている特殊なグローバル変数で、awk でいうところの RS にあたるものだ。 この $/ を変更することにより「行」の区

  • http://www.fastriver.net/~ryo/projects/a2ps-utf8-ja/libnkfm-0.1/

  • a2ps 4.14 の UTF-8 対応 (日本語のみ Japanese Only)

    説明 a2ps で直接 UTF-8 なテキストファイルを印刷しちゃおうという試みです。 Fedora や Ubuntu あたりのパッチだと、EUC-JP は印刷できるけど UTF-8 の ファイルを直接印刷しようとすると文字化けしてしまうのです。 UTF-8 なテキストファイルを iconv とかで EUC-JP に変換するようなラッパー スクリプトを書いちゃえば良いと言えばそれまでですが、一応そのまま印刷でき るようなパッチを作成してみました。 とはいえ、a2ps の中で nkf (libnkfm)使って EUC-JP に変換してるだけとい う、かなりお粗末なものなので、もちろんw 日語にしか対応していません。 m(__)m あと、エラー処理なんてしてませんので、気になる方は適当に直していただけ ますでしょうか。修正したものをフィードバックしてもらえるとうれしかったり します。 a2p

    kenjiro_n
    kenjiro_n 2013/10/18
    野良ビルドする予定なのでCentOSタグは付けず。必要となるlibnkfmは同サイトの id:entry:166288490 にあり。
  • 1