[B! php][Tips] shozzyのブックマーク

shozzy id:shozzy

phpとTipsに関するshozzyのブックマーク (2)

「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う:phpspot開発日誌
Information Flow and Stock: [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！なので、できる限りpreg系の関数を使いたいわけですが、検索対象や検索パターンに日本語が含まれているときは、日本語処理に対応したereg系の関数であるmb_ereg系の関数が使われることが多いようです。以前、「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う方法。以前はmb_eregによる方法を示しましたが、次の方法の方がうまく動作するようです。 preg_match_all('/[一-龠]+|[ぁ-ん]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[ａ-ｚＡ-Ｚ０-９]+/u', $strToSplit, $aMatches); print_r($aMatches); // マッチ結果が全出力確かに、なぜか取れない漢字があ
shozzy 2006/12/12
php

Tips

regexp
リンク
PDF MEMO - 身の回り4畳半近辺の日記
PDFにはタイトルとか作成者、キーワードなどを含めることができますが、日本語を含めるにはどうすればいいのだろうと調べてみました。 Acrobatでは問題なく編集できます。で、PDFファイル作成のバッチ処理のため使おうと思っているpdftkというツールでは、このキーワードなどのメタデータを別途ファイルにしておいて設定できます。以下のような感じです。 $ pdftk in.pdf update_info meta.txt output out.pdf しかし、このファイルに直接日本語を入れてもだめでした。EUCやUTF-8にしてもだめ。そこでpdftkではPDFファイルのメタデータを取得することもできることを思いだし、 $ pdftk in.pdf dump_data output meta.txt みたいな感じで実行してみました。そして、この取得したテキストファイルを覗くと、日本語のデータ
shozzy 2006/09/29
数値文字参照encodeの方法

技術

Tips

php

Perl
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx