[B! 正規表現] gazza069のブックマーク

文字数のカウントはどれが正解なのか?

A. ユースケース次第でどう実装すべきかは変わる。Intl.Segmenter が万能というわけでもない。 (クソ最悪な小バズをかましてしまったので、贖罪も兼ねて記事を書きました) 「文字数を数える」のは難しい「文字数を数える」実装は意外と難しいです。というのも、アルファベットや数字だけなら str.length でも正しく数えられますが、絵文字や異体字などが入った文字列は見た目どおりに数えられません。

gazza069 2024/04/25

リンク

PythonでEUC-JPのファイルを読み込んで正規表現を使う方法

PythonでEUC-JPのファイルを読み込んで正規表現を使う方法を紹介します。 Pythonは2.x系です。１．問題点下記の、文字コードがEUC-JPのファイルがあります。 text.txt テスト1 テスト2 テスト3 このファイルから「テスト2」の部分だけをマッチさせたいので、下記のスクリプトを作ったのですがマッチしません。 #!/usr/bin/env python2 # -*- coding: utf-8 -*- import sys import codecs import re path = './test.txt' f = codecs.open(path, 'r', 'euc_jp') for line in f: result = re.search('テスト2', line) if result: print line ということで、PythonでEUC-JPのフ

gazza069 2022/07/28

リンク

regxr - macOS用の正規表現チェッカー

MOONGIFTはオープンソース・ソフトウェアを紹介するブログです。2021年07月16日で更新停止しましたプログラマといえども難しいのが正規表現です。プログラミング言語によって方言もありますし、マッチした後の変換などでつい指定を間違えてしまったりします。Atomなどはマッチした部分が置換前にハイライトされますが、Emacsなどはそんな機能もないので何度もミスしてしまいます。そこで使ってみたいのがregxrです。macOS用の正規表現チェッカーです。 regxrの使い方上に正規表現、下にサンプルになるテキストを記述します。マッチした場所がハイライトするので分かりやすいです。反映はリアルタイムに行われます。正規表現の練習に良いですね。 regxrはSwift製なので、適用される正規表現はSwiftで使えるものになるでしょう。プログラムに組み込む前に正規表現を試したり、思ったマッチに

gazza069 2022/07/28

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

正規表現に関するgazza069のブックマーク (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第1週）

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス