[B! unicode] machupicchubetaのブックマーク

Text Converter | Unicode Text Converter

machupicchubeta 2021/07/03

unicode
font

リンク

正規表現 (Ruby 2.5.0)

[edit] メタ文字列とリテラル、メタ文字とエスケープ式展開文字任意の1文字文字クラス特別な文字列に対するマッチ繰り返しキャプチャグループ部分式呼び出し(subexpression call) 選択アンカー条件分岐オプションエンコーディングコメントフリーフォーマットモード非包含オペレータ (absence operator) (実験的) 一覧特殊変数参考文献正規表現(regular expression)は文字列のパターンを記述するための言語です。また、この言語で記述されたパターンも正規表現と呼びます。正規表現を用いると、文字列が指定したパターンを含んでいるかどうかを判定し、また含んでいるならばそれが文字列中のどの場所であるかを知ることができます。 /pat/ %r{pat} などの正規表現リテラルや Regexp.new などで正規表現オブジェク

machupicchubeta 2019/06/26

リンク

[連載:正規表現] Unicode文字プロパティについて(1)｜TechRacho by BPS株式会社

はじめまして、hachi8833です。正規表現において、使わないまま死ぬのはあまりにもったいない「Unicode文字プロパティ」について解説します。これについてネット上にまとまった情報がほとんどなく、しかたがないので自分で書くことにしました。書きながら早くも記事があふれてきたので、見出しに「連載」の文字を追加などしてみました。たぶん他所ではほとんど見かけることのない連載になると思います。よろしくお願いします。通常の開発においては、目的を達成する正規表現を作成してコードが動けば事足りるものであり、コーディング中に正規表現と延々付き合うことは普通ないでしょう。料理人は包丁を研ぐのに時間をかけすぎないものです。しかし特殊な業界の特殊な人々(日本に5人もいないと思います)は、来る日も来る日も正規表現を書き続けていたりするので、このUnicode文字プロパティは本当にありがたいものです。私の場合

machupicchubeta 2019/06/26

リンク

Rubyの正規表現の/[\p{katakana}]/ ってなんなの - Qiita

会社の人が書いたRubyのコードの正規表現で /[\p{katakana}]*/みたいなのがでてきて、なんだこれって思ったので調べた。へー 'アイウエオ' =~ /\A[\p{katakana}]+\z/ #=> 0 'あいうえお' =~ /\A[\p{katakana}]+\z/ #=> nil 'アイウエオあいうえお' =~ /\A[\p{katakana}]+\z/ #=> nil 'イロハニホヘトチリヌルヲ' =~ /\A[\p{katakana}]+\z/ #=> 0 'イロハニホヘトチリヌルヲワカヨタレソツネナラムウヰノオクヤマケフコエテアサキユメミシヱヒモセス' =~ /\A[\p{katakana}]+\z/ #=> 0 'ｲﾛﾊﾆﾎﾍﾄﾁﾘﾇﾙｦﾜｶﾖﾀﾚｿﾂﾈﾅﾗﾑ' =~ /\A[\p{katakana}]+\z/ #=> 0 'テンノウズアイル' =~ /\A[\

$Rubyの正規表現の/[\p{katakana}]/ ってなんなの - Qiita$

machupicchubeta 2019/06/26

リンク

MySQLにおける文字コードutf8mb4の設定 - Qiita

machupicchubeta 2019/04/14

リンク

寿司=ビール問題 : MySQL 8.0でのUTF8サポート入門 (MySQL Server Blogより) | Yakst

これまでのMySQLでよく問題になった、絵文字や日本語の文字の照合やソート順序の問題に関して、来たるMySQL 8.0では大幅な改善が加えられる予定になっている。この問題の概要と今後の改善方針について、MySQL開発チームからの解説。免責事項この記事はManyi Lu氏によるMySQL Server Blogの投稿「Sushi = Beer ?! An introduction of UTF8 support in MySQL 8.0」(2017/1/13)をユーザが翻訳したものであり、Oracle公式の文書ではありません。 MySQL 8.0での私たちの計画として、utf8のサポートを大幅に改善します。utf8サポート自体はMySQL 4.1の頃にさかのぼりますが、いくつかの制限が存在しています。記事タイトルにもある「寿司 = ビール」問題は、バグ#76553のことを指しています。少

machupicchubeta 2019/04/14

リンク

[MySQL] 文字コード問題 -みんな大好き寿司ビール🍣🍺- - Qiita

machupicchubeta 2019/04/14

リンク

In MySQL, never use “utf8”. Use “utf8mb4”.

Today’s bug: I tried to store a UTF-8 string in a MariaDB “utf8”-encoded database, and Rails raised a bizarre error: Incorrect string value: ‘\xF0\x9F\x98\x83 <…’ for column ‘summary’ at row 1This is a UTF-8 client and a UTF-8 server, in a UTF-8 database with a UTF-8 collation. The string, “😃 <…”, is valid UTF-8. But here’s the rub: MySQL’s “utf8” isn’t UTF-8. The “utf8” encoding only supports th

machupicchubeta 2019/04/14

リンク

Unicodeにあるハイフン/マイナス/長音符/波線/チルダのコレクション | hydroculのメモ

Unicodeにあるハイフン/マイナス/長音符/波線/チルダのコレクション 2015/06/18 Unicodeにある文字の中からハイフンのような横棒と波線を集めてみました。複数あるのはわかっていたつもりでしたが、こんなにたくさんあるとは思いませんでした。横線に関しては、ハイフンや長音符(カタカナの長音記号)、罫線など、線が横に延びているものです。縦方向や斜めの線は除きます。ほとんど横線だけどほんのちょっとだけ斜め(主観)になっているものは含みます。点線や矢印、線が2つ以上に分かれているものは除きます。途中で曲がっているものも除きます。横線が上の方だったり下の方だったり、太さが途中で変わるものも含めています。波線に関しては、横方向の線が、直線ではなくS字カーブになっているもので、縦や斜めのS字を除きます。 S字カーブを超えて複雑な曲線も除いています。ただ、文字の名前に “wave” と

machupicchubeta 2017/12/24

unicode

リンク

UTF-8 to escape sequences - ratfactor

For a modern JavaScript utility which does exactly why my tool used to do, I recommend js-escapes. The following are shorthand notes for the conversion. For a thorough discussion (and for my notes below to mean anything), I recommend the Wikipedia article on UTF-8. if first_byte > 1111 0000 (F0h, 240d) then there will be 4 bytes in this character if first_byte > 1110 0000 (E0h, 224d) then there wi

machupicchubeta 2017/12/24

unicode

リンク

Unicode対応 JIS X 0208 文字コード表

Unicode対応 JIS X 0208 文字コード一覧 JIS X 0208 の区点番号、JISコード、シフトJISコード、EUCコード、Unicode(UTF-8, UTF-16)の文字コード対応一覧です。文字コードとその文字を順に出力しているだけですので、表示される文字はフォントによって決まります。 01区～08区　JIS非漢字（各種記号、英数字、かな） 13区～13区　NEC特殊文字（機種依存） 16区～47区　JIS第1水準漢字 48区～84区　JIS第2水準漢字文字コードについてのページや、文字コード一覧についての説明もあります。 JIS X 0208 JIS非漢字文字コード表区点 JIS SJIS EUC UTF-8 UTF-16 字 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001

machupicchubeta 2017/12/24

unicode

リンク

ダッシュ (記号) - Wikipedia

^ a b § 全角ダッシュのマッピング問題を参照。全角ダッシュのマッピング問題[編集] JIS X 0208およびJIS X 0213漢字集合1面の1区29点には「ダッシュ(全角)」があり、ISO/IEC 10646およびUnicodeの対応する文字名はEM DASHと定義されている。従って、この(面)区点位置に対応するUnicodeの符号位置はU+2014である。なお、JIS X 0213:2000には最初誤ってU+2015と印刷されていたが、2001年5月付けの正誤表で訂正された。2002年5月発行の日本規格協会『増補改訂 JIS漢字字典』でもU+2014としており、2004年のJIS X 0213改正でもU+2014であることが確認されている。JIS X 0213:2000/追補1:2004の規格票解説3.3.5では、JIS X 0208の1区29点がISO/IEC 10646

machupicchubeta 2017/12/24

unicode

リンク

ハイフンに似てる文字の文字コード - Qiita

日本語環境ではハイフンっぽく見える文字が何種類も有ります。そのせいで、住所入力欄などでハイフン(っぽい文字)でバリデーションにひっかかってイライラするということが多々有ります。一般のユーザーがハイフンっぽい文字の違いを理解しているはずもないので、ハイフン系文字の内、特定の1つだけを許容するようなバリデーションルールを設定してしまうと、ユーザビリティを低下させてユーザの離脱を招きます。ハイフンっぽいものは全部入力できるようにして、サーバサイドで統一的な文字に置換するほうが良いでしょう。というわけで、日本語環境で入力できるハイフンをまとめてみました。文字 UTF-8 Unicode 説明

machupicchubeta 2017/12/24

unicode

リンク

MySQLのencodingをutf8からutf8mb4に変更して寿司ビール問題に対応する｜TechRacho by BPS株式会社

⚓ utf8の4バイト文字問題は突然にこんにちは、hachi8833です。 MySQLのデータベースでencoding=utf8が指定されていると、UTF-8の文字長が4バイトの文字をデータベースに保存できなくなる、いわゆるUTF-8の4バイト文字問題、またの名を「寿司ビール問題」が発生することがあります（「MySQLのutf8の4バイト文字問題とは」で後述）。 BPSWebチーム部長のmorimorihoge さんがこの問題に対応したときの手順をメモします。 ⚓ utf8からutf8mb4に移行する手順 MySQLのストレージエンジンはInnoDBが前提です。utf8mb4を指定するにはMySQLのバージョンが5.5以上である必要があります。 ⚓ 1. 以下のコマンドでdumpを取る mysqldump --no-create-info --ignore-table=mydata_st

machupicchubeta 2017/11/16

リンク

MySQLの文字コード事情

Node.js Native ESM への道〜最終章: Babel / TypeScript Modules との闘い〜Teppei Sato

machupicchubeta 2016/11/10

MySQL 5.7

リンク

MySQL と寿司ビール問題 - かみぽわーる

MySQL と Unicode Collation Algorithm (UCA) - かみぽわーるに関連するトピックで、 MySQL には寿司ビール問題というのがある。寿司ビール問題どっかで詳しくお話を聞くべきだよなぁ。。。— RKajiyama (@RKajiyama) March 18, 2015 これはどういう問題かというと、 MySQL の Unicode では binary collation にしてコードポイントで比較しないと🍣と🍺に限らず絵文字が同値判定されるという問題です。あれ？ MySQL の utf8mb4 charset って、4バイト文字同士を比較すると同じ文字扱いされる？ SELECT '🍣'='🍺' → 1 MySQL的には寿司とビールは同じ扱い。— とみたまさひろ (@tmtms) December 22, 2014 MySQLで select

machupicchubeta 2015/03/23

リンク

MySQL :: MySQL 5.5 Reference Manual

This page has moved or been replaced. The new page is located here: http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-conversion.html Please update any bookmarks that point to the old page.

machupicchubeta 2014/10/06

"utf8mb4_bin"

リンク

はてなブックマーク

タグ

関連タグで絞り込む (14)

unicodeに関するmachupicchubetaのブックマーク (17)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス