文字コードの最新人気記事 124件 - はてなブックマーク

1 - 40 件 / 124件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

文字コードの検索結果1 - 40 件 / 124件

Windows上でユニコードを「見る」方法
- 143 users
- ascii.jp
- テクノロジー
- 2024/05/12
Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使うユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。
Googleが変体仮名フォント「Noto Hentaigana」をリリース～蕎麦屋の看板などを再現可能／Unicodeに登録されている変体仮名286文字をカバー
- 317 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/04/03
- font
- フォント
- google
- あとで読む
- 変体仮名
- 日本語
- Unicode
- 文字
- History
- ネタ
受検票（受験票）が文字化け、印刷できない神奈川出願
- 296 users
- kanagaku.com
- 世の中
- 2024/02/11
「出願システム」トラブルまとめ https://kanagaku.com/toraburu 広告 Twitter「受検票が印刷できない」文字化けの様子神奈川県の受験サイトでの受験票印刷、iPadとスマホから印刷しようとしたら文字化けしてしまった。 PCから無事印刷できたから良かったけど、ちょっと焦ったよね pic.twitter.com/LcDbrGdRYj — ころ (@koronosuke01) February 9, 2024 https://web.archive.org/web/20240209035717/https://pbs.twimg.com/media/GF2xYdBagAA0NOG?format=jpg https://megalodon.jp/2024-0209-1257-08/https://pbs.twimg.com:443/media/GF2xYdBagA
- PDF
- あとで読む
- 教育
- フォント
- トラブル
- 神奈川県
- education
- 神奈川
- font
- これはひどい
ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ
- 147 users
- nixeneko.hatenablog.com
- テクノロジー
- 2023/12/19
まえがきミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか？それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。なぜそのようなものが登場し、普及することとなったのか、この記事で解説する。目次まえがき目次凡例この記事で使う名称についてビルマ語表記コードポイントラテン文字表記について Zawgyiの概説と歴史 Zawgyiとは Zawgyiのダウンロード Zawgyi誕生・普及の経緯複雑なビルマ文字ビルマ文字とUnicode 回避策としてのビルマ文字フォントの登場 Zawgyiの普及 Zawgyiの実装実装の方針文字の並べ替えをせず、左から右に書く文字の形のバリエーション
- unicode
- 文字コード
- 文字
- あとで読む
- フォント
- ミャンマー
- font
- 言語
- 著作権
バックスラッシュと円記号の歴史と違い
- 600 users
- penpen-dev.com
- 学び
- 2023/12/09
最近知ったんですが、Windowsではキーボードから円記号（¥）の入力はできないらしい。というのもキーボード右上の¥キーキーボード右下の\キーのどちらかを押せば円記号（¥）を入力できますが、どちらを押しても入力されるのは円記号（¥）に偽装されたバックスラッシュ記号（\ ）らしい。皆さんこれ知ってました？いや正直、これを聞いても「何言ってんだコイツ」って思う人が大半だと思いますし、私も今でもそう思います。これは「バックスラッシュと円記号問題」などと言って、Windowsで昔から続く”呪い”のようなものらしいのですがこの”呪い”を理解するには文字コードの歴史を知る必要があります。文字コードとは？その前に、そもそも文字コードってなによ？という根本的な話からすると、文字コードは「パソコンに文字を覚えさせるための暗記表」みたいなものです。パソコンは2進数しか理解できないのであ
- 文字コード
- あとで読む
- PC
- 歴史
- 文字
- windows
- キーボード
- IT
- unicode
- フォント
「//このコメントを消したら動かない」は大体Shift_JISの2バイト目が原因で発生する - Qiita
- 497 users
- qiita.com/shirokuma89dev
- テクノロジー
- 2023/12/05
TL;DR Shift_JISにしただけでコンパイラが通らなくなる恐ろしい事件とその回避法について。 \ (¥)のASCIIコードは0x5c 表、能は良くない UTF-8は神 2023/12/06追記誤りがあったので訂正します。こんな読まれると思ってなかったので正直ちょっとびっくりしていますが、いろいろコメントありがとうございました。（ツイート等全て拝見しました。） Shift_JISが悪いわけではない（デフォルトのエンコーディング設定の問題）→追記しました UTF-8にはUTF-FSSという仕様でこの問題が回避されている→マジでタメになる知識ありがとうございます OSによってデフォルトのエンコーディング設定が異なるせいで、デフォルト環境での動作がOSにより異なる→なるほど？（調査中） CRLFとLF問題では→なるほど？（調査中）そんな問題何を今更→UTF-8が出てから生まれたからです
絵文字を支える技術について｜nona
- 583 users
- note.com/ttuusskk
- テクノロジー
- 2023/12/03
はじめにこちらはmhidakaが建立したAdvent Calendar Day.3となります。こんにちは、はじめまして、のなと申します。mhidakaさんのTweetを見つけて、初めてAdvent Calendarなるものを書いています。なにかお作法間違っていたら大目に見てください、よろしくお願いします。軽く自己紹介をさせていただくと、普段はGoogleでAndroidのTextまわりの開発を行っており、DroidKaigiやShibuya APKで発表させていただいたりしています。最近はほぼ絵文字の話しかしてないので、絵文字おじさんと思われてそうですが、普段の仕事は絵文字に限らず、Androidの文字表示の部分は大抵面倒をみています。今回この機会をいただいたので、どんな内容を書こうか迷ったのですが、やはり皆が読んで面白い内容というと、絵文字になるのかなぁ、ということで性懲りもなく絵
- unicode
- あとで読む
- 文字コード
- 絵文字
- emoji
- フォント
- android
- 技術
- 言語
- 開発
海外「日本には昔から存在するが…」日本人だけが理解できる謎の世界的マークが話題に
- 168 users
- pandora11.com
- アニメとゲーム
- 2023/11/22
日本で誕生し、現在では世界中の人たちが、文字通り日常的に活用している「絵文字」。海外でもそのまま「EMOJI」で通じる世界語となっており、日本独自の絵文字がそのまま海外でも使用されていますが、日本の文化に根差している絵文字は、外国人には通じないこともしばしばあるようです。今回ご紹介する写真は、日本人の方がドイツで撮影したもので、フランクフルト国際空港のロゴが写っています。そのロゴが漫画やアニメで多用される「怒りマーク💢」に見える事から、投稿者のTatsunoshin（@tatsunoshin_ofc）さんは、「フランクフルト空港常にキレてるんやけど何？💢」と、率直な疑問をぶつけておられます。海外の多くの人々にとって「💢」に「怒り」のイメージはなく、むしろ漠然と見ていた謎のマークである事から、この疑問が外国人には非常に面白く、興味深かったようで、多くのサイ
- emoji
- 文化
- 日本
- 海外
- 漫画
- マンガ
- あとで読む
- 飛行機
- アニメ
- culture
「ドコモの絵文字が見づらい問題」を考える　なぜ、今のスマホにそぐわないのか
- 347 users
- www.itmedia.co.jp
- テクノロジー
- 2023/10/29
携帯電話を用いたコミュニケーションの手法の1つに「絵文字」がある。日本で生まれたこの絵文字は、GoogleとAppleによって標準化され、今ではさまざまなスマートフォンやPCでもでも閲覧できる。その一方、ドコモで販売されるAndroidスマートフォンには、いまだフィーチャーフォン時代の絵文字が表示される。しかしこれが今のスマートフォンにそぐわない側面が出ている。この絵文字問題について考察したい。今の絵文字は日本のものをベースにGoogleとAppleが標準化を提案絵文字を携帯電話に採用したのは、NTTドコモが最初だ。この後にDDI（現au）、J-フォン（現ソフトバンク）が採用する形で続く。絵文字にはシフトJISというコードが用いられていたが、互換性維持の空き領域に絵文字を割り当てたことから、キャリア間で互換性がなく、文字化けの要因となっていた。後に自動変換サービスも展開されたが、使
- docomo
- 絵文字
- あとで読む
- android
- emoji
- mobile
- ケータイ
- 歴史
- スマホ
- Unicode
「Tera Term 5.0」がリリース～18年ぶりのメジャーバージョンでUnicodeに全面対応／来年で30周年を迎える老舗のリモートログオンクライアント
- 250 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/10/16
- software
- あとで読む
- network
- windows
- ssh
- PC
- ツール
- ソフトウェア
- ネット
- オンラインソフト
全ての開発者が知っておくべきUnicodeについての最低限の知識
- 573 users
- gigazine.net
- テクノロジー
- 2023/10/05
2003年には「プレーンテキストなんてものは全く存在しない」と言われ、テキストの解読には文字コードの情報が必須となっていました。しかし、2023年になるまでの20年の間に絵文字などのおかげでUnicodeの利用率は98％へと到達し、再び文字コードを気にせずにすむ時代がやってきています。そんな時代において、正しくUnicodeを使うために必要な知識をエンジニアのニキータ・プロコポフさんが解説しています。 The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 (Still No Excuses!) @ tonsky.me https://tonsky.me/blog/unicode/ Unicodeの歴史と利用率の推移をまとめたグラフは下図の通り。2000年代後半から急速に普及が進んでいったこ
ユニコード15.1に採用された漢字構成記述文字記号｜Qvarie
- 122 users
- note.com/qvarie
- 暮らし
- 2023/10/03
令和5年9/12にユニコード15.1が正式公開され、CJK漢字拡張-Iの他に“漢字構成記述文字”に指示記号4種、“CJK筆画”に拡張漢字構成記述文字の指示記号が1種類追加されました。ユニコードに採用されていない字の説明がしやすくなったのが重要です。𝚄+𝟹𝟷𝙴𝙵の一部除去指示記号は文字構成要素の一部が削除されていることを示す記号です。漢字構成記述文字記号をラテン・ギリシャ・キリル各文字体系に応用した例で、ユニコードに採用されていない左右逆になる字形と逆になる字形を説明しやすくなりそうです。画像はにしき的フォントに含まれるユニコード未登録のラテン・ギリシャ・キリル各種字母を漢字構成記述文字記号で説明した例です。
- unicode
- フォント
- 文字コード
- あとで読む
- 漢字
- 言語
- 文字
- font
- 技術
「どうして数字とファイル名の間にアンダーラインを入れるんですか。スペースでいいですよね」非ITの人から言われそうなネタにツッコミ殺到した話
- 346 users
- togetter.com
- テクノロジー
- 2023/09/20
ふも @fumokmm システム屋です。最近はアーキテクト的なことをやっています。ITで遊ぼう！興味:プログラミング/AI/読書/数学/哲学/心理学/物理学/宇宙/投資/ゲーム(レトロRPG) もし私をフォローしていただけますと、私のフォロワーが増えます。※ポスト内容は基本的には個人の意見です ※Amazonアソシエイトプログラム参加者です onl.tw/XNHeeKq
- IT
- あとで読む
- ネタ
- PC
- togetter
- twitter
- 技術
awkが新しくなる！？本家AwkがUnicode (UTF-8)とCSV対応に！ - Qiita
- 173 users
- qiita.com/ko1nksm
- テクノロジー
- 2023/09/16
はじめに 2023年、長い時を経て awk がとうとう Unicode (UTF-8) と CSV に対応しました 🎉🎉🎉 awk で日本語がうまく扱えない（場合がある）、Excel が出力する CSV ファイルが扱えない（場合がある）、といった問題が解決に向けて一歩に進みます。去年、本家 awk (One True Awk, nawk) に Unicode サポートが Brian Kernighan の手によって追加されたと話題になった（参照）ことを覚えているでしょうか？ Brian Kernighan が誰だか知らない方がいるかもしれないので説明すると、オリジナルの awk の開発者の一人で awk の頭文字、Alfred Aho、Peter Weinberger、Brian Kernighan の一人です。通称「K＆R」の「プログラミング言語C」や「プログラミング言語AWK」
- awk
- あとで読む
- linux
- unix
- Qiita
アイヌ語仮名「ㇷ゚」に対する正規表現の罠
- 263 users
- zenn.dev/mkpoli
- テクノロジー
- 2023/08/31
導入アイヌ語は日本語と異なり、閉音節（子音で終わる音節）も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる（実はそれでもまずい事になっているけどここでは割愛する）が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名（小書き仮名文字）を利用することになっている。具体的には以下のような特殊仮名文字（通称　アイヌ語仮名）である。ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題 r
- 文字コード
- 正規表現
- 文字
- あとで読む
- unicode
- 言語
- regex
- アイヌ
- 技術
- アイヌ語
誰でも簡単⁉️👀 絵文字ができるまで😃👍
- 176 users
- speakerdeck.com/oguemon
- テクノロジー
- 2023/07/31
現在の私たちが何気なく使っている絵文字たち（😀🥺💦💕🏠💻🌊😈🐱💢…）って、実は誰でも提案📝📮することができて、「この絵文字はワシが作った👴」と言えるチャンス💪があることをご存知ですか❓🤔 このスライド📄では、普段あまり知ることのないUnicode Emoji😀（絵文字の代表格）の仕様策定の流れ💨や、Emojiを提案する方法🙆‍♀️を簡単にご紹介👩‍🏫します！ ✅ Zennに本スライド以外の内容（📊通過率・🗑️Emoijのボツ案など）を含めて載せてます↓ https://zenn.dev/cybozu_frontend/articles/how_to_propose_a_new_emoji ※本資料は、2023年6月30日にサイボウズで開催された社内イベント「フロントエンドデー」における登壇資料に一部編集を加えたものです。 ※ここに掲載の内容は2
- emoji
- あとで読む
- デザイン
- Unicode
- 絵文字
- フォント
- 技術
プログラマーを苦しめてきた郵便番号データ「KEN_ALL.CSV」が改善！扱いやすい新形式／従来形式のデータも引き続き利用できるから安心してネ【やじうまの杜】
- 391 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/07/06
- CSV
- あとで読む
- データ
- 郵便番号
- KEN_ALL
- 行政
- 住所
- 郵便
- 地理
- プログラマ
基本4情報での名寄せは難しい｜MORIDaisuke
- 575 users
- note.com/moridaisukepub
- 暮らし
- 2023/06/19
先日は住所の件でお楽しみでしたね。私も楽しくなってしょうもないツイートをしたところ、@masanorkさんから有用な情報をいただいてしまいました。異体字に加えて外字も根深いですし、日付型に収まらない住基の生年月日とか、屋号を含んだ個人事業主の口座名義とか、外国人氏名における住民登録のアルファベットと口座名義のカタカナとの解離とか、旧姓併記の例外処理とか、文字列型に刻まれたバッドノウハウの塊ですね https://t.co/GOaytijfst — Masanori Kusunoki / 楠正憲 (@masanork) June 6, 2023 このとき、私はごく簡単な「名寄せの難しさ」の社内研修資料を作っている最中だったのですが、この情報が大変参考になりました。一方、私だけが得をしているのがなんとなくムズムズしてきたので、ここにアウトプットしてスッキリしようと思います。なお、住所
- システム
- あとで読む
- 行政
- 名寄せ
- データ
- マイナンバー
- IT
- 文字コード
- 文字
- 情報
「視覴」の謎
- 458 users
- okumuralab.org/~okumura
- テクノロジー
- 2023/06/11
ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート（2023-06-08 08:51:02 JST）で知る。すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである（1件だけ2020年のページがあるが、最近修正されたものかどうか不明）。映像・音声編集におけるノーマライズの重要性！（2023-05-11）「視覴的・聴覚的な一貫性」「視覴的な効果を最大化」「視覴的な混乱を避け」（2回）なお、このページは現在消えて視覴とは？AI（ChatGPT）が出力した新しい言葉なのか？（2023-06-08）にリダイレクトされ、「弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤
- AI
- ChatGPT
- あとで読む
- 日本語
- 文字コード
- 言語
- language
- GPT
- 言葉
- japanese
ChatGPTを使っていたら「視覴」という見慣れない言葉を吐き出したのだがAIが生み出した存在しない単語なのでは…？
- 107 users
- togetter.com
- 学び
- 2023/06/08
フガクラ @fugakura 怖ぇー、chat gpt使ってたら「視覴」という見慣れない言葉を吐き出したので検索したところ、ヒットするサイトがほとんど直近日付のAI出力された文章だったこれっていわばAIのハルシネーションが生み出した存在しない単語なのでは…？ pic.twitter.com/TVXWcNlVWh 2023-06-08 08:51:02
- AI
- ChatGPT
- あとで読む
- togetter
- 文章
- 言語
- Twitter
とにかく日本の住所のヤバさをもっと知るべきだと思います｜inuro
- 2608 users
- note.com/inuro
- 世の中
- 2023/06/07
「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃ですが（2023年6月6日）、この手の騒動は周期的に起こってる印象です。ということはつまりいつまで経っても解消されない、解決が困難な課題であるその困難さが界隈以外に共有されていないであるわけで、その都度Twitterにトリビアが投下されてはTLが賑わい華やかではありますが、そろそろ自分の整理としてもどれだけ日本の住所システムがカオスで、その計算機的な処理がいかに困難かをメモっておこうかと思いました。なおこの件については既にQiitaにGeoloniaの宮内さんが鼻血の出そうな良エン
- 地図
- あとで読む
- 地理
- 日本
- 行政
- 住所
- 社会
- IT
- プログラミング
- map
中国人を悩ませるレアな名字の文字コード問題
- 193 users
- japan.zdnet.com
- テクノロジー
- 2023/05/31
印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」（信息技術中文編碼字符集）が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される」と反射的に考えてしまうかもしれないが、これは文字コードの標準規格を新たに導入するという話だ。珍しい名字などに使われ、既存の文字コードに未登録の漢字に対応しようというものになる。中国の面積は日本の国土の約25倍で、約14億人の人口を擁している。一部の地域限定で使われている漢字や、少数民族の固有名詞でのみ用いられている漢字もある。文字コードに含まれない漢字を使っている人は約6000万人もいるそうだ。例えば、山東省青島市郊外にシュイユー村という地元ではまあまあ
- 中国
- unicode
- 文字コード
- 漢字
- 文字
- china
- あとで読む
- kanji
- font
- 言語
「Googleでもダメか」　チャットAI「Bard」日本語対応プレゼンに落胆の声　原因はフォント
- 326 users
- www.itmedia.co.jp
- テクノロジー
- 2023/05/11
米Googleが5月10日（現地時間）に日本語対応を発表したチャットAI「Bard」。ChatGPTなどの対抗馬とも目されるサービスで、SNSでも注目が集まっている。一方、発表時のプレゼンテーションに対して「Googleでもダメか」などと、落胆の声も出ている。原因はプレゼン資料で使っていたフォントだ。 GoogleはBardの日本語対応を発表する際、「Japanese」ではなく、大きく「日本語」と書いたスライドを使用。同時に対応を発表した韓国語と合わせ、各国の言語への理解をアピールしていた。ただし、使っていたフォントは中国語繁体字と思しきもの。「語」のごんべんの点がはねており、間違いではないものの、日本語ネイティブからすると少し違和感があるものだった。 Twitterでは「Googleに日本語フォントが理解されていない」「Googleの人、知らない言語のフォントとか興味ないんだね……」とい
- フォント
- google
- font
- あとで読む
- AI
- 人工知能
- Bard
- 日本語
- 文章生成AI
- デザイン
文字コード | 衆議院議員河野太郎公式サイト
- 1077 users
- www.taro.org
- 政治と経済
- 2023/05/10
2023.05.10 官報に使われる「官報文字」というものがあります。そこには渡辺さんの「辺」の異体字が１４０文字も登録されています。日本語の常用漢字には２１３６文字ありますが、そこには邉や邊などは入っていません。そこでＪＩＳの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも５５，２７０文字もあります。全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を２０１１年に策定し、それにあわせたフォントを作成し、無償で提供しています。この「文字情報基盤」（ＭＪ）には、５８，８６２文字が含まれています。しかし、このＭＪを全庁的に採用している自治体は、川口
- 文字コード
- フォント
- 行政
- あとで読む
- 文字
- システム
- IT
- font
- 日本語
- unicode
ChatGPTは文字コードをどのように解釈しているか　Unicodeの「日本語認識」「括弧の抽出」「旧字体と新字体の変換」を実験してみた
- 125 users
- logmi.jp
- テクノロジー
- 2023/05/09
「YAPC（Yet Another Perl Conference）」は、Perlを軸としたITに関わるすべての人のためのカンファレンスです。ライトニングトークにはPR TIMES インターンのShun氏が登壇。ChatGPTと文字コードについて話します。 ChatGPTは文字コードをどのように解釈しているか土屋俊介氏：こんにちは。先ほど、発表が4分だと知った土屋です。PR TIMESというところで、機械学習のインターンをしています。（スライドを示して）昨今、ChatGPTというものがメチャメチャはやっていますよね。私は使っていく中で、（ChatGPTが）文字コードをどのように解釈しているかが気になりました。なぜそんなニッチな話が気になるのかというと、自然言語処理とWebに関わっている以上、文字コードに関するプログラムをよく書くんです。その関係で気になったので調べてみました。（スライ
MySQLのutf8mb4と戦った話 - Uzabase for Engineers
- 178 users
- tech.uzabase.com
- テクノロジー
- 2023/04/28
皆様こんにちは、NewsPicksエンジニアの米澤です。先日 2023/03/30は、こちらでアナウンスしていた通り、サービスの停止を伴うシステムメンテナンスを実施させて頂きました。 NewsPicksをご利用頂いている皆様には、ご迷惑おかけいたしました。今回はこのメンテナンスの中で行われたDBテーブルのmigrationについてお話ししたいと思います。ことの始まりやったこと方針決め utf8mb4に対応していないテーブルを調べる migrationを作成する影響範囲を調べる開発環境でリハーサルを行うメンテナンスの日最後にことの始まり NewsPicksではバグの検知にBugSnagを利用しています。ある時、BugSnagにこんなエラーが通知されてきました。 org.springframework.orm.hibernate4.HibernateJdbcExcepti
- mysql
- あとで読む
- db
- 文字コード
- utf8mb4
- 環境
- unicode
- 開発
- システム
- development
欧文で「〜」は使いません。ハイフンとダーシの話｜しじみ｜デザインを語るひと
- 490 users
- note.com/shijimiota
- 学び
- 2023/04/28
欧文のルール日本人は知らない欧文（主に英語）のルールというものがあります。これは英語の授業でも教えてくれません。それゆえか翻訳者からの原稿にも、このルールに則っていないものがすごく多くあります。知っておくと何かとアドバンテージになるので少しずつご紹介していきます。ご紹介した欧文のルールはこちらのマガジンにストックしていきます。欧文で「〜」は使わない考えてみると「そりゃそうか」ってなるのがこの「〜」。日本だと午前10時〜午後7時というように使用します。便利でわかりやすい符号です。「〜」は波形という日本の約物これは「波形」というつなぎ符号です。約物（やくもの）という記号の一種。波形の意味は、「…まで」。だから東京〜大阪までという表記は間違いです。「東京〜大阪」で「東京から大阪まで」という意味になるからです。波形は、この他に語句の省略や長音を強調するために使う音引き「ー」の代わりに
- デザイン
- あとで読む
- 言語
- design
- 英語
- note
- 言葉
- DTP
- 表記
- 約物
「コカ・コーラ」ではなく「コカ･コーラ」？間違えやすい企業や商品の「正式名称」調べてみた | おたくま経済新聞
- 236 users
- otakei.otakuma.net
- アニメとゲーム
- 2023/04/27
企業や商品の名前は、広く認知してもらうためにも非常に重要なもの。しかしながら、その正式名称、意外と間違って覚えられているパターンが多いんです。そこで今回は、誤認されがちな企業・商品名をまとめてみました。思わず「え？そうだったの？」とびっくりすることもあるかもしれません。ちなみに弊媒体は「おくたま」ではなく「おたくま経済新聞」です！ ■　特に誤認されがち「大文字小文字」「清音濁音」系こうした話題の時に、まず真っ先に名前が上がる企業と言えば「キヤノン」「シヤチハタ」「キユーピー」といった、大文字小文字の誤認系。これは全体の文字バランスを考慮し、本来小文字である表記を大文字にしたという理由が主である模様。なお発音する際は、「キャノン」「キューピー」「シャチハタ」と小文字で読むのが正です。ちなみにタレントの「中川翔子」さんの本名は「しょうこ」ではなく「しようこ」が正しい表記となります。続け
- 名前
- ネタ
- 表記
- 言葉
- あとで読む
- 雑学
- ビジネス
- ことば
- 企業
- font
キャラ名に「ソ」があると画面がフリーズ　Switchの新作ゲームにバグ　制作会社が謝罪
- 400 users
- www.itmedia.co.jp
- テクノロジー
- 2023/04/14
関連記事 25人のAIが一緒に暮らしたら、自我は芽生えるか？　ゲームの中で検証　バレンタインなど勝手に企画米スタンフォード大学とGoogle Researchに所属する研究者らは、ChatGPTなどで制御したキャラクター25人が1つの町で一緒に生活したらどうなるかを検証した研究報告を発表した。「サーバに致命的な不具合」のスマホゲー、「修正不可能と判断」でそのままサービス終了　問題発生から2日でゲームの開発・運営を手掛けるインゲームは、スマートフォンゲーム「戦策三国志」（iOS／Android）の不具合を修正できず、サービスの提供を終了したと発表した。任天堂「ご迷惑をおかけし申し訳ございません」　「ポケモンSV」アップデート配信　SNSではバグ報告の声多数任天堂とポケモン社が、「ポケットモンスタースカーレット・バイオレット」の更新データを配信する。新機能を追加した他、いくつかのバ
macOS 13.3 VenturaではNFC/NFD問題が再発し、濁音やアクセント記号が付いたファイルをダブルクリックしてもアプリで開けない不具合があるので注意を。
- 135 users
- applech2.com
- テクノロジー
- 2023/04/02
macOS 13.3 VenturaではNFD/NFC問題が復活し、濁音やアクセント記号が付いたファイルをダブルクリックしてもアプリで開けない不具合があるので注意してください。詳細は以下から。 Appleは2017年に開催したWWDC17において、同年末にリリースされるmacOS 10.13 High Sierraでは同社が開発する新しいファイルフォーマット「APFS」を正式導入すると発表しましたが、Macよりも先行してAPFSが採用されたiPhone (iOS 13.3から)では初期段階でUnicodeの正規化形式(NFD/NFC)問題により、アプリがファイルにアクセスできない不具合が確認されていました。表題の件、Acrobat Reader for mobileをiOS 10.3でご利用のお客様において、以下の現象が発生しております。既知の問題：ファイル名に下記の文字を使用した場
- Mac
- apple
- Unicode
- あとで読む
- 不具合
- macOS
- IoT
- 未分類
Webアプリケーション設計の第一歩は ディレクトリの整理から / Encraft 1
- 198 users
- speakerdeck.com/okunokentaro
- テクノロジー
- 2023/03/24
2023/3/24、Encraft #1 フロントエンド×設計にて発表した資料です。
- 設計
- あとで読む
- web
- Web開発
- Next.js
- design
- frontend
- アプリケーション
- slide
- architecture
マルチバイト文字とURL | 技術者ブログ | 三井物産セキュアディレクション株式会社
- 155 users
- www.mbsd.jp
- テクノロジー
- 2023/02/16
MBSDでWebアプリケーションスキャナの開発をしている寺田です。前記事では正規表現でのURLのチェックについて書きました。今回はその続きでマルチバイト文字を使った攻撃について書きたいと思います。前提条件本記事で想定するのは、ブラウザからパラメータとして渡されて来るURLを、リダイレクトやリンク等のURLとして使うケースです。その中でも、以下のようにサブドメイン部分（★の部分）を可変にする状況を主に想定します。 https://★.example.jp/… 攻撃の目標は、異なるドメイン（evil）のURLを与えてチェックをすり抜けることです。前回の記事にも書きましたが、この状況は（半角英数等のサブドメインしか受け入れないような場合を除き）「/」「?」「#」「\」のいずれかをサブドメインに入れることで攻略できることが大半です。今回はこれらの記号が全て使用できないように対策されているこ
最も「ありそうで存在しない漢字」は何か？ - Qiita
- 371 users
- qiita.com/hakatashi
- テクノロジー
- 2023/01/02
タイトルが全てです。個々のパーツとしてはありふれた部品なのに、合体させると「存在しない漢字」になる組み合わせは一体何なのか調べてみました。 ※この記事は TSG Advent Calendar 2022 の14日目の記事です。手法以下の手順で「ありそうで存在しない漢字」を調べることにしました。すでに存在する漢字を構成する部品を調査する出現回数が多い部品どうしを組み合わせ新たな漢字を作る構成する部品の出現頻度から、それぞれの組み合わせの「ありそう度」をスコア付けするスコアが最も高いものを「最もありそうで存在しない漢字」とする CHISE 漢字構造情報データベースは、Unicodeに収録されている全漢字を含むさまざまな漢字の部品構造をデータベース化したオープンデータです。今回はこちらのデータを利用して調査を行うことにしました。頻出部品を調査する UnicodeのCJK統合漢字か
- 言語
- ネタ
- 漢字
- 文字
- あとで読む
- 言葉
- 統計
- Qiita
- kanji
- Japanese
奇妙な「ツ」と「ノ」と右括弧　Discordの新フォント"gg sans"が抱える問題とその背景
- 473 users
- zenn.dev/ryo_a
- テクノロジー
- 2022/12/03
2022年12月1日、Discordはカスタマイズされたオリジナルのフォント「gg sans」を導入しました。ggは"Good Game"に由来するようです。Web フォントなどを利用して Discord 上の表示がこのフォントに順次切り替わる予定です。補足 / UPDATE 2022/12/03 14:37 JST DiscordのCEO（Jason氏）より返事があり、ツとノの字形がgg sansから削除されたとのことです。右括弧は現時点で残っているようです（これは当初のわたしの指摘がツとノのみに限られていたせいです）。 2022/12/04 14:55 JST 12/3時点でJason氏からの返信に右括弧が残っているという旨を補足しました。 12/4 午前にDiscordのエンジニア Brandon氏より連絡があり、括弧等の修正が完了したとのことです。こちらで確認する限り、CJK関
- font
- フォント
- discord
- あとで読む
- 言語
- 日本語
- 文化
- 文字
- trouble
- 国際
非公式 PHP 8.1のmbstringアップグレードガイド - てきとうなさいと。べぇたばん
- 113 users
- tekitoh-memdhoi.info
- テクノロジー
- 2022/11/27
PHP 8.1へのアップグレードにまつわるまとめ PHP 8.1へのアップグレードには、mbstringにまつわるマニュアルに記述されない後方互換性のない変更が含まれることがあります。そのことを周知するべく、この記事を書くことにしました。私てきめんは、PHPカンファレンス 2022にて、「治っていくmbstring 令和時代の文字化け」というタイトルでトークしています。以下スライドも参考にしてください。 Major overhaul of mbstringについて PHP 8.1から、Major overhaul of mbstringと呼ばれる、mbstringの大規模改修の内容が反映されるようになりました。困ったことに、RFC(Request For Comments)やChangelog、マニュアルにない内容で、mbstringを多用するPHPユーザーにとてつもない困惑をもたらすこ
- php
- あとで読む
- PHP 8.1
- mbstring
- 正規表現
- 開発
- Tips
見分けが不可能な偽サイトがGoogle検索最上位に堂々と表示されてしまう、「i」をURLに含む全てのサイトが信用できなくなる極悪手法
- 770 users
- gigazine.net
- テクノロジー
- 2022/11/01
Googleは独自のルールに従って検索結果の表示順位を決めていますが、Googleの広告枠を購入すれば任意のウェブサイトを検索結果の最上部に表示することができます。この広告枠を悪用して人気画像処理ソフト「GIMP」の公式サイトになりすました偽サイトが検索結果の最上部に表示されてしまう事態が発生しました。偽サイトはドメインの見た目までソックリで、インターネットに慣れている人でも見分けることは困難となっています。 Dangerous Google Ad Disguising Itself as www.gimp.org : GIMP https://www.reddit.com/r/GIMP/comments/ygbr4o/dangerous_google_ad_disguising_itself_as/ Dangerous Google Ad Disguising Itself as www
- セキュリティ
- google
- security
- 広告
- あとで読む
- 詐欺
- 検索
- web
- search
- インターネット
JavaScript における文字コードの初歩 - 30歳からのプログラミング
- 181 users
- numb86-tech.hatenablog.com
- テクノロジー
- 2022/10/23
この記事では、 JavaScript で文字コードを扱う際に知っておくべき概念である Code Point や Code Unit、サロゲートペア、といったものについて説明していく。また、具体的にそれらの概念を使ってどのようにコードを書いていくのかについても扱う。この記事に出てくるコードの動作確認は以下の環境で行った。 Deno 1.26.0 TypeScript 4.8.3 Code Point （符号位置）プログラムで文字を表現する方法は複数あるが、 JavaScript では Unicode という方法を採用している。 Unicode ではあらゆる文字に対して一意の値を割り振ることを目的としており、この値のことを Code Point （符号位置）という。 Code Point は 16 進数の非負整数で、文章中で表記するときは接頭辞としてU+をつける。例えばAという文字の
「HTMLでは環境依存文字（①や©など）を文字参照にしなければいけない」という誤解と、本当に置換すべき文字
- 205 users
- zenn.dev/kagan
- テクノロジー
- 2022/10/21
HTMLファイルで特殊記号を使う際、① は ①、© は © のように置き換えて書かないといけないものだと思いこんでいないでしょうか。現代ではそれは誤解です。 UTF-8では特殊記号の文字参照は不要そもそも環境依存文字とは、データを扱う機種・ソフトウェアなどの違い（文字コードの割り当ての違い）により表示に違いが出てしまう文字のことでした。例えばShift_JISには © が含まれておらずそもそも保存できなかったり、 ① などの丸数字は含まれているものの、WindowsとMac OS（当時）の割り当ての違いにより正しく表示できなかったりしました。[1] しかし現在ではUnicodeによって文字コードは統一化されており、その問題はほとんど起きなくなっています。近年では多くの場合 UTF-8 でファイルを記述すると思います。 HTMLファイルの文字エンコーディングが
Slackはハイライト部分をU+E000とU+E001で囲って表していそう - hogashi.*
- 189 users
- blog.hog.as
- テクノロジー
- 2022/10/06
Slack は、メッセージのどこからどこまでハイライトするかを、 Unicode の私用領域 *1の U+E000 と U+E001 を使って表しているらしく、こういう HTML を glitch とかで書いて、 <html> <head> <meta property="og:title" content="Slackでタイトルをハイライトする" /> <meta property="og:description" content="Slackで説明も好きな部分をハイライトする" /> </head> </html> そのページを Slack で展開させたりすることで、好きな部分を勝手にハイライトできて面白い *2 *3。ちなみに printf "\ue000寿司\ue001が光ったら成功"
- slack
- unicode
- 文字コード
- あとで読む
- API
- html
- programming
ソフトウェアの日本語文字が中華フォントに侵食されていて想像以上の危機らしい「違和感すごい」
- 755 users
- togetter.com
- 学び
- 2022/09/29
usagimaru ⌘ @usagimaruma 日本人が想像するよりかなり広い範囲で日本語文字が中華フォント化している現象。CJK処理系における日本語の扱いに対する問題としてそろそろ何とかしていかないと、ソフトウェアの中の日本語が死んでいく危機感がある。そもそもなんでChineseに分類されるフォントにフォールバックされるのかって。 2022-09-28 16:03:32 usagimaru ⌘ @usagimaruma 前も調べたけど、言語環境の言語優先度設定で“わざわざ”日本語を優先言語にしておかないと、日本語の文字の多くは簡体中国語の奇妙なフォントで描画される。バグではなく仕様。わざわざ日本語を優先している民族なんて日本人しかいないから、世界のほとんどはきっと中華フォントで日本語を眺めている。 2022-09-28 16:07:52
- 日本語
- フォント
- font
- 言語
- あとで読む
- togetter
- ソフトウェア
- 文化
- 中国
- 文字