[2ページ] utf8の人気記事 308件 - はてなブックマーク

41 - 80 件 / 308件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

utf8の検索結果41 - 80 件 / 308件

【2019年】CTF Web問題の攻撃手法まとめ (Web問題のwriteupぜんぶ読む) - こんとろーるしーこんとろーるぶい
- 306 users
- graneed.hatenablog.com
- テクノロジー
- 2019/12/29
CTF Advent Calendar 2019 - Adventarの25日目の記事です。 1つ前は@ptr-yudai氏の2019年のpwn問を全部解くチャレンジ【後半戦】 - CTFするぞでした。はじめに対象イベント問題数読み方、使い方 Cross-Site Scripting(XSS) SVGファイルを利用したCSPバイパス GoogleドメインのJSONPを利用したCSPバイパスサブリソース完全性(SRI)機能を利用した入力チェックバイパス Chrome拡張機能のパスワードマネージャーKeePassの悪用 HTML likeコメントを使用したコメントアウト jQuery.getJSONのJSONP機能を使用したスクリプト実行 DOM Clobberingによるコードハイジャック Service Workerを利用したスクリプト実行 XSS Auditor機能のバイパス
- CTF
- security
- あとで読む
- セキュリティ
- web
- html
- SQL
- browser
- github
端末の文字幅問題の傾向と対策 | IIJ Engineers Blog
- 304 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2022/02/15
電子メール、ネットワーク機器集中管理、異常検知、分散処理、クラウド基盤などのシステム開発に従事。古代Rubyist。 CLI や TUI なアプリケーションを使っていると、端末の画面が崩れてしまうことがよくあります。たとえば、こんな TUI が、環境によってはこんな感じで崩れます。スクロールなどをしながらしばらく使っているとさらにどんどん崩れていきます。こうなってしまった場合、とりあえず Ctrl-l で画面を再描画することで、大抵はなんとか読める程度にリセットできますので、ことあるごとに Ctrl-l を連打することになります。ですが、どうしようもないケースもままあります。例えば、私の場合は以下のようなシチュエーションで困ります。 w3m でテーブルなどを表示するとレンダリングが崩れる less でログの閲覧の際に表示されるべき文字が表示されず見落としが発生する Wander
- 文字コード
- unicode
- terminal
- あとで読む
- font
- linux
- TUI
- フォント
- shell
- UNIX
PDFのコピペが文字化けするのはなぜか？～CID/GIDと原ノ味フォント～
- 302 users
- www.slideshare.net/trueroad_jp
- テクノロジー
- 2021/02/27
PGOを用いたPostgreSQL on Kubernetes入門（Open Source Conference 2023 Online/Hokkaido...NTT DATA Technology & Innovation
- pdf
- フォント
- 文字コード
- font
- あとで読む
- adobe
- unicode
- slide
- oss
- 資料
pLaTeX が本格的にやばいかもという話 - Acetaminophen’s diary
- 301 users
- acetaminophen.hatenablog.com
- 政治と経済
- 2021/06/18
最近（この1週間ほど）で LaTeX 周りで起きていることについて，声明を出しておきます。端的に言うと「pLaTeX，本格的にやばい」。 pLaTeX hyperref error with pdfmanagement-testphase 今 LaTeX の世界で何が起きているのか，ざっと説明します。ここ1年ほどの LaTeX は大きく変わっている 2020-02-02 以降，本家の LaTeX2e に多くの変更が入っています。2020 年の2回のリリースについては，Online.tex 2020 での私の講演資料「最近の LaTeX は〇〇」【PDF 直リンク】も参考になるでしょう。 LaTeX2e 2020-02-02: 新 NFSS 導入（シリーズとシェープの多軸化，ファミリ毎の実際のシリーズ値の設定，…），カーネルへの expl3 読込 LaTeX2e 2020-10-01: フ
- tex
- latex
- 日本語
- pLaTeX
- あとで読む
- 言語
- 開発
- 文字コード
- プログラミング
- 国際
「H.265/HEVC」と同じ画質でファイルサイズを50％削減できる次世代動画圧縮規格「H.266/VVC」が登場
- 286 users
- gigazine.net
- テクノロジー
- 2020/07/07
Fraunhofer Heinrich Hertz Instituteが、Windows/macOS/Android/iOSといった各種OSでデフォルトでサポートされている動画圧縮規格「H.265/HEVC」の次世代規格となる「H.266/VVC」を発表しました。「H.266/VVC」はデータの圧縮効率を改善し、約50％ビットレートを削減することが可能となります。 Fraunhofer Heinrich Hertz Institute HHI https://newsletter.fraunhofer.de/-viewonline2/17386/465/11/14SHcBTt/V44RELLZBp/1 記事作成時点で、インターネットトラフィックの80％を占めているのが圧縮されたムービーデータです。Fraunhofer Heinrich Hertz Instituteが発表した新しい動画圧縮
- コーデック
- あとで読む
- 動画
- アルゴリズム
- codec
- 圧縮
- WebRTC
- データ
- 情報通信
- 技術
🀈🀉🀊🀈🀉🀊🀈🀉🀊🀚🀚🀚🀋 🀋
- 268 users
- anond.hatelabo.jp
- おもしろ
- 2020/06/19
タ　ン　ヤ　オ
- 麻雀
- 増田
- 絵文字
- ネタ
- mahjong
- あとで読む
- anond
- joke
- フォント
- ネット
アイヌ語仮名「ㇷ゚」に対する正規表現の罠
- 263 users
- zenn.dev/mkpoli
- テクノロジー
- 2023/08/31
導入アイヌ語は日本語と異なり、閉音節（子音で終わる音節）も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる（実はそれでもまずい事になっているけどここでは割愛する）が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名（小書き仮名文字）を利用することになっている。具体的には以下のような特殊仮名文字（通称　アイヌ語仮名）である。ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題 r
- 文字コード
- 正規表現
- 文字
- あとで読む
- unicode
- 言語
- regex
- アイヌ
- 技術
- アイヌ語
Python 3.15からデフォルトのエンコーディングがUTF-8になります - methaneのブログ
- 263 users
- methane.hatenablog.jp
- テクノロジー
- 2022/04/26
Pythonがファイルを開くときなどに使われるエンコーディングはロケール（WindowsではANSIコードページ）依存でした。 Unixの世界ではどんどんUTF-8ロケールが一般的になっている一方、WindowsのANSIコードページはなかなかUTF-8になりません。そのために、Unixユーザーが open(filepath) のようにエンコーディングを指定しないままUTF-8を仮定するコードを気軽に書いてしまって、Windowsユーザーがエラーで困るといった問題が発生します。また、Windowsでもメモ帳（Notepad.exe）やVSCodeはすでにUTF-8をデフォルトのエンコーディングで使用しています。ANSIコードページがUTF-8になるのを待っていたらどんどん周りの環境から置いていかれ、レガシー化してしまいます。 Pythonがデフォルトで利用するエンコーディングをWind
𓁲私ははてなの神。願いを言いなさい。何でも叶えてあげよう。
- 257 users
- anond.hatelabo.jp
- おもしろ
- 2022/08/03
𓁲 私ははてなの神。願いを言いなさい。何でも叶えてあげよう。
［速報］Windows Terminal 1.0正式リリース。7月からは毎月アップデートへ。Microsoft Build 2020
- 253 users
- www.publickey1.jp
- テクノロジー
- 2020/05/20
［速報］Windows Terminal 1.0正式リリース。7月からは毎月アップデートへ。Microsoft Build 2020 オンラインイベント「Microsoft Build 2020」を開催中のマイクロソフトは、Windows Terminal 1.0正式リリースを発表しました。下記はWindows Terminalのプログラムマネージャ Kayla Cinnamon氏のツイートです。 Windows Terminal 1.0 has been released!! A huge thank you to everyone who has helped contribute! https://t.co/VpnwIDHCxM — Kayla Cinnamon ☕ @ #MSBuild (@cinnamon_msft) May 19, 2020 Windows Terminalは
「Tera Term 5.0」がリリース～18年ぶりのメジャーバージョンでUnicodeに全面対応／来年で30周年を迎える老舗のリモートログオンクライアント
- 250 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/10/16
- software
- あとで読む
- network
- windows
- ssh
- PC
- ツール
- ソフトウェア
- ネット
- オンラインソフト
ロシアの一修道院に保管されている教会スラヴ語訳聖書に一回だけ登場する文字「ꙮ」
- 239 users
- togetter.com
- 学び
- 2022/05/12
ティラノサウルス @7XL03 多眼O、ロシアの一修道院に保管されている教会スラヴ語訳聖書に一回だけ登場する「мн҄оꙮ҄читїи҄(たくさんの眼がある)」という語彙を表すためだけにあるらしくて熱すぎる pic.twitter.com/N5Th6O5B2H 2022-05-06 19:11:34
- 宗教
- 文字
- 言語
- ロシア
- 文字コード
- togetter
- あとで読む
- キリスト教
- Unicode
- 歴史
「慶応」も「コンクリート」も漢字1文字で～Unicode標準に新しいブロックが提案中／手書きでしばしば用いられる「部首＋カナ」スタイルの略式漢字【やじうまの杜】
- 235 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/06/04
- Unicode
- 文字コード
- 文字
- 言語
- あとで読む
- ネタ
- 漢字
- フォント
- IT
- ブコメしたいだけ
grep の「バイナリファイル (標準入力) に一致しました」が出る条件を調べていたらそれは長い旅路の始まりだった。
- 234 users
- zenn.dev/mattn
- テクノロジー
- 2020/10/06
はじめに昨今では1行につき、1つの JSON を出力する様なログファイル形式も珍しくはありません。 grep しやすいデータベース化しやすいこれらの理由で各所で多く使われています。僕も仕事で普通に使っているのですが、ある日突然そのログファイルを集計するスクリプトで以下の様なエラーが出始めました。
- linux
- grep
- あとで読む
- systemd
- ログ
- binary
- logrotate
- logging
- 開発
- log
GitHub - trueroad/tr-NTTtech05: NTT Tech Conference #5 Presentation 「PDFのコピペが文字化けするのはなぜか？～CID/GIDと原ノ味フォント～」関連資料
- 230 users
- github.com/trueroad
- テクノロジー
- 2021/02/27
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- pdf
- font
- フォント
- あとで読む
- 文字コード
- 文字
- NTT
- GitHub
君たちは正規表現におけるインド数字の罠にハマったことはあるかい？(١٢٣٤٥٦٧٨٩) - Qiita
- 229 users
- qiita.com/papi_tokei
- テクノロジー
- 2022/06/22
import re re.match(r'\d{4}-\d{2}', '٢٠٢٢-٠٦') Pythonで書いてはいますが、内容を補足します。「'٢٠٢٢-٠٦'」という文字列が、数字4文字+ハイフン+数字2文字にマッチするかどうか、という正規表現を書いています。一見するとどう見ても数字4桁ではないので、正規表現にマッチしないように見えますよね？？？？実は正規表現にマッチします！！！というのが今回の記事の内容になります。そもそも正規表現における数字の扱いとは今回はPythonの正規表現のライブラリを利用しているので、公式のリファレンスを見てみましょう。該当の部分には以下のような記述があります。 \d Unicode (str) パターンでは: 任意の Unicode 10 進数字 (Unicode 文字カテゴリ [Nd]) にマッチします。これは [0-9] とその他多数の数字を
- 正規表現
- あとで読む
- python
- Unicode
- regex
- 数字
- プログラミング
- qiita
- programming
「絶対アップデートしたくない」…iOS 14.2の「とある仕様」にユーザーが強烈な拒否反応【やじうまWatch】
- 228 users
- internet.watch.impress.co.jp
- テクノロジー
- 2020/11/09
- iOS
- ネタ
- 絵文字
- iPhone
- スマホ
- Apple
- Unicode
- 画像
- emoji
- 生物
「HTMLでは環境依存文字（①や©など）を文字参照にしなければいけない」という誤解と、本当に置換すべき文字
- 206 users
- zenn.dev/kagan
- テクノロジー
- 2022/10/21
HTMLファイルで特殊記号を使う際、① は ①、© は © のように置き換えて書かないといけないものだと思いこんでいないでしょうか。現代ではそれは誤解です。 UTF-8では特殊記号の文字参照は不要そもそも環境依存文字とは、データを扱う機種・ソフトウェアなどの違い（文字コードの割り当ての違い）により表示に違いが出てしまう文字のことでした。例えばShift_JISには © が含まれておらずそもそも保存できなかったり、 ① などの丸数字は含まれているものの、WindowsとMac OS（当時）の割り当ての違いにより正しく表示できなかったりしました。[1] しかし現在ではUnicodeによって文字コードは統一化されており、その問題はほとんど起きなくなっています。近年では多くの場合 UTF-8 でファイルを記述すると思います。 HTMLファイルの文字エンコーディングが
JavaScript: 文字数を正確にカウントするには？ - Qiita
- 195 users
- qiita.com/suin
- テクノロジー
- 2022/04/11
この投稿ではJavaScriptで文字数をできるだけ正確にカウントする方法について取り上げます。文字数とは？要件で「文字数を表示してほしい」「○文字以上はバリデーションエラーにしたい」と文字数を考慮しないとならないことがあります。そもそも文字数とは何でしょうか。たとえば、アルファベットの「A」は1文字と数えられそうです。次の絵文字は、何文字になるでしょうか？この絵文字はiOSであれば14.5の環境では、UI上では上のように1文字のように表示されます。しかし、それ以前のバージョンでは、同じ文字列データでも😵💫のように2文字で表示されます。なお、この絵文字は3つのコードポイントU+1F635 U+200D U+1F4ABからなります。この絵文字の「文字数」はいったい何文字として扱ったらよいのでしょうか。以上のように、ひとことで文字数と言ってもデータと見た目と環境の3つのややこ
中国人を悩ませるレアな名字の文字コード問題
- 193 users
- japan.zdnet.com
- テクノロジー
- 2023/05/31
印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」（信息技術中文編碼字符集）が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される」と反射的に考えてしまうかもしれないが、これは文字コードの標準規格を新たに導入するという話だ。珍しい名字などに使われ、既存の文字コードに未登録の漢字に対応しようというものになる。中国の面積は日本の国土の約25倍で、約14億人の人口を擁している。一部の地域限定で使われている漢字や、少数民族の固有名詞でのみ用いられている漢字もある。文字コードに含まれない漢字を使っている人は約6000万人もいるそうだ。例えば、山東省青島市郊外にシュイユー村という地元ではまあまあ
- 中国
- unicode
- 文字コード
- 漢字
- 文字
- china
- あとで読む
- kanji
- font
- 言語
おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diary
- 193 users
- ill-identified.hatenablog.com
- テクノロジー
- 2020/10/03
2021/9/10 追記: 改めて更新された話を統合して整理して書き直しました. 以降はこちらを参考にしてください: ill-identified.hatenablog.com 2021/1/15 追記: RStudio 1.4 がリリースされたのでなるべくアップデートしましょう 2020/12/06 追記: Japan.R で今回の話の要約+新情報を『Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck』として発表した. ハイライトは「近々出るRStudio 1.4 があれば fontregisterer はほぼいらなくなる」 2020/10/31 追記: geom
- R
- あとで読む
- ggplot2
- グラフ
- ggplot
- 統計
- フォント
- 文字コード
- 日本語
- 統計学
Slackはハイライト部分をU+E000とU+E001で囲って表していそう - hogashi.*
- 190 users
- blog.hog.as
- テクノロジー
- 2022/10/06
Slack は、メッセージのどこからどこまでハイライトするかを、 Unicode の私用領域 *1の U+E000 と U+E001 を使って表しているらしく、こういう HTML を glitch とかで書いて、 <html> <head> <meta property="og:title" content="Slackでタイトルをハイライトする" /> <meta property="og:description" content="Slackで説明も好きな部分をハイライトする" /> </head> </html> そのページを Slack で展開させたりすることで、好きな部分を勝手にハイライトできて面白い *2 *3。ちなみに printf "\ue000寿司\ue001が光ったら成功"
- slack
- unicode
- 文字コード
- あとで読む
- API
- html
- programming
JavaScript における文字コードの初歩 - 30歳からのプログラミング
- 181 users
- numb86-tech.hatenablog.com
- テクノロジー
- 2022/10/23
この記事では、 JavaScript で文字コードを扱う際に知っておくべき概念である Code Point や Code Unit、サロゲートペア、といったものについて説明していく。また、具体的にそれらの概念を使ってどのようにコードを書いていくのかについても扱う。この記事に出てくるコードの動作確認は以下の環境で行った。 Deno 1.26.0 TypeScript 4.8.3 Code Point （符号位置）プログラムで文字を表現する方法は複数あるが、 JavaScript では Unicode という方法を採用している。 Unicode ではあらゆる文字に対して一意の値を割り振ることを目的としており、この値のことを Code Point （符号位置）という。 Code Point は 16 進数の非負整数で、文章中で表記するときは接頭辞としてU+をつける。例えばAという文字の
MySQLのutf8mb4と戦った話 - Uzabase for Engineers
- 178 users
- tech.uzabase.com
- テクノロジー
- 2023/04/28
皆様こんにちは、NewsPicksエンジニアの米澤です。先日 2023/03/30は、こちらでアナウンスしていた通り、サービスの停止を伴うシステムメンテナンスを実施させて頂きました。 NewsPicksをご利用頂いている皆様には、ご迷惑おかけいたしました。今回はこのメンテナンスの中で行われたDBテーブルのmigrationについてお話ししたいと思います。ことの始まりやったこと方針決め utf8mb4に対応していないテーブルを調べる migrationを作成する影響範囲を調べる開発環境でリハーサルを行うメンテナンスの日最後にことの始まり NewsPicksではバグの検知にBugSnagを利用しています。ある時、BugSnagにこんなエラーが通知されてきました。 org.springframework.orm.hibernate4.HibernateJdbcExcepti
- mysql
- あとで読む
- db
- 文字コード
- utf8mb4
- 環境
- unicode
- 開発
- システム
- development
誰でも簡単⁉️👀 絵文字ができるまで😃👍
- 176 users
- speakerdeck.com/oguemon
- テクノロジー
- 2023/07/31
現在の私たちが何気なく使っている絵文字たち（😀🥺💦💕🏠💻🌊😈🐱💢…）って、実は誰でも提案📝📮することができて、「この絵文字はワシが作った👴」と言えるチャンス💪があることをご存知ですか❓🤔 このスライド📄では、普段あまり知ることのないUnicode Emoji😀（絵文字の代表格）の仕様策定の流れ💨や、Emojiを提案する方法🙆‍♀️を簡単にご紹介👩‍🏫します！ ✅ Zennに本スライド以外の内容（📊通過率・🗑️Emoijのボツ案など）を含めて載せてます↓ https://zenn.dev/cybozu_frontend/articles/how_to_propose_a_new_emoji ※本資料は、2023年6月30日にサイボウズで開催された社内イベント「フロントエンドデー」における登壇資料に一部編集を加えたものです。 ※ここに掲載の内容は2
- emoji
- あとで読む
- デザイン
- Unicode
- 絵文字
- フォント
- 技術
Google、絵文字を組み合わせた「ハート付きうんち」などを使える「Emoji Kitchen」開始
- 175 users
- www.itmedia.co.jp
- テクノロジー
- 2020/02/13
米Googleは2月12日（現地時間）、Android向けキーボードアプリ「Gboard」の新機能「Emoji Kitchen」を発表した。2つの絵文字をミックスしてカスタマイズした絵文字を使える。同日からすべてのGboardユーザー向けにロールアウトしていく。 Gboardをメインのキーボードに設定し、Gmail、Googleのメッセージ、メッセンジャー、Snapchat、Telegram、WhatsAppなどのアプリでの入力で絵文字を選ぶと使える（本稿執筆現在、筆者のGboardではまだできない）。自分で新しい絵文字を作れるわけではないようだ。公式ブログには、「絵文字をタップすると、Googleのデザイナーが特別に手作りしたステッカーが（候補として）多数表示される」とある。関連記事「Unicode Emoji 13.0」決定──タピオカドリンクも遅まきながら登場 Unicode
- emoji
- google
- 絵文字
- あとで読む
- unicode
- news
- ITmedia
awkが新しくなる！？本家AwkがUnicode (UTF-8)とCSV対応に！ - Qiita
- 173 users
- qiita.com/ko1nksm
- テクノロジー
- 2023/09/16
はじめに 2023年、長い時を経て awk がとうとう Unicode (UTF-8) と CSV に対応しました 🎉🎉🎉 awk で日本語がうまく扱えない（場合がある）、Excel が出力する CSV ファイルが扱えない（場合がある）、といった問題が解決に向けて一歩に進みます。去年、本家 awk (One True Awk, nawk) に Unicode サポートが Brian Kernighan の手によって追加されたと話題になった（参照）ことを覚えているでしょうか？ Brian Kernighan が誰だか知らない方がいるかもしれないので説明すると、オリジナルの awk の開発者の一人で awk の頭文字、Alfred Aho、Peter Weinberger、Brian Kernighan の一人です。通称「K＆R」の「プログラミング言語C」や「プログラミング言語AWK」
- awk
- あとで読む
- linux
- unix
- Qiita
海外「日本には昔から存在するが…」日本人だけが理解できる謎の世界的マークが話題に
- 168 users
- pandora11.com
- アニメとゲーム
- 2023/11/22
日本で誕生し、現在では世界中の人たちが、文字通り日常的に活用している「絵文字」。海外でもそのまま「EMOJI」で通じる世界語となっており、日本独自の絵文字がそのまま海外でも使用されていますが、日本の文化に根差している絵文字は、外国人には通じないこともしばしばあるようです。今回ご紹介する写真は、日本人の方がドイツで撮影したもので、フランクフルト国際空港のロゴが写っています。そのロゴが漫画やアニメで多用される「怒りマーク💢」に見える事から、投稿者のTatsunoshin（@tatsunoshin_ofc）さんは、「フランクフルト空港常にキレてるんやけど何？💢」と、率直な疑問をぶつけておられます。海外の多くの人々にとって「💢」に「怒り」のイメージはなく、むしろ漠然と見ていた謎のマークである事から、この疑問が外国人には非常に面白く、興味深かったようで、多くのサイ
- emoji
- 文化
- 日本
- 海外
- 漫画
- マンガ
- あとで読む
- 飛行機
- アニメ
- culture
UTF-8で動くRailsがShift_JISな外部システムと通信する方法 - BOOK☆WALKER inside
- 166 users
- developers.bookwalker.jp
- テクノロジー
- 2022/09/02
こんにちは。メディアサービス開発部Webアプリケーション開発課のフサギコ(髙﨑)です。部署名が変わりました。 Ruby on Railsによるバックエンドの実装運用と、AWSによるサービスインフラの設計構築を中心とした、いわゆるテックリードのような立ち位置で働いています。本記事では、UTF-8環境下で動くRailsがShift_JISな外部APIと通信する方法についてお話しします。前提知識文字コード UTF-8環境下で動くRailsがShift_JISな外部システムと通信するには Shift_JISな外部APIに対してPOSTリクエストするべた書きとしては Railsにおいては Shift_JISで使用できない文字が混ざっていないかをバリデーションする Shift_JISな外部システムからPOSTリクエストを受けるおまけ: ユーザのブラウザにShift_JISでPOSTさせる
- rails
- 文字コード
- あとで読む
- unicode
- ruby
- プログラミング
- 通信
- API
- programming
PDF に謎の漢字が含まれるとき
- 161 users
- gist.github.com/xl1
- テクノロジー
- 2020/10/01
gistfile1.md PDF に謎の漢字が含まれるとき PDF などの中にある一部の日本語の漢字が、見た目は同じだけど異なる謎の文字に変換されていることがある例 1: https://www.mhlw.go.jp/content/10906000/000628667.pdf 「長野」と「長崎」の「長」が、 U+9577 ではなく「⾧ (U+2FA7)」になっている例 2: https://www.dpri.kyoto-u.ac.jp/news/12739/ 大量にある、どうしてこうなった PDF ではないので何かからコピーして書いた？この文字は康煕部首 (Kangxi Radicals) というもので、部首としての文字であるＭＳゴシックなど Kangxi Radicals の字形がないフォントを指定すると表示できないので区別しやすいどこから来たのか？これらは（フォントに
- pdf
- unicode
- 文字コード
- font
- textlint
- フォント
- あとで読む
- 漢字
- 文字
- pc
A Field Guide to Japanese Mojibake
- 157 users
- www.dampfkraft.com
- テクノロジー
- 2021/11/01
When you open a document with an encoding different than the one it was created with, it's not possible to display the original text, and instead a garbled mess of corrupted characters are printed out. These are called "mojibake" in Japanese, and the word has also been borrowed into English. While mojibake aren't readable by humans, it turns out that different kinds of mojibake have different visu
マルチバイト文字とURL | 技術者ブログ | 三井物産セキュアディレクション株式会社
- 155 users
- www.mbsd.jp
- テクノロジー
- 2023/02/16
MBSDでWebアプリケーションスキャナの開発をしている寺田です。前記事では正規表現でのURLのチェックについて書きました。今回はその続きでマルチバイト文字を使った攻撃について書きたいと思います。前提条件本記事で想定するのは、ブラウザからパラメータとして渡されて来るURLを、リダイレクトやリンク等のURLとして使うケースです。その中でも、以下のようにサブドメイン部分（★の部分）を可変にする状況を主に想定します。 https://★.example.jp/… 攻撃の目標は、異なるドメイン（evil）のURLを与えてチェックをすり抜けることです。前回の記事にも書きましたが、この状況は（半角英数等のサブドメインしか受け入れないような場合を除き）「/」「?」「#」「\」のいずれかをサブドメインに入れることで攻略できることが大半です。今回はこれらの記号が全て使用できないように対策されているこ
🚭ด้้้้็็็็็้้้้้็็็็็้้้้้้้้🔞龴⟿ﬨ֞ꆸ௵冫ם෴. ﷼ ℳ✧ ۞ on Twitter: "見事なまでの「あ、男性でしたか。失礼しました」現象。そもそも自分が男であるか女であるかがその主張に対して重要であるのかつー話。女性差別はやっぱり本当にあるんだなぁ。 https://t.co/G5flEPxAo9"
- 151 users
- twitter.com/IEEE1394beta
- 世の中
- 2019/11/05
見事なまでの「あ、男性でしたか。失礼しました」現象。そもそも自分が男であるか女であるかがその主張に対して重要であるのかつー話。女性差別はやっぱり本当にあるんだなぁ。 https://t.co/G5flEPxAo9
ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ
- 147 users
- nixeneko.hatenablog.com
- テクノロジー
- 2023/12/19
まえがきミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか？それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。なぜそのようなものが登場し、普及することとなったのか、この記事で解説する。目次まえがき目次凡例この記事で使う名称についてビルマ語表記コードポイントラテン文字表記について Zawgyiの概説と歴史 Zawgyiとは Zawgyiのダウンロード Zawgyi誕生・普及の経緯複雑なビルマ文字ビルマ文字とUnicode 回避策としてのビルマ文字フォントの登場 Zawgyiの普及 Zawgyiの実装実装の方針文字の並べ替えをせず、左から右に書く文字の形のバリエーション
- unicode
- 文字コード
- 文字
- あとで読む
- フォント
- ミャンマー
- font
- 言語
- 著作権
View Source
- 144 users
- neatnik.net
- テクノロジー
- 2021/08/11
· About · Changelog URL: Fetched 1.23 KB in 0.346985 seconds Don’t wrap lines · Tidy markup <!doctype html> <html> <head> <title>Example Domain</title> <meta charset="utf-8" /> <meta http-equiv="Content-type" content="text/html; charset=utf-8" /> <meta name="viewport" content="width=device-width, initial-scale=1" /> <style type="text/css"> body { background-color: #f0f0f2; margin: 0; padding: 0; f
Windows上でユニコードを「見る」方法
- 143 users
- ascii.jp
- テクノロジー
- 2024/05/12
Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使うユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。
Unicodeコンソーシアムが提供する“最後の手段”フォント「Last Resort Font」／フォールバック指定しておけばフォントに含まれていないグリフを突き止められる【レビュー】
- 136 users
- forest.watch.impress.co.jp
- テクノロジー
- 2021/01/22
- font
- unicode
- フォント
- 文字
- あとで読む
- *Web
- git
- あとでよむ
macOS 13.3 VenturaではNFC/NFD問題が再発し、濁音やアクセント記号が付いたファイルをダブルクリックしてもアプリで開けない不具合があるので注意を。
- 135 users
- applech2.com
- テクノロジー
- 2023/04/02
macOS 13.3 VenturaではNFD/NFC問題が復活し、濁音やアクセント記号が付いたファイルをダブルクリックしてもアプリで開けない不具合があるので注意してください。詳細は以下から。 Appleは2017年に開催したWWDC17において、同年末にリリースされるmacOS 10.13 High Sierraでは同社が開発する新しいファイルフォーマット「APFS」を正式導入すると発表しましたが、Macよりも先行してAPFSが採用されたiPhone (iOS 13.3から)では初期段階でUnicodeの正規化形式(NFD/NFC)問題により、アプリがファイルにアクセスできない不具合が確認されていました。表題の件、Acrobat Reader for mobileをiOS 10.3でご利用のお客様において、以下の現象が発生しております。既知の問題：ファイル名に下記の文字を使用した場
- Mac
- apple
- Unicode
- あとで読む
- 不具合
- macOS
- IoT
- 未分類
漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」｜TechRacho by BPS株式会社
- 132 users
- techracho.bpsinc.jp
- テクノロジー
- 2020/10/07
きっかけ以下のツイートで「埼玉埼⽟問題」と康煕部首を知りました。「埼玉」と「埼⽟」の話。unicodedata.normalize('NFKC', '「埼玉」と「埼⽟」') でいけそう https://t.co/kte0sxDvZT — Haruhiko Okumura (@h_okumura) July 11, 2020 康煕部首とは⼀⼁⼂⼃⼄⼅⼆⼇⼈⼉⼊⼋⼌⼍⼎⼏⼐⼑⼒⼓⼔⼕⼖⼗⼘⼙⼚⼛⼜⼝⼞⼟⼠⼡⼢⼣⼤⼥⼦⼧⼨⼩⼪⼫⼬⼭⼮⼯⼰⼱⼲⼳⼴⼵⼶⼷⼸⼹⼺⼻⼼⼽⼾⼿⽀⽁⽂⽃⽄⽅⽆⽇⽈⽉⽊⽋⽌⽍⽎⽏⽐⽑⽒⽓⽔⽕⽖⽗⽘⽙⽚⽛⽜⽝⽞⽟⽠⽡⽢⽣⽤⽥⽦⽧⽨⽩⽪⽫⽬⽭⽮⽯⽰⽱⽲⽳⽴⽵⽶⽷⽸⽹⽺⽻⽼⽽⽾⽿⾀⾁⾂⾃⾄⾅⾆⾇⾈⾉⾊⾋⾌⾍⾎⾏⾐⾑⾒⾓⾔⾕⾖⾗⾘⾙⾚⾛⾜⾝⾞⾟⾠⾡⾢⾣⾤⾥⾦⾧⾨⾩⾪⾫⾬⾭⾮⾯⾰⾱⾲⾳⾴⾵⾶⾷⾸⾹⾺⾻⾼⾽⾾⾿⿀⿁⿂⿃⿄⿅⿆⿇⿈⿉⿊⿋⿌⿍⿎⿏⿐⿑⿒⿓⿔⿕ KangXi Radica
- 文字コード
- unicode
- 漢字
- あとで読む
- 日本語
- encoding
- bug
- 文字
- slide
Unicodeに含まれる謎の記号「⍼」の起源を追ったレポートが公開中
- 125 users
- gigazine.net
- テクノロジー
- 2022/04/14
大規模文字セットのUnicodeは世界中のあらゆる文字を収録することを目指して策定されており、「溶解する顔」や「妊娠中の人」といった個性的な絵文字も数多く登録されています。そんなUnicodeに登録されている正体不明の記号「⍼」について、ブリティッシュコロンビア大学でソフトウェアについて学んでいるジョナサン・チャン氏がまとめています。 U+237C ⍼ RIGHT ANGLE WITH DOWNWARDS ZIGZAG ARROW · Jonathan Chan https://ionathan.ch/2022/04/09/angzarr.html 「⍼」は数学記号用のフォントなどに含まれている記号です。例えば、数式・化学式用フォント「Cambria Math」に含まれる「⍼」を拡大してみるとこんな感じ。カギカッコのような直角と稲妻形の矢印が組み合わさった日常生活では全く目にすることのない
- フォント
- unicode
- 文字コード
- 文字
- あとで読む
- GIGAZINE
- font