[13ページ] Unicodeの人気記事 9104件 - はてなブックマーク

481 - 520 件 / 9104件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Unicodeの検索結果481 - 520 件 / 9104件

幽霊文字 - Wikipedia
- 215 users
- ja.wikipedia.org
- テクノロジー
- 2007/01/22
幽霊文字（ゆうれいもじ、英:ghost letter）は、JIS基本漢字に含まれる、典拠不明の文字（漢字）の総称。幽霊漢字（ゆうれいかんじ）、幽霊字（ゆうれいじ）とも呼ぶ。概説[編集] 河内𡚴原地区(滋賀県犬上郡多賀町)の地名看板。幽霊漢字「妛」は「𡚴」の誤字である可能性が指摘されている。 1978年に当時の通商産業省が制定したJIS C 6226（後のJIS X 0208）では、いわゆるJIS第1・第2水準漢字として6349字が規定された。この漢字集合を「JIS基本漢字」と呼ぶ。このとき典拠として次の4つの漢字表に含まれる漢字が採用された[1]。標準コード用漢字表（試案）：情報処理学会漢字コード委員会（1971年）国土行政区画総覧：国土地理協会（1972年）日本生命収容人名漢字：日本生命（1973年、現存せず）行政情報処理用基本漢字：行政管理庁（1975年）しかし
- wikipedia
- 漢字
- 文字
- 雑学
- 言語
- 言葉
- フォント
- 日本語
- japanese
- ネタ
絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット
- 215 users
- japan.cnet.com
- 暮らし
- 2009/03/19
前回までを振り返る--Unicodeコンソーシアムの影響力前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC（Unicode Technical Committee/Unicode技術委員会）で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソー
- unicode
- 文字コード
- mobile
- emoji
- 絵文字
- 携帯電話
- google
- 携帯
- charset
- ケータイ
javascript - hanzenkaku.js で半角全角処理 : 404 Blog Not Found
- 214 users
- dankogai.livedoor.blog
- テクノロジー
- 2012/08/13
2012年08月13日06:00 カテゴリLightweight LanguagesTips javascript - hanzenkaku.js で半角全角処理まあ車輪の再発明もいいところなのですが、車軸に合う車輪が見つからなかったということで。 dankogai/js-hanzenkaku DEMO まずは実際にお試しを。全角: 半角: 全methodは以下のとおり。textarea内でいろいろと書き換えてみてください。 /* Functinal */ p( HanZenKaku.h2z('ｺｶﾞｲﾀﾞﾝ') ); p( HanZenKaku.z2h('コガイダン') ); p( HanZenKaku.hw2fw('dankogai') ); p( HanZenKaku.fw2hw('ｄａｎｋｏｇａｉ') ); p( HanZenKaku.fs2hs('a　space') ); p
Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改メ tokuhirom’s blog
- 214 users
- blog.64p.org
- 暮らし
- 2008/04/08
Blog Search when-present<#else>when-missing. (These only cover the last step of the expression; to cover the whole expression, use parenthesis: (myOptionalVar.foo)!myDefault, (myOptionalVar.foo)?? ---- ---- FTL stack trace ("~" means nesting-related): - Failed at: ${entry.path} [in template "__entry.ftlh" at line 3, column 25] - Reached through: #include "__entry.ftlh" [in template "entry.ftlh" at
- perl
- utf8
- encode
- 文字コード
- utf-8
- 文字化け
- unicode
- programming
- tips
- encoding
Unicode table for you
- 214 users
- www.ftrain.com
- 暮らし
- 2009/08/22
The code for this toy is contained in this page, and is available under both the GPL and MIT licenses. View source and help yourself.
- unicode
- 文字コード
- charset
- reference
- programming
- encoding
- webservice
- webサービス
- font
- cheatsheet
MySQLの日本語コレーション - tmtms のメモ
- 213 users
- blog.tmtms.net
- テクノロジー
- 2017/06/20
4月にMySQLの日本語コレーションについて語り合う場に呼ばれていろいろ話を聞いてきました。すぐにブログを書こうと思ったんですが、はや2ヶ月経過…。ときどき、自分がMySQLの文字コードに関して発表する際に、次のようなスライドをいれてるんですが、 MySQL 8.0 でとうとう日本語コレーションが入ることになったのに、なんか期待してたのと違いました。で、その辺の話を聞きました（2ヶ月も経ってるのでうろ覚え）。 Q. わざわざ日本語ロケール作るんだったら日本人が扱いやすいロケールにしてほしい utf8mb4_ja_0900_as_csはMySQLが独自に考えたものではない。Unicode規格に従っている。過去にいろいろ独自にやって失敗してきてるので、もう独自にやるのは避けたい。 ai(accent insensitive)で「ハ」=「パ」=「バ」になるのも、ci(case insensi
- mysql
- unicode
- 文字コード
- あとで読む
- 日本語
- i18n
- AI
- ci
- character
- DB
ニコニコ動画の1.5GBの新仕様って、何が変わって、どうすればいいの？
- 212 users
- oppai.tank.jp
- テクノロジー
- 2016/09/11
文字コードの話
- 211 users
- euc.jp
- 暮らし
- 2005/02/14
本稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次はじめに第1章日本語のコード体系第2章 ASCIIと1バイト文字コード第3章 JIS漢字コードとエンコーディング法第4章 ISO 2022 第5章 ISO 2022の実例第6章中国語・韓国語の文字コード第7章 ISO 10646とUnicode おわりに参考文献はじめに ASCIIだけで用が足りるアメリカと違って、私たちは日本語を扱わなくてはならないため、より深く文字コードの問題と関わらざるをえません。それでも、MS-DOS/WindowsやMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日本語コードに頭を
セキュリティ専門家でも間違える！文字エンコーディング問題は難しいのか?
- 211 users
- blog.ohgaki.net
- 暮らし
- 2009/09/15
(Last Updated On: 2018年8月13日)一見徳丸さんのブログは分かりやすいように思えますが、それは単純な実験により分かりやすいように見えるだけで複数の間違いがあります。その間違いとは意図の取り違い – 誤読言語の仕様と実装の理解不足 HTTPやPHP仕様の理解不足セキュリティ対策をすべき場所の理解不足です。(※0) 徳丸さんは非常勤とは言え、国の出先機関の研究員であるし、その出先機関は職務放棄とも言える文書（「例えば、PHPを使用しない」と勧める文書）を公開している(いた?)のでしっかり反論しておく必用がありますね。IPAのあの文書は職務放棄と言える文書だと思っています。これについても後で意見を述べます。意図の取り違い – 誤読最初の間違いは私のブログのエントリ「何故かあたり前にならない文字エンコーディングバリデーション」に対する理解です。特にPHPユーザに
Twitter時代の文字の数え方 | 配電盤
- 209 users
- blog.unfindable.net
- 暮らし
- 2011/06/18
入力「×」のブラウザでは、「𠮷」が2文字とみなされるため、2文字目まで、つまり「𠮷野」までしか入力できません。 Mozillaの文書には、Unicode code pointsで数えると書いてあるので、そのうち改善されるのかもしれませんが、現時点ではTwitterのために「maxlength="140"」を使うことはできません。 pattern属性 Firefox 21とChrome 27、IE 10、Opera 12.15は、「pattern=".{0,3}"」（任意の文字からなる0から3文字）のような正規表現を使った検証にも対応していますが、やはり「𠮷野家」は4文字とみなされてしまいます。 JavaScript 追記：javascript – でBMP以外のUnicode文字をきちんと扱う（404 Blog Not Found） JavaScriptでは、文字列strの長さをst
- unicode
- 文字コード
- encoding
- javascript
- html5
- programming
- プログラミング
- html
- 文字
- utf-8
ことばマガジン：朝日新聞デジタル
- 207 users
- www.asahi.com
- 世の中
- 2012/02/27
能登半島地震パレスチナ情勢速報朝刊記事一覧紙面ビューアー夕刊記事一覧紙面ビューアー連載ランキングその他コメントプラスニュースの要点特集動画・音声・写真土曜別刷り「be」記者イベント天気数独 12星座占いサイトマップ検索ヘルプ Q&A（よくある質問）総合ガイドお申し込みログインマイページ有料会員紙面ビューアーコース登録済み無料会員（クーポン適用中）紙面ビューアーコース登録済み無料会員紙面ビューアーコース登録済み朝日ID会員紙面ビューアーコースお客様サポート（個人設定）お客様サポート（個人設定）お客様サポート（個人設定）メール設定スクラップブック MYキーワード会員特典・プレゼント提携プレミアムサービスログアウト
- 言葉
- 歴史
- 日本語
- 言語
- ことば
- typography
- 電子テキスト
- 文字
- あとで読む
- 文字コード
Text Escaping and Unescaping in JavaScript(Unicode の文字列をエスケープする JavaScript)
- 206 users
- 0xcc.net
- 暮らし
- 2007/10/16
Notes No data is sent to the server (i.e. everything is done in JavaScript). Conversion from Unicode to other encodings such as Shift_JIS can be slow first time as it needs to initialize internal conversion tables. Surrogate pairs in UTF-16 are supported. Try inserting \uD840\uDC0B in the second form. Three-byte characters in EUC-JP are not supported. Links JavaScript Unicode Charts Try GNU Libidn
- javascript
- 文字コード
- escape
- unicode
- encoding
- encode
- ツール
- tool
- webサービス
- 文字
Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加
- 206 users
- www.publickey1.jp
- テクノロジー
- 2019/03/07
Unicode 12では4つの言語（script）、554種類の文字が追加されました。これによりUnicodeに収録されている言語は150、文字は13万7292種類になりました。追加された文字には日本語の文字が7種類、小さな文字としての「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が含まれています（通常の大きさの文字は以前からありました）。これらは古い文書を記述するために使われるとされています。そのほか、現在のイラン南西部に存在したアケメネス朝で使われていたアラム語のElymaic文字。南インドのサンスクリット語、カンナダ語で使われていたNandinagari文字。ラオス、タイ、ベトナム、フランス、オーストラリア、カナダ、米国などで使われていた現代White Hmong語、Green Hmong語のNyiakeng Puachue Hmong文字。インド、ミャンマー、ブータンの現代Wanc
- unicode
- 文字コード
- 元号
- あとで読む
- 文字
- 言語
- 日本語
- publickey
- PC
「HTMLでは環境依存文字（①や©など）を文字参照にしなければいけない」という誤解と、本当に置換すべき文字
- 206 users
- zenn.dev/kagan
- テクノロジー
- 2022/10/21
HTMLファイルで特殊記号を使う際、① は ①、© は © のように置き換えて書かないといけないものだと思いこんでいないでしょうか。現代ではそれは誤解です。 UTF-8では特殊記号の文字参照は不要そもそも環境依存文字とは、データを扱う機種・ソフトウェアなどの違い（文字コードの割り当ての違い）により表示に違いが出てしまう文字のことでした。例えばShift_JISには © が含まれておらずそもそも保存できなかったり、 ① などの丸数字は含まれているものの、WindowsとMac OS（当時）の割り当ての違いにより正しく表示できなかったりしました。[1] しかし現在ではUnicodeによって文字コードは統一化されており、その問題はほとんど起きなくなっています。近年では多くの場合 UTF-8 でファイルを記述すると思います。 HTMLファイルの文字エンコーディングが
Python でUTF-8, shift_jis, euc_jpなど日本語を使う方法
- 205 users
- osksn2.hep.sci.osaka-u.ac.jp/~taku
- 暮らし
- 2006/02/04
[Home] [Setting up Mac OS X] [Python]: [ファイルを読む] 日本語を使う Pythonで日本語を使う Python 2.4以降では、標準で日本語を扱うことができます。 PythonのソースコードをUTF-8で書くには日本語を扱うPythonのスクリプトの中では、UTF-8の文字コードを使うのが楽です。 Mac OS Xのターミナルで日本語を扱う場合は、ここの「4. Terminalの設定を変える」の指示に従ってください。以下、ソースコードの簡単な例を示します。 #!/usr/bin/env python # -*- coding: utf-8 -*- import re jtext = u'子猫が隠れんぼをしています' print 'jtext has', len(jtext), 'Japanese characters.' if re.se
- python
- 文字コード
- utf-8
- 日本語
- unicode
- programming
- Encoding
- プログラミング
- encode
- japanese
Tyto Style
- 205 users
- www.tyto-style.com
- テクノロジー
- 2009/01/05
Tyto Style（ティトスタイル）について Tyto Style（ティトスタイル）は、京都・大阪を中心に活動するSEOディレクター兼マークアップエンジニア、三嶋正人の個人事業サイトです。これまで約15年間にわたり、さまざまなウェブサイトの制作や改善、運用上のアドバイス等を行いSEOに強いサイトを作るための試行錯誤を重ねてきました。現在はこれまでに得た経験を活かし、フリーランスとしてウェブサイト制作やSEOを中心としたサイト運用のサポート・アドバイスなどを行っています。現在運用されていたり、企画中のウェブサイトが、本当にあなたの目標に適うものになっているのか、検索エンジンに最適化されたものなのか、少しでも疑問をお持ちであれば、立ち止まって現状を見直してみることはとても重要です。その一環として、ぜひ一度お悩みをご相談ください。現状を分析した上で、最適な改善方法をご提案いたします。
- 素材
- フリー素材
- アイコン
- webデザイン
- icon
- デザイン
- material
- web
- photoshop
- design
“コロ助bot”のツイートはどうやって文字列を自動生成しているのか分析してみるも意味がわからず→中の人が真実を明かす「クレイジーは議論を生む」
- 205 users
- togetter.com
- 暮らし
- 2018/11/22
やる:免許証 DC インク買う:ハブ靴下 @potetisensei ツイッターに@korosk_botというのがいて、これ多分適当なバイナリファイルをshift-jisとして解釈した時の文字列のうち、最後がﾅﾘｲ(C5D8B2)で終わるものをランダムでツイートしてるんだと思うんだけど、なんでそんなことを思いついたんだという気持ちになるし何のファイルから生成してるのか気になる 2018-11-19 16:11:34
- togetter
- ネタ
- twitter
- あとで読む
- いい話
- ネット
C#で高精度なテキストファイル文字コード自動判別（2014年版） - hnx8のブログ
- 204 users
- hnx8.hatenablog.com
- テクノロジー
- 2015/01/03
C#（.NET Framework）に限ったことではありませんが、汎用的にテキストファイルを扱うようなアプリケーションを作っていると、よく特定の文字コードのファイルしか読み出せないのでは困る ⇒文字コードを自動判別し、テキストの内容を取り出したい読み出したファイルと同じ文字コードでファイルを書き出したい ⇒読み出したファイルの文字コードを知りたいといった場面に出くわします。ですが、C#（.NET Framework）標準のライブラリではそのような機能は提供されていないため、文字コードを判定するには、自前で文字コード判定のロジックを実装する出来合いの外部ライブラリ、Windows版NKF32.dll、ICU4Cなどを利用する IE用の文字コード判別ライブラリ（mlang.dll）を利用する ※COMコンポーネント呼び出し要のいずれかの方法を取ることになります。 HNXgrepと
- c#
- 文字コード
- .net
- プログラミング
- encoding
- programming
- 開発
- Windows
- .NET Framework
- text
メインページ - GlyphWiki
- 204 users
- glyphwiki.org
- テクノロジー
- 2007/11/21
【お願い】使用言語登録のお願い（お知らせ）グリフウィキにようこそ！グリフウィキ(GlyphWiki)は、明朝体の漢字グリフ（漢字字形）を登録・管理し、皆で自由に共有することを目的としたウィキです。一般的にフォントや個々の漢字グリフの管理は面倒ですが、グリフウィキでは簡単に漢字グリフをデザインすることができ、さらにウィキですので漢字グリフ１つ１つを独立して管理できます。また、グリフを集めてフォントを作り、即座に公開することができます。グリフの管理は誰でも可能です。また、登録されているグリフは自由に使うことができます。自分が必要なグリフを必要なだけ登録し、既に登録されているデータの一部と合わせ、まとめてフォントにすることができます。現在1,000,000を超える量の漢字グリフが登録されています（別名同字形グリフを別カウントの場合）。あなたの持っている外字データ・異体字データをグリフウ
- font
- 漢字
- フォント
- 文字
- wiki
- webサービス
- 言語
- 文字コード
- kanji
- unicode
ウェブマスターのための文字化け講座
- 203 users
- www.shtml.jp
- 暮らし
- 2004/05/11
（序論）文字化けの発生メカニズム概論と解析方法ネスケ4.Xで特定の文字（試・時・事・私など）が文字化けする場合 → document.writeで文字化けする漢字の規則性 → ネットスケープ4.Xのキャッシュ機構 → ２種類の解決方法ＣＧＩで特定の文字（表・予・申・能・ソ・十など）が文字化けする → Shift_JISでCGIを作成する場合の注意点 → PHPで「表\示」「十\和田湖」「申\し込み」などと表示される場合「（はしご高）」が使えない理由 → Windowsでは表示されるが、Macでは文字化けする文字 → Macでは表示されるが、Windowsでは文字化けする文字 → 機種依存文字チェック・プログラム（Flashフォームなど）文字化けしないための工夫 → メタタグの指定は有効か？ → 「美乳」で文字化けが直るって本当？フォントを指定したら文字化けした。 → フォントの指
- 文字化け
- 文字コード
- web
- html
- web制作
- charset
- tips
- webdesign
- webデザイン
- プログラミング
Fonts supplied with Windows 7
- 203 users
- learn.microsoft.com
- 暮らし
- 2005/06/02
Microsoft Typography documentation Microsoft Typography group researches and develops font technologies and supports the development of OpenType fonts by independent type vendors. Microsoft Typography Develop fonts, find existing fonts, and license fonts from registered vendors.
- font
- windows
- フォント
- microsoft
- ClearType
- typography
- ttf
- truetype
- software
- Windows XP
perl - use utf8; #って何だ? : 404 Blog Not Found
- 202 users
- dankogai.livedoor.blog
- 暮らし
- 2009/06/15
2009年06月15日07:00 カテゴリLightweight Languages perl - use utf8; #って何だ? id:otsuneに建設予定フラグがたてられていたので。冬通りに消え行く制服ガールは、夢物語にリアルを求めない。 - subtech Perl の utf8 関係が未だ全く理解できない。わからないことがわからないので整理 use utf8はいつフラグをたてるか use utf8 しててもフラグたたないことがある…… これは、以下の実例を見ていただくのが一番よいだろう。 #!/usr/bin/perl use strict; use warnings; use utf8 (); sub check_flag{ my $str = shift; print qq("$str" ), utf8::is_utf8($str) ? 'is' : 'IS NOT',
- perl
- utf8
- 文字コード
- encode
- unicode
- dankogai
- programming
- charset
- cpan
- プログラミング
グーグル、大急ぎでハンバーガー絵文字を修正へ - BBCニュース
- 201 users
- www.bbc.com
- 暮らし
- 2017/11/03
米グーグルのスンダル・ピチャイ最高経営責任者（CEO）は先月30日、週明けに出勤してきた従業員たちにある重大な目標を大急ぎで達成するよう指示したらしい。ハンバーガーの絵文字を修正せよ。これが使命だった。ピチャイCEOの指示は、作家トーマス・ベクダル氏のツイートに反応してのものだった。ベクダル氏は、IT企業2社のハンバーガー絵文字が違うと、その相違点を指摘していた。溶けたチーズが流れ出るようにチーズがらみのダジャレも飛び交うなか、この絵文字をめぐって、非常に「肉厚」な議論が繰り広げられた。ポイントはつまり、ハンバーガーにおけるチーズの適正な位置。チーズはどこにあるべきなのか。
- Google
- ネタ
- 絵文字
- デザイン
- Apple
- IT
- あとで読む
- 食
- 写真
日本語と文字コード
- 200 users
- www.kanzaki.com
- テクノロジー
- 2004/07/14
コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト（7/8ビット）を基本単位として扱う前提で作られているものが中心です。そのなかで日本語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日本語の文字コードに関する基本を整理しておきます。 JIS漢字コード（情報交換用符号化漢字集合）区点コード JISコード（符号化方式）シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ参考文献、リソース文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード（情報交換用符号
- 文字コード
- charset
- encoding
- charcode
- unicode
- 文字
- 日本語
- japanese
- CharacterCode
- Web
Webアプリケーション設計の第一歩は ディレクトリの整理から / Encraft 1
- 199 users
- speakerdeck.com/okunokentaro
- テクノロジー
- 2023/03/24
2023/3/24、Encraft #1 フロントエンド×設計にて発表した資料です。
- 設計
- あとで読む
- web
- Web開発
- design
- Next.js
- frontend
- アプリケーション
- slide
IBM Developer
- 198 users
- developer.ibm.com
- 暮らし
- 2007/10/27
IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.
- php
- unicode
- 文字コード
- programming
- プログラミング
- utf-8
- tips
- *php
- language
- あとで読む
文字化けしたメールの修復
- 198 users
- www.kanzaki.com
- テクノロジー
- 2002/11/04
インターネットで届いたメールは、メールソフトがMIMEに正しく対応していなかったり、JISコードのシーケンス切り替えができなかったりして文字化けしてしまうことがあります。こうした文字化けは、多くの場合、簡単な仕組みで復元することが可能です。 ※以下のサービスは別サーバーで提供します。 From, Subjectなどの読めないヘッダを修復 =?ISO-2022-JP?B?GyRCJD8hIxsoQg==?= のような件名など文字化けしている本文の修復 $B$3$l$O(JJIS$B$NJ8$G$9!#(Jのような文字化け Unicode文字参照になっている本文の解読 こん...のような、 '&#' と ';' に数字が挟まれたコードが連続する本文ツールで解読できない文字化けもあると思いますが、このページの作者に直接メールで依頼しないでください。残念ながら個別に
- 文字化け
- mail
- メール
- tool
- webサービス
- 便利ツール
- ツール
- webservice
- PC
- encoding
旧・Macの手書き説明書 - FC2 BLOG パスワード認証
- 197 users
- veadardiary.blog.fc2.com
- 暮らし
- 2008/12/28
ブログパスワード認証閲覧するには管理人が設定したパスワードの入力が必要です。管理人からのメッセージ https://mac-tegaki.comへ移転中閲覧パスワード Copyright © since 1999 FC2 inc. All Rights Reserved.
- mac
- zip
- software
- windows
- 圧縮
- フリーソフト
- tool
- osx
- tools
- 文字化け
Engadget | Technology News & Reviews
- 197 users
- www.engadget.com
- テクノロジー
- 2015/02/24
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
- Apple
- iOS
- 絵文字
- unicode
- emoji
- フォント
- 文字コード
- 文化
- OS X
- iphone
Perl5.8 の UNICODE 対応
- 196 users
- www.lr.pi.titech.ac.jp/~abekawa
- 暮らし
- 2005/02/19
perl は 5.8 から Unicode(utf-8) がサポートされました．5.6 でも Unicode に対応はしていましたが，ぜんぜん使い物にならず，ようやく 5.8 でまともに使えるようになったということです．ただせっかく使えるにもかかわらず perldoc などを見てもイマイチ使い方がわからないので，独自にまとめてみたのがこのページです．誤った書き方や勘違いをしていることもあるので，形式的ですがこのページの内容は無保証です．内容文字コード変換 perlIO jperlからの移行 UTF-8フラグ文字コード自動判別 Unicode Standard Unicode 正規化その他参考資料文字コード変換とりあえず perl5.8 で新しく組み込まれた機能を見るために，euc-jp から shift_jis への変換スクリプトをいくつか載せます． openを利用し
- perl
- unicode
- 文字コード
- utf8
- encode
- charset
- programming
- utf-8
- encoding
- script
JavaScript: 文字数を正確にカウントするには？ - Qiita
- 195 users
- qiita.com/suin
- テクノロジー
- 2022/04/11
この投稿ではJavaScriptで文字数をできるだけ正確にカウントする方法について取り上げます。文字数とは？要件で「文字数を表示してほしい」「○文字以上はバリデーションエラーにしたい」と文字数を考慮しないとならないことがあります。そもそも文字数とは何でしょうか。たとえば、アルファベットの「A」は1文字と数えられそうです。次の絵文字は、何文字になるでしょうか？この絵文字はiOSであれば14.5の環境では、UI上では上のように1文字のように表示されます。しかし、それ以前のバージョンでは、同じ文字列データでも😵💫のように2文字で表示されます。なお、この絵文字は3つのコードポイントU+1F635 U+200D U+1F4ABからなります。この絵文字の「文字数」はいったい何文字として扱ったらよいのでしょうか。以上のように、ひとことで文字数と言ってもデータと見た目と環境の3つのややこ
JavaScript でのブラウザ判別 - 「仕様の盲点」ではなく、「プロパティの有無」を使う方がマシ - 2009年2月 - Blog - EOF
- 195 users
- end-of-file.net
- 暮らし
- 2009/02/01
IE6, IE7 で tabindex 属性を JavaScript 側から設定する時の注意これは完全にバグといえる仕様なのだが、IE6 と IE7 では JavaScript（IE だから本来は JScript）側から setAttribute などを使って tabindex 属性を設定してやる時、属性名を "tabIndex" にしてやらないと認識しないことを知った（"I" がキャメルケースになっている）。WAI-ARIA（2008-08-06版 WD 邦訳）絡みで色々といじっていた時に発見。因みに IE8 RC1 では修正されている。次の JavaScript コード断片は、IE で tabindex 属性を設定する時の方法を説明したものである。 // ターゲット要素 var elem = document.getElementById("test"); elem.setAttr
- javascript
- browser
- ブラウザ
- tips
- UA
- programming
- *javascript
- Firefox
- development
- web
サロゲートペア入門
- 195 users
- codezine.jp
- テクノロジー
- 2007/08/28
はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日本語漢字の数が増えました。従来、12238字（Windows XP）だったのが13145字（Windows Vista）になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです（Windows XPまでは一部サポート）。またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。対象読者 Unicodeでデータ処理
「スマートフォンはまだ早い」　au、メール無料と“全方位端末”で春商戦へ
- 195 users
- www.itmedia.co.jp
- 暮らし
- 2009/10/19
「最需要期に向かってきっちりした端末を出していく」――KDDIの小野寺正社長は10月19日に開いた2009年秋冬、10年春モデルの狙いをこう述べた。新モデルは13機種で、12Mピクセルカメラを搭載したハイエンド機や、薄型ワンセグ機、シニア・子ども用端末まで、幅広いラインアップ。スマートフォンはないものの、「ユーザーのカテゴリー別に訴求できる端末をそろえた」と小野寺社長は胸を張る。基本使用料などの合計が最低月額1095円で、メールを送受信相手にかかわらず無料で利用できる「ガンガンメール」も投入し、「auはメールが無料」とPR。「端末と料金、サービスがそろった」と小野寺正社長は自信をみせる。ハイエンドからシニア、子ども向けまで新機種は、12Mピクセルカメラを搭載した「EXILIMケータイ CA003」「AQUOS SHOT SH003」といったフラッグシップ機、8Mカメラを搭載した「E
- au
- mobile
- 携帯電話
- 携帯
- business
- ケータイ
- これはひどい
- KDDI
- ビジネス
- ネタ
Engadget | Technology News & Reviews
- 194 users
- www.engadget.com
- テクノロジー
- 2014/03/27
Pick up the 9th-gen iPad with two years of AppleCare+ for only $298
- unicode
- 文字コード
- apple
- 絵文字
- emoji
- 文化
- 差別
- iPhone
- society
- コミュニケーション
中国人を悩ませるレアな名字の文字コード問題
- 193 users
- japan.zdnet.com
- テクノロジー
- 2023/05/31
印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」（信息技術中文編碼字符集）が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される」と反射的に考えてしまうかもしれないが、これは文字コードの標準規格を新たに導入するという話だ。珍しい名字などに使われ、既存の文字コードに未登録の漢字に対応しようというものになる。中国の面積は日本の国土の約25倍で、約14億人の人口を擁している。一部の地域限定で使われている漢字や、少数民族の固有名詞でのみ用いられている漢字もある。文字コードに含まれない漢字を使っている人は約6000万人もいるそうだ。例えば、山東省青島市郊外にシュイユー村という地元ではまあまあ
- 中国
- unicode
- 文字コード
- 漢字
- 文字
- china
- あとで読む
- kanji
- font
- 言語
おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diary
- 193 users
- ill-identified.hatenablog.com
- テクノロジー
- 2020/10/03
2021/9/10 追記: 改めて更新された話を統合して整理して書き直しました. 以降はこちらを参考にしてください: ill-identified.hatenablog.com 2021/1/15 追記: RStudio 1.4 がリリースされたのでなるべくアップデートしましょう 2020/12/06 追記: Japan.R で今回の話の要約+新情報を『Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck』として発表した. ハイライトは「近々出るRStudio 1.4 があれば fontregisterer はほぼいらなくなる」 2020/10/31 追記: geom
- R
- あとで読む
- ggplot2
- グラフ
- ggplot
- 統計
- フォント
- 文字コード
- 日本語
- 統計学
三菱東京UFJ銀の一部障害、直接の原因は文字コードの設定誤り
- 192 users
- xtech.nikkei.com
- 暮らし
- 2008/05/12
三菱東京UFJ銀行の一部キャッシュカードが、5月12日の午前7時から約5時間セブン銀行のATMで使えなくなった原因が分かった。三菱東京UFJ銀のシステムからセブン銀のシステムに送信する取引結果データの文字コードに誤りがあり、セブン銀のシステムが取引結果を正常に処理できなかった。約2万件の取引が影響を受けた。取引ができなかったのは、取引対象が旧東京三菱銀の店舗の口座で、かつ通帳に未記入の明細が10件以上あるときに限られる。この条件を満たす場合、三菱東京UFJ銀のシステムは、通帳記帳を促す案内文を取引結果データに加えて、セブン銀に送信する。この案内文はカタカナだけを使用すると両行で取り決めていた。一方、三菱東京UFJ銀は5月10日の夜9時から12日朝7時までシステムを臨時停止し、旧東京三菱銀ベースの勘定系システムに旧UFJ銀の機能を追加した新システムを稼働するための切り替え作業を実施した。
- システム開発
- 文字コード
- 障害
- 三菱東京ufj
- IT
- news
- development
- 銀行
- システム障害
- 開発
対策遅らせるHTMLエンコーディングの「神話」
- 192 users
- xtech.nikkei.com
- 暮らし
- 2007/04/09
クロスサイト・スクリプティングという言葉は元々，WebアプリケーションのHTMLエンコード漏れなどを利用することによって第三者にJavaScriptを実行させる手法を指す。広義では，HTMLのエンコードによる画面改変などを含むこともある。前回述べたように，クロスサイト・スクリプティングのぜい弱性はWebアプリケーションに見付かるぜい弱性の半分以上を占める。数年前から指摘されているにもかかわらず，一向になくならない。その理由として，クロスサイト・スクリプティング対策あるいはHTMLエンコード注1）に対する「神話」があり，正しい対策の普及を遅らせているように思う。その「神話」の数々について説明しよう。注1）実体参照（entity reference）というのが正式だが，あまり普及していない用語なので，HTMLエンコードという用語を用いる「すべからくHTMLエンコードすべし」が鉄則 HTM
黄色い絵文字の意図は「ありえない肌の色」　Unicodeコンソーシアム会長、マーク・デイビス博士に聞く
- 191 users
- internet.watch.impress.co.jp
- テクノロジー
- 2015/05/30
- unicode
- 文字コード
- 絵文字
- emoji
- 文字
- フォント
- Apple
- character
- color
- デザイン