[B! charcode] neumannのブックマーク

JEF ‐ 通信用語の基礎知識

基本は、従来の汎用機で使われていたEBCDICで、制御コードで必要に応じて日本語の漢字面を切り替える。 1979(昭和54)年4月に富士通で開発された符号で、正式な名称を「富士通日本語情報システム」という。もって汎用機で英数字、カナ、漢字交じりの日本語処理を可能とした。

neumann 2014/10/07

charcode

リンク

シフトJISの1バイトコード（半角文字）のエリア 0x00～0x1f、0x7f は制御コードです 0x20～0x7e はASCII文字です 0xa1～0xdf は半角カタカナですシフトJISの2バイトコード（全角文字）のエリア（JIS X 0208の漢字エリア）上位1バイト　 0x81～0x9f、 0xe0～0xef 下位1バイト　 0x40～0x7e、 0x80～0xfc ですが機種に依存しない観点より、ＨＴＭＬで以下の水色エリアは使用しないのが無難です水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです 0x8540～ 0x889e　は機種依存文字の主なエリアです 0xeb40～ 0xeffc　はMacOS では縦書用文字、Windows では特殊な外字エリアです 0xf040～　は外字エリアです（記載していません） perlで

neumann 2013/09/17

charcode

リンク

http://charset.7jp.net/jis.html

neumann 2013/09/17

charcode

リンク

JIS X 0213コード表(全コード) - CyberLibrarian

JIS X 0213(JIS拡張漢字)の表です。JIS X 0213:2004はすべてUnicodeに収録されており、数値文字参照で記述することができます。ただし、数値文字参照による記述部分はOSやブラウザのバージョンなどの環境によっては、文字化けする可能性があります。別表として、Unicode番号付きの表(5分割)も掲載しています。 1面（JIS X 0208および第3水準漢字）面区点 JIS SJIS EUC +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 1面1区 0 2120 813F A1A0

neumann 2013/07/22

1面（JIS X 0208および第3水準漢字） 2面（第4水準漢字）

charcode

リンク

https://support.microsoft.com/ja-jp/help/170559

すべての Microsoft 製品 Microsoft 365 Office Windows Surface Xbox セールサポートソフトウェア Windows アプリ OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入するアクセサリ VR & 複合現実エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム映画とテレビ番組法人向け Microsoft Azure Microsoft Dynamics 365 Microsoft 365 Microsoft Industry データプラットフォーム Power Platform 法人向けを購入する Developer & IT .NET Visual Studi

neumann 2013/07/14

Unicode との相互変換ができない文字のリストを次に掲載します。これは、容易に解決することができない既知の問題です。このリストは、ケースバイケースの回避方法を提供します。

リンク

416-1 | Unicodeに存在して、Shift-jisに存在しない文字の一覧はあるのでしょうか - VB初心者友の会 - 超初心者専用Q&A掲示板過去ログ

> 魚*3の漢字は「全角」であるかどうかを判断したいのですが、逆に質問です。何の為に『「全角」であるかどうかを判断したい」』のでしょうか？そもそも、半角／全角が意味を成すのは、「ＳｈｉｆｔーＪＩＳコードで扱う場合」だけだと思いますが・・・「Shift-jisに存在しない文字」に対して判定を行っても意味が無いのでは？ > このような、Unicodeに存在して、Shift-jisに存在しない文字は、 > どうすればチェックできる(分かる)のでしょうか。安直な手段でよければ、「１度Ｓｈｉｆｔ−ＪＩＳに変換してから、再度Ｕｎｉｃｏｄｅに変換して、元の文字に戻るかどうか？」と言う方法で判断できると思います。Ｐ．Ｓ．＃３７０に同じ内容の投稿が残っています。きちんと削除してください。ここの運営ルールでは、再投稿が許されるのは、以前の投稿を削除した時だけです。長文です。m(_ _)m

neumann 2013/07/14

charcode

リンク

http://www.asahi-net.or.jp/~ax2s-kmtn/character/japan.html

neumann 2013/07/13

JIS X 0201 ANK JIS X 0208 JIS基本漢字 JIS X 0212 JIS補助漢字 JIS X 0213 JIS拡張漢字

charcode

リンク

新漢字則(JIS X 0213:2004)

JIS X 0213:2004って何? コンピューターで文字を取り扱うには、文字に番号をつけて管理します(20年以上前では単なるグラフィックを描画していたものもありましたが)。通信の世界では文字を番号で送るほうが、グラフィックで送るよりはるかに少ないデータ量ですみます。はるか昔の300BPS(1秒間に300ビット、漢字換算でおおよそ1秒間に15文字の送受信)の頃に誰も文字をグラフィックで送受信しようなんて考えませんよね。それに文字を番号で管理すると、データベースへの蓄積・参照・検索が容易になります。アウトラインフォントも番号で管理しているからできるのです。アメリカで生まれたコンピューターではEBCDICやASCIIという管理方法(コード体系)が使われていました。日本ではラテン系文字(いわゆるアルファベット)に比べはるかに文字数が増えます。そこでASCIIコードの各国拡張領域($80-$FF

neumann 2013/07/13

第１・２水準　第３・４水準

charcode

リンク

Windows Vista/7/8/10：日本語入力環境について（JIS2004とは）－教えて！HELPDESK

ポイント！Vista以降のOSは同じJIS2004対応です（XPまではJIS90） ■ Windows XPまでは･･･ WindowsXPまでは、JIS X 0208（英数字、ひらがな、カタカナ他、第1水準・第2水準漢字を含む6879字）及びJIS X 0212（使用頻度の低い補助漢字で構成される5801字）に収録される文字を標準でサポート（標準フォントで表示可能）してきました。 JIS X 0208文字コード一覧（英数字、ひらがな、カタカナ他、第1・第2水準漢字を含むJIS基本漢字） JIS X 0212文字コード一覧（使用頻度の低い補助漢字） ■ Windows Vista/7/8/10は… → JISX0213 改定2004（JISX0213:2004）★通称JIS2004 Windows Vista以降のOSでサポートしている日本語コードセットはJIS2004で、JISX021

neumann 2013/06/20

リンク

「金融機関等コンピュータシステムの安全対策基準」（FISC 安全対策基準）に対する Azure の対応状況リストを公開 - MSDN Blogs

In Visual Studio 2022 17.10 Preview 2, we’ve introduced some UX updates and usability improvements to the Connection Manager. With these updates we provide a more seamless experience when connecting to remote systems and/or debugging failed connections. Please install the latest Preview to try it out. Read on to learn what the Connection ...

neumann 2013/06/13

リンク

Windows 2000のレジストリファイルはUnicode形式－＠IT

各国語版向けのソースコードを一本化するなど、国際化対応を一歩進めたWindows 2000では、レジストリエディタから出力されるレジストリ情報ファイル（.regファイル）の形式が従来のASCIIコード形式から、Unicode形式に変更された。Unicodeは、日本の漢字などを含む世界各国の文字を1つのコード体系で表現しようと考案されたもので、Windows 2000では、内部的な文字列処理をすべてUnicodeで統一している（APIには従来のASCIIコードを受け付けるものも残されているが、内部的にはUnicodeに変換して処理している）。周知のとおり、レジストリは、ハードウェア環境からソフトウェア環境まで、Windowsシステムに関するあらゆる情報を一元的に記録・管理しているもので、レジストリの情報はレジストリエディタ（regedit.exe）で表示、編集することができる。このレジ

neumann 2013/06/13

リンク

Windows API on C++

となります。グローバルなロケールを設定する場合、std::localeクラスのstaticメンバ関数のglobalを用いて設定します。 std::locale std::locale::global(const std::locale&); これにロケールクラスのインスタンスを引き渡します。ただし、このロケールが影響を与えるのは、これを実行した後で生成したインスタンスに対してだけです。たとえば、std::wcoutには影響を及ぼしません。そこで、std::basic_ostreamクラスの基底クラスであるstd::iosクラスのimbueメンバ関数を呼びましょう。 std::ios::imbue(const std::locale&); これにlocaleクラスのオブジェクトを渡せばいいです。 Cであれば、setlocale()関数によって設定します。これはプログラム全体に影響を

neumann 2013/06/13

charcode

リンク

Windows API on C++

〜A系の関数、構造体は引数にShift_jis文字列を受け取ります。〜W系の関数、構造体は引数にUnicode文字列を受け取ります。 NT系で〜A系の関数を呼び出すと、Unicodeへの変換が起こります。これがオーバーヘッドになるかどうかといえば微妙ですが、全くないとは思えません。次の節では、APIプログラミングではどのようになるのかを解説します。 2 APIプログラミングと文字列 VCなどのWindows環境のC++では、基本的に、Shift_jisをchar型で保持し、Unicodeをwchar_tで保持します。プログラムがUnicodeに対応することには、次のような利点があります。国際化に対応できる。 Shift_jisの範囲の文字(半角かな除く)であれば、2バイトの固定長であらわせる。しかしながら、charを使わなければならない場面もあると思います。具体的には… 9x

neumann 2013/06/13

charcode

リンク

転ばぬ先の文字コード入門（第4回）

矢沢　久雄今回は，Windowsアプリケーションを作成する場合に，文字コードをどのように取り扱えばよいかを説明します。Windowsアプリケーションは様々な開発ツールを使って作成できますが，ここでは主にVisual Basicを使います。Windowsは，現在，シフトJISコードからUnicodeへの転換期にありますが，プログラミングにも，それが如実に現れています。Visual BasicにもWindows自体にも，シフトJISコードとUnicodeの両方を取り扱う仕組みが提供されているのです。 ●Unicodeはプログラムで処理しやすい WindowsがシフトJISコードからUnicodeへの転換期にあるとは言っても，Windowsにおけるファイルの保存形式の主流は依然としてシフトJISコードのままです。もしもUnicodeでファイルを保存してしまうと，それを読み出せないアプリケーショ

neumann 2013/06/13

charcode

リンク

文字コード変換にWideCharToMultiByteやMultiByteToWideCharなんて使わない！(UsefullCode.net)

UsefullCode.net Visual Studio 2005/2008/2010やandroid SDK/NDKでの開発者向けに便利なソースコードを提供 This site provide you with useful source codes under 'USEFULLCODE license'. Windowsには文字コード変換用のAPI関数としてWideCharToMultiByteやMultiByteToWideCharがある。それぞれユニコード文字列をSHIFT-JISにしたり、SHIFT-JIS文字列をユニコードにしたりするときに用いるためのAPIだ。前回までにこれらの関数を用いたユニコード＜－＞SHIFT-JISの相互変換関数のソースコードを紹介した。しかし私自身、今までソフト開発をするときにWideCharToMultiByteやMultiByteToWide

neumann 2013/06/13

非ユニコード型であるCStringAに対してユニコード文字列をそのまま代入することもできる。このときに自動的にCStringAの内部でWideCharToMultiByteが呼び出されてユニコード文字列から非ユニコード文字列に変換されている。ATL用

charcode

リンク

７.２ ASCII の NUL と DEL の本来の意味 - 文字コードに関する覚え書きと実験

文字コードについて調べたことや実験したこと，テストプログラム，データファイルなどを随時掲載する予定です．ただし筆者の理解不足や誤解により誤りがあるかもしれませんので，ご利用は自己責任で．このページの主な更新は Blog でお知らせします．表示確認ブラウザ：FireFox 22.0，IE8．０．目次シフトJIS Shift_JIS と Windows-31J (CP932) の違いシフトJIS ２バイト文字の判定謎の検索ワード集 (シフトJIS編) 「Shift_JIS(SJIS，Windows-31J，CP932) ３バイト文字」「Shift_JIS(SJIS，Windows-31J，CP932) サロゲート(ペア)」「UTF-8 4バイト文字 Shift_JIS(SJIS，Windows-31J，CP932) 変換」「Unicode(UTF-8，UTF-16) か

neumann 2013/06/13

すごい、勉強になる。UTF-16 符号単位がサロゲートか否かを判定する．サロゲート・ペア ⇔ Unicode スカラ値変換 U+010000 ～ U+10FFFF (x xxyy yyyy zzzz zzww wwww)

リンク

UTF-8コード表(1)

UTF-8の仕組み UTF-8は１～４バイト(初期の定義では６バイトまで)の可変長コード Unicodeスカラ値, UTF-16を含め、詳しい説明は Unicode にあります。コードカテゴリ備考

neumann 2013/02/26

リンク

Shift JIS 2バイト目が0x5C等に成りうることによる問題 - Wikipedia

Shift_JIS（シフトジス）は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。シフトJIS（シフトジス）と表記されることもある[1]。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、1997年にJIS X 0208で標準化された。

neumann 2012/09/12

shift_jis 5c問題

charcode

リンク

ＣＧＩで特定の文字（表・予・申・能など）が文字化けする

・ＣＧＩで特定の文字（表・予・申・能など）が文字化けする自動バックアップ・テスサーバー付きの新機能スマートリリース CGIやPHPなどの技術系でSuper FAQ（よくある質問）がこれです。下記のような文字化けが発生します。文字化けしている漢字は「表」「予」「申」「能」「十」「ソ」などです。第１章の「Netscape4.Xのdocument.write時の文字化け」は音が「シ」のものに集中的に文字化けが見られるなど、顕著な規則性がありました。今回の文字化けは、「音」が似通っているという特色はありません。しかし、それぞれの漢字のShift_JISコードを調べてみると、ある規則性が浮かび上がってきます。Shift_JISコードを調べるには、序論で紹介したようなIMEやことえりの文字一覧表でもいいのですが、ここではURLエンコードを利用してみます。 URLエンコードは、プログラマーでない方

neumann 2012/09/10

5c問題。「ソ」をShift_JISの符号で表すと「835C」。この２バイト目の「5C」というのがPHP上でエスケープ文字として扱われるため、その後の " や ' がエスケープされ、エラー。WinとShift_JISとPHPの組み合わせ絶望的。

リンク

《Unicode/CJK統合漢字》漢字部首検索

Unicode/CJK統合漢字漢字部首検索

neumann 2012/08/28

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

charcodeに関するneumannのブックマーク (29)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス