タグ

charcodeに関するneumannのブックマーク (29)

  • JEF ‐ 通信用語の基礎知識

    は、従来の汎用機で使われていたEBCDICで、制御コードで必要に応じて日語の漢字面を切り替える。 1979(昭和54)年4月に富士通で開発された符号で、正式な名称を「富士通語情報システム」という。もって汎用機で英数字、カナ、漢字交じりの日語処理を可能とした。

  • 文字コード表 シフトJIS(Shift_JIS)

    シフトJISの1バイトコード(半角文字)のエリア 0x00~0x1f、0x7f は制御コードです 0x20~0x7e はASCII文字です 0xa1~0xdf は半角カタカナです シフトJISの2バイトコード(全角文字)のエリア(JIS X 0208の漢字エリア) 上位1バイト  0x81~0x9f、 0xe0~0xef 下位1バイト  0x40~0x7e、 0x80~0xfc ですが機種に依存しない観点より、HTMLで以下の水色エリアは使用しないのが無難です 水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです 0x8540~ 0x889e は機種依存文字の主なエリアです 0xeb40~ 0xeffc はMacOS では縦書用文字、Windows では特殊な外字エリアです 0xf040~ は外字エリアです(記載していません) perl

  • http://charset.7jp.net/jis.html

  • JIS X 0213コード表(全コード) - CyberLibrarian

    JIS X 0213(JIS拡張漢字)の表です。JIS X 0213:2004はすべてUnicodeに収録されており、数値文字参照で記述することができます。ただし、数値文字参照による記述部分はOSやブラウザのバージョンなどの環境によっては、文字化けする可能性があります。別表として、Unicode番号付きの表(5分割)も掲載しています。 1面(JIS X 0208および第3水準漢字) 面区 点 JIS SJIS EUC +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 1面1区 0 2120 813F A1A0

    neumann
    neumann 2013/07/22
    1面(JIS X 0208および第3水準漢字) 2面(第4水準漢字)
  • https://support.microsoft.com/ja-jp/help/170559

    すべての Microsoft 製品 Microsoft 365 Office Windows Surface Xbox セール サポート ソフトウェア Windows アプリ OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム 映画テレビ番組 法人向け Microsoft Azure Microsoft Dynamics 365 Microsoft 365 Microsoft Industry データ プラットフォーム Power Platform 法人向けを購入する Developer & IT .NET Visual Studi

    neumann
    neumann 2013/07/14
    Unicode との相互変換ができない文字のリストを次に掲載します。これは、容易に解決することができない既知の問題です。 このリストは、ケースバイケースの回避方法を提供します。
  • 416-1 | Unicodeに存在して、Shift-jisに存在しない文字の一覧はあるのでしょうか - VB初心者友の会 - 超初心者専用Q&A掲示板過去ログ

    > 魚*3の漢字は「全角」であるかどうかを判断したいのですが、 逆に質問です。 何の為に『「全角」であるかどうかを判断したい」』のでしょうか? そもそも、半角/全角が意味を成すのは、「ShiftーJISコードで扱う場合」だけだと思いますが・・・ 「Shift-jisに存在しない文字」に対して判定を行っても意味が無いのでは? > このような、Unicodeに存在して、Shift-jisに存在しない文字は、 > どうすればチェックできる(分かる)のでしょうか。 安直な手段でよければ、 「1度Shift−JISに変換してから、再度Unicodeに変換して、元の文字に戻るかどうか?」 と言う方法で判断できると思います。 P.S. #370に同じ内容の投稿が残っています。きちんと削除してください。 ここの運営ルールでは、再投稿が許されるのは、以前の投稿を削除した時だけです。 長文です。m(_ _)m

  • http://www.asahi-net.or.jp/~ax2s-kmtn/character/japan.html

    neumann
    neumann 2013/07/13
    JIS X 0201 ANK JIS X 0208 JIS基本漢字 JIS X 0212 JIS補助漢字 JIS X 0213 JIS拡張漢字
  • 新漢字則(JIS X 0213:2004)

    JIS X 0213:2004って何? コンピューターで文字を取り扱うには、文字に番号をつけて管理します(20年以上前では単なるグラフィックを描画していたものもありましたが)。通信の世界では文字を番号で送るほうが、グラフィックで送るよりはるかに少ないデータ量ですみます。はるか昔の300BPS(1秒間に300ビット、漢字換算でおおよそ1秒間に15文字の送受信)の頃に誰も文字をグラフィックで送受信しようなんて考えませんよね。それに文字を番号で管理すると、データベースへの蓄積・参照・検索が容易になります。アウトラインフォントも番号で管理しているからできるのです。アメリカで生まれたコンピューターではEBCDICやASCIIという管理方法(コード体系)が使われていました。日ではラテン系文字(いわゆるアルファベット)に比べはるかに文字数が増えます。そこでASCIIコードの各国拡張領域($80-$FF

    neumann
    neumann 2013/07/13
    第1・2水準 第3・4水準
  • Windows Vista/7/8/10:日本語入力環境について(JIS2004とは)-教えて!HELPDESK

    ポイント!Vista以降のOSは同じJIS2004対応です(XPまではJIS90) ■ Windows XPまでは・・・ WindowsXPまでは、JIS X 0208( 英数字、ひらがな、カタカナ他、第1水準・第2水準漢字を含む6879字)及びJIS X 0212(使用頻度の低い補助漢字で構成される5801字)に収録される文字を標準でサポート(標準フォントで表示可能)してきました。 JIS X 0208文字コード一覧(英数字、ひらがな、カタカナ他、第1・第2水準漢字を含むJIS基漢字) JIS X 0212文字コード一覧(使用頻度の低い補助漢字) ■ Windows Vista/7/8/10は… → JISX0213 改定2004(JISX0213:2004)★通称JIS2004 Windows Vista以降のOSでサポートしている日語コードセットはJIS2004で、JISX021

  • 「金融機関等コンピュータシステムの安全対策基準」(FISC 安全対策基準)に対する Azure の対応状況リストを公開 - MSDN Blogs

    In Visual Studio 2022 17.10 Preview 2, we’ve introduced some UX updates and usability improvements to the Connection Manager. With these updates we provide a more seamless experience when connecting to remote systems and/or debugging failed connections. Please install the latest Preview to try it out. Read on to learn what the Connection ...

    「金融機関等コンピュータシステムの安全対策基準」(FISC 安全対策基準)に対する Azure の対応状況リストを公開 - MSDN Blogs
  • Windows 2000のレジストリ ファイルはUnicode形式 - @IT

    各国語版向けのソースコードを一化するなど、国際化対応を一歩進めたWindows 2000では、レジストリ エディタから出力されるレジストリ情報ファイル(.regファイル)の形式が従来のASCIIコード形式から、Unicode形式に変更された。Unicodeは、日の漢字などを含む世界各国の文字を1つのコード体系で表現しようと考案されたもので、Windows 2000では、内部的な文字列処理をすべてUnicodeで統一している(APIには従来のASCIIコードを受け付けるものも残されているが、内部的にはUnicodeに変換して処理している)。 周知のとおり、レジストリは、ハードウェア環境からソフトウェア環境まで、Windowsシステムに関するあらゆる情報を一元的に記録・管理しているもので、レジストリの情報はレジストリ エディタ(regedit.exe)で表示、編集することができる。このレジ

  • Windows API on C++

    となります。グローバルなロケールを設定する場合、std::localeクラスのstaticメンバ関数のglobalを用いて設定します。 std::locale std::locale::global(const std::locale&); これにロケールクラスのインスタンスを引き渡します。ただし、このロケールが影響を与えるのは、これを実行した後で生成したインスタンスに対してだけです。 たとえば、std::wcoutには影響を及ぼしません。そこで、std::basic_ostreamクラスの基底クラスであるstd::iosクラスのimbueメンバ関数を呼びましょう。 std::ios::imbue(const std::locale&); これにlocaleクラスのオブジェクトを渡せばいいです。 Cであれば、setlocale()関数によって設定します。これはプログラム全体に影響を

  • Windows API on C++

    〜A系の関数、構造体は引数にShift_jis文字列を受け取ります。〜W系の関数、構造体は引数にUnicode文字列を受け取ります。 NT系で〜A系の関数を呼び出すと、Unicodeへの変換が起こります。これがオーバーヘッドになるかどうかといえば微妙ですが、全くないとは思えません。 次の節では、APIプログラミングではどのようになるのかを解説します。 2 APIプログラミングと文字列 VCなどのWindows環境のC++では、基的に、Shift_jisをchar型で保持し、Unicodeをwchar_tで保持します。 プログラムがUnicodeに対応することには、次のような利点があります。 国際化に対応できる。 Shift_jisの範囲の文字(半角かな除く)であれば、2バイトの固定長であらわせる。 しかしながら、charを使わなければならない場面もあると思います。具体的には… 9x

  • 転ばぬ先の文字コード入門(第4回)

    矢沢 久雄 今回は,Windowsアプリケーションを作成する場合に,文字コードをどのように取り扱えばよいかを説明します。Windowsアプリケーションは様々な開発ツールを使って作成できますが,ここでは主にVisual Basicを使います。Windowsは,現在,シフトJISコードからUnicodeへの転換期にありますが,プログラミングにも,それが如実に現れています。Visual BasicにもWindows自体にも,シフトJISコードとUnicodeの両方を取り扱う仕組みが提供されているのです。 ●Unicodeはプログラムで処理しやすい WindowsがシフトJISコードからUnicodeへの転換期にあるとは言っても,Windowsにおけるファイルの保存形式の主流は依然としてシフトJISコードのままです。もしもUnicodeでファイルを保存してしまうと,それを読み出せないアプリケーショ

    転ばぬ先の文字コード入門(第4回)
  • 文字コード変換にWideCharToMultiByteやMultiByteToWideCharなんて使わない!(UsefullCode.net)

    UsefullCode.net Visual Studio 2005/2008/2010やandroid SDK/NDKでの開発者向けに便利なソースコードを提供 This site provide you with useful source codes under 'USEFULLCODE license'. Windowsには文字コード変換用のAPI関数としてWideCharToMultiByteやMultiByteToWideCharがある。それぞれユニコード文字列をSHIFT-JISにしたり、SHIFT-JIS文字列をユニコードにしたりするときに用いるためのAPIだ。 前回までにこれらの関数を用いたユニコード<->SHIFT-JISの相互変換関数のソースコードを紹介した。しかし私自身、今までソフト開発をするときにWideCharToMultiByteやMultiByteToWide

    neumann
    neumann 2013/06/13
    非ユニコード型であるCStringAに対してユニコード文字列をそのまま代入することもできる。このときに自動的にCStringAの内部でWideCharToMultiByteが呼び出されてユニコード文字列から非ユニコード文字列に変換されている。ATL用
  • 7.2 ASCII の NUL と DEL の本来の意味 - 文字コードに関する覚え書きと実験

    文字コードについて調べたことや実験したこと, テストプログラム,データファイルなどを随時掲載する予定です. ただし筆者の理解不足や誤解により誤りがあるかもしれませんので, ご利用は自己責任で. このページの主な更新は Blog でお知らせします. 表示確認ブラウザ:FireFox 22.0,IE8. 0.目次 シフトJIS Shift_JIS と Windows-31J (CP932) の違い シフトJIS 2バイト文字の判定 謎の検索ワード集 (シフトJIS編) 「Shift_JIS(SJIS,Windows-31J,CP932) 3バイト文字」 「Shift_JIS(SJIS,Windows-31J,CP932) サロゲート(ペア)」 「UTF-8 4バイト文字 Shift_JIS(SJIS,Windows-31J,CP932) 変換」 「Unicode(UTF-8,UTF-16) か

    7.2 ASCII の NUL と DEL の本来の意味 - 文字コードに関する覚え書きと実験
    neumann
    neumann 2013/06/13
    すごい、勉強になる。UTF-16 符号単位がサロゲートか否かを判定する. サロゲート・ペア ⇔ Unicode スカラ値変換 U+010000 ~ U+10FFFF (x xxyy yyyy zzzz zzww wwww)
  • UTF-8コード表(1)

    UTF-8の仕組み UTF-8は1~4バイト(初期の定義では6バイトまで)の可変長コード Unicodeスカラ値, UTF-16を含め、詳しい説明は Unicode にあります。 コード カテゴリ 備考

  • Shift JIS 2バイト目が0x5C等に成りうることによる問題 - Wikipedia

    Shift_JIS(シフトジス)は、コンピュータ上で日語を含む文字列を表現するために用いられる文字コードの一つ。シフトJIS(シフトジス)と表記されることもある[1]。 かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、1997年にJIS X 0208で標準化された。

    neumann
    neumann 2012/09/12
    shift_jis 5c問題
  • CGIで特定の文字(表・予・申・能など)が文字化けする

    ・CGIで特定の文字(表・予・申・能など)が文字化けする 自動バックアップ・テスサーバー付きの新機能スマートリリース CGIやPHPなどの技術系でSuper FAQ(よくある質問)がこれです。下記のような文字化けが発生します。 文字化けしている漢字は「表」「予」「申」「能」「十」「ソ」などです。第1章の「Netscape4.Xのdocument.write時の文字化け」は音が「シ」のものに集中的に文字化けが見られるなど、顕著な規則性がありました。今回の文字化けは、「音」が似通っているという特色はありません。 しかし、それぞれの漢字のShift_JISコードを調べてみると、ある規則性が浮かび上がってきます。Shift_JISコードを調べるには、序論で紹介したようなIMEやことえりの文字一覧表でもいいのですが、ここではURLエンコードを利用してみます。 URLエンコードは、プログラマーでない方

    neumann
    neumann 2012/09/10
    5c問題。「ソ」をShift_JISの符号で表すと「835C」。この2バイト目の「5C」というのがPHP上でエスケープ文字として扱われるため、その後の " や ' がエスケープされ、エラー。WinとShift_JISとPHPの組み合わせ絶望的。
  • 《Unicode/CJK統合漢字》漢字部首検索

    Unicode/CJK統合漢字 漢字部首検索