並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 52件

新着順 人気順

シフトJISの検索結果1 - 40 件 / 52件

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

      新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
    • シフトJISを使い続ける上場企業をまとめてみた - megamouthの葬列

      srad.jp こういうニュースがあった。世界のWebサイトの90%がutf-8を使用している、という。 昔、シフトJISでエンコードされたPHPファイルを編集させられた時、「表示」が表示できず(文字通りの意味である)バイナリリテラルを書いていたことを思い出す。 文字コード断絶の歴史を乗り越え、世界はようやくUnicodeの元に集結したのである。 日本の上場企業のcharset指定状況 さて、美しいニッポンである我が国はどうであろうか、 www.pathfindergate.com 私は上記のサイトより早速日本の上場企業のHPのリストをダウンロードさせていただくと、さらっとクローラーを書いてHTTPヘッダのcharsetとmetaタグのcharset、ついでにDOCTYPE宣言を集計することにした。 というのは実は嘘で、去年の12月頃にクローラーは出来上がっていたのだ。この記事が出る前にと

        シフトJISを使い続ける上場企業をまとめてみた - megamouthの葬列
      • シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories

        2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。 おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。 変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。 変換表に求めら

        • 【山田祥平のRe:config.sys】さよならシフトJIS、主なしとて春な忘れそ - PC Watch

            【山田祥平のRe:config.sys】さよならシフトJIS、主なしとて春な忘れそ - PC Watch
          • 文字コード表 シフトJIS(Shift_JIS)

            シフトJISの1バイトコード(半角文字)のエリア 0x00~0x1f、0x7f は制御コードです 0x20~0x7e はASCII文字です 0xa1~0xdf は半角カタカナです シフトJISの2バイトコード(全角文字)のエリア(JIS X 0208の漢字エリア) 上位1バイト  0x81~0x9f、 0xe0~0xef 下位1バイト  0x40~0x7e、 0x80~0xfc ですが機種に依存しない観点より、HTMLで以下の水色エリアは使用しないのが無難です 水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです 0x8540~ 0x889e は機種依存文字の主なエリアです 0xeb40~ 0xeffc はMacOS では縦書用文字、Windows では特殊な外字エリアです 0xf040~ は外字エリアです(記載していません) perlで

            • シフトJISの闇を訪ねる旅

              小形克宏 @ogwata 相変わらずシフトJISについて調べているわけだが、先日の文字の学校で狩野さんから「『CJKV』第2版ではシフトJIS関連がばっさり削られているんですよね」との情報を得て、ひょっとしたらと一番最初の版『日本語情報処理』(1995年、ソフトバンク)を見てみたら、これが一番詳しい! 2013-05-23 22:08:51 小形克宏 @ogwata さすが1995年の本だけあって、ベンダーごとの実装差は必要不可欠。新しい版が出たらかといって、古い版を捨てなくてよかった…と書いたところで、Facebook経由で安岡さん曰く「でもミスも多い!」だそうです。しょぼん。 2013-05-23 22:12:38 小形克宏 @ogwata そうか、EPSONの98互換機は単純にJIS83だと思っていたけど、符号化文字集合としては78JISにJIS83の追加分を加え、レパートリにJIS

                シフトJISの闇を訪ねる旅
              • シフトJISを捨てられるか? - 記者のつぶやき:ITpro

                これまで,Windows Vistaの文字の扱いに関する事柄を何度か取り上げてきた。同じキャラクタ・コードで,Windows XPのときと文字の形が変わったり,Unicodeでしか扱えない文字があったりするという話題だ。今回は,エンコーディングについて考えてみたい。 これまでの記事でも書いてきたが,文字処理とエンコーディングに関する問題は,何もWindows Vistaに始まったわけではない。Windows XPやWindows 2000など,既存のWindowsでも同様だ。例えば,「鴎」の旧字である「シナカモメ」は,Unicodeでしか扱えない文字だが,Windows XP以前のMS-IMEでも入力できる。石鹸の「鹸」の旧字もそうである。これらの文字を扱うには,アプリケーション・ソフトが,文字列をUnicodeで処理しなればならない。シフトJISに変換した瞬間に,文字情報が無くなってしま

                  シフトJISを捨てられるか? - 記者のつぶやき:ITpro
                • 知っておきたい! 文字コードの基礎知識 ……ASCII,シフトJIS,Unicode etc.:新刊ピックアップ

                  書籍案内 » 新刊ピックアップ » 知っておきたい! 文字コードの基礎知識 ……ASCII,シフトJIS,Unicode etc. 『⁠[⁠改訂新版]プログラマのための文字コード技術入門』 ソフトウェアと文字コード ソフトウェアのエンジニア・開発者であれば,文字コードというものについて大なり小なり触れたことがあることでしょう。ソフトウェアを開発したり運用したりする上では必要になる知識です。ASCIIやシフトJIS,Unicode,UTF-8といったものがよく知られています。プログラマは,プログラムを書くたびに文字列処理という形で文字コードのデータを操作しています。 また,開発に携わらない場合でも,幅広いユーザーが文字コードを意識する機会はあります。たとえば,ソフトウェアの設定ファイルをテキストエディタで編集するときにどの文字コードで保存するかといったことや,通信ソフトウェアの送受信を指定す

                    知っておきたい! 文字コードの基礎知識 ……ASCII,シフトJIS,Unicode etc.:新刊ピックアップ
                  • シフトJISの拡張文字

                    JISコードの区点では、9~15区と85~94区を未定義とされてゐる。然し、シフトJISでは、13区と89~92区と115~119区の部分に対し独自に漢字などの文字の割当てを行つてゐる。 此処では、この件についてunicode(utf-8)と絡めて説明し、併せて正漢字の使用についての留意点を纏めておきたい。 本論 「拡張文字」の一覧表 13区(0x8740~0x879E) ①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ・㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡・・・・・・・・㍻〝〟№㏍℡㊤㊥㊦㊧㊨㈱㈲㈹㍾㍽㍼≒≡∫∮∑√⊥∠∟⊿∵∩∪・・ 89区(0xED40~0xED9E) 纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖侒侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝﨎咜咊咩哿喆坙坥垬埈埇﨏塚增墲夋奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧嵓﨑嵂嵭嶸嶹巐弡弴彧德 90区

                    • 80〜90年代のシフトJISの諸方言について

                      日本のPCの黎明期には、各社がシフトJISにベンダ外字セットを独自に付け加えていたものでした。ついこの間のことだと思っていたら、今それらの機種依存文字の詳細を調べようと思うとなかなか骨なようです。

                        80〜90年代のシフトJISの諸方言について
                      • 文字コードについて(シフトJISの問題)

                        文字コードをシフトJISで開発し、Windowsのサーバで動かす場合の文字コード問題について示します。 厳密にいうとWindowsが扱う文字コードは、シフトJISでは、ありません。MS932です。または、コードページ CP932ともいいます。MS932は、マ社がシフトJISを拡張して定義したコード体系です。 で、ここで何が問題になるかというと、クライアントへの出力をcharset="Shift_JIS"とか定義して、アプリケーションサーバーなど が一生懸命シフトJISで出力しようとすると、ある文字列が文字化けするのです。ようは、MS932にある文字コードはシフトJISには、ないので、'? 'で出力されるということです。なお、OC4JやJBuilderで利用するtomcatは、MS932で出力しようとするので、あんまり文字化けしませ ん。 Java内部で扱う文字コードは、Unicodeです。

                        • みんな忘れてるけど「文字コードというものにはシフトJISとUTF-8などがある」ということを知ってるだけでも世間一般からすればIT専門家である

                          嶋田大貴 @shimariso みんな忘れてるけど、「テキストファイルという種類のファイルがあって、その中で使われる文字コードというものにはシフトJISとUTF-8などがある」ということを知ってるだけでも世間一般からすればIT専門家ですよ。 2024-04-02 12:42:01

                            みんな忘れてるけど「文字コードというものにはシフトJISとUTF-8などがある」ということを知ってるだけでも世間一般からすればIT専門家である
                          • シフトJISを残すべきか? : 404 Blog Not Found

                            2007年03月10日23:30 カテゴリCode シフトJISを残すべきか? Matzさん経由で知ったのだが、これはひどい。 シフトJISを捨てられるか?:ITpro では,今までのデファクトだったシフトJISはどうだろうか。シフトJISを使うと,(英文混じりの)日本語を表現する場合,そのデータ長はUTF-8/16/32に比べて短くなる。コンピュータを取り巻く通信環境は高速になり,ストレージは大容量化してきたとはいえ,データ長は短いに越したことはない。確かに、シフトJISで表現できるテキストをUTF-8で表現すると、最高で1.5倍になる(ただしここで言うシフトJISは、Shift_JISX0213は含まない)。しかし、テキストデータというのは圧縮率が高い。 未圧縮gzipbzip2 シフトJIS4,6822,2542,225 UTF-86,7672,5262,325 UTF-8/SJIS

                              シフトJISを残すべきか? : 404 Blog Not Found
                            • MySQLのデータをシフトJISからUTF-8に変換した際の記録 - sanonosa システム管理コラム集

                              今回のエントリーは、先日Shift JISで作っていたデータを多言語対応にすべくUNICODEに変換しようとしたとき苦労した際の記録です。 今回対象としたのは、MySQLからdumpした100MB近くあるデータです。 【一通りの手順】 まずMySQLからデータをdumpします。 % mysqldump [database name] > dump.sql 次にdump.sqlをmoreしてみると「DEFAULT CHARSET=sjis」という記述があるのでこれをutf8に変更します。 % perl -p -w -e 's/sjis/utf8/g' dump.sql > dump2.sql ただいくらDEFAULT CHARSETをutf8に変えても実際のデータがシフトJISなので、データ自体もUTF-8に変えます。 % iconv -c -f shift_jis -t utf-8 dum

                                MySQLのデータをシフトJISからUTF-8に変換した際の記録 - sanonosa システム管理コラム集
                              • HttpClientクラスでシフトJISのWebページを取得するには?[C#、VB]

                                .NET Framework 4.5で新設されたHttpClientクラス(System.Net.Http名前空間)のGetStringAsyncメソッドを使うと、簡単にWebページの内容を文字列として取得できる。しかし、文字コードにシフトJISを使っているWebサイトでは文字化けしてしまう。どうすれば文字化けさせることなく取得できるだろうか? 本稿では、そのような文字化けが発生する条件を説明し、そんな場合にWebページの内容を文字列として取得する方法を解説する。 文字化けが発生する条件 HttpClientクラスのGetStringAsyncメソッドを使ってWebページの内容を文字列として取得する方法は、「.NET TIPS:HttpClientクラスでWebページを取得するには?[C#、VB]」で紹介した(そのコードを、以降では「以前のコード」と呼ぶ)。なお、その記事で解説していること

                                  HttpClientクラスでシフトJISのWebページを取得するには?[C#、VB]
                                • シフトJIS漢字コード

                                  シフト JIS 漢字コードは、 パソコン内部で使用されている文字コードで、 JIS 漢字コード (JIS X0208) を移動 (シフト) させたものです。 シフト JIS 漢字コードとは何か、 また、 JIS 漢字コード (JIS X0208) があるにもかかわらず、 パソコンの内部ではなぜ 「シフト JIS 漢字コード」 が使われているのか、 といったことについて考えてみます。 下図の大きい正方形は、第1バイトを縦軸に、第2バイトを横軸にとって、 それぞれ 256×256 =65,536 種類の文字を表わすことができる、文字コード表です。 JIS 漢字コードは、 このうち 第 1、 第 2 バイトとも 16 進数表記で 21~7E の範囲内の、 下図左上の小さい正方形の中に納められています (94×94 = 8,836 文字を表すことができます)。 シフト JIS 漢字コードは、これを

                                  • 古川 享 ブログ: シフトJISの産まれた歴史的背景

                                    You are about to permanently delete this entry. When you delete an entry, you also delete any comments and trackbacks associated with it. This action cannot be undone. Delete|Cancel 20005年の11月14日付けの本ブログで、「私のマイコン遍歴、日本のパソコン30年史、その1」というエントリをしております。その中で記載されている、当時シフトJISの開発に関わった中心人物の山下良蔵さんから詳細なコメントを投稿いただきました。日本のパソコン史の残しておかなければならない重要な史実をまさしく当事者からコメントを頂いたので...歴史の隙間が完全に埋まったようで、私もとてもスッキリしました。 頂いたコメントに、私からコメ

                                    • [Java] シフトJISの扱い - Qiita

                                      目的 Java における SJIS と MS932 の相違点と、扱う際の注意点をまとめます。 SJIS/MS932 での値を 0xHHHH 形式で表記していますが、1バイト目が上位、2バイト目が下位、つまり big endian (network byte order)です。 いわゆるシフトJIS いわゆる「シフトJIS」には何種類もありますが、主なものは以下の2つだと思います。 SJIS (Shift_JIS) Microsoft が作成したシフトJIS符号化法を、JIS X 0208 に取り込んだもの。 扱える文字集合は当時のJIS漢字(JIS X 0201/0208)の範囲のみ MS932 (Windows-31J) Microsoftは、日本語用の文字セットをコードページ932として管理しており、MS-DOS時代には各OEMベンダーでコードページの独自拡張を許可していた。 しかしW

                                        [Java] シフトJISの扱い - Qiita
                                      • 第3回 避けられない問題! Unicode とシフトJIS の折り合いをどう付けるか?:ITpro

                                        1964年4月生まれの東京出身。東京農工大化学工学科を卒業後,マイクロソフトでMicrosoft Windows 2.1~3.0の日本語化に従事。現在はピーデー 代表取締役。日本XMLユーザーグループ代表。Microsoft Most Valuable Professional(MVP)。 Windows 95の最大の被害者は誰か? 本題に入る前に,長々と余談を書いてみよう。Windows 95がいかに多くの禍根を残し,それが今日の私達にも面倒を残したという話題である。そして,今回の本題のような問題が,なぜ深刻な問題として我々の身に降りかかったのか…という理由についての話である。それゆえに解決策を考える際に,少しは役に立つだろう。 さて,話を始めよう。 パソコンで漢字を扱いたいというニーズは根強く,ごく初期の8ビット・パソコンの時代にすでにいわゆるJIS第1水準,第2水準(JIS X 02

                                          第3回 避けられない問題! Unicode とシフトJIS の折り合いをどう付けるか?:ITpro
                                        • .NET TIPS 文字列をシフトJISとしてバイト列に変換するには? - C# - @IT

                                          .NET Frameworkでは、文字列はすべてUnicode文字の並びとして処理される。しかし日本語を扱うアプリケーションやシステムでは、文字列データの文字コード体系としてUnicode以外(シフトJISやEUC-JPなど)を使用しているものが少なくない。このようなシステムとデータをやりとりする場合、プログラムで処理したUnicode文字列をシフトJIS文字列などに変換し、それをバイト列(byte型データの配列)として扱う必要が生じることがある。 このような文字コードの変換を行う場合には、Encodingクラス(System.Text名前空間)を利用する。このクラスには、文字列をバイト列に変換する(エンコードする)ためのGetBytesメソッドが用意されている。 ただし、Encodingクラスは正確には抽象クラスであり、そのサブクラスとしては、7ビットASCII、Unicode(2個の連

                                          • シフトJIS X 0213文字一覧 8140-8FFF

                                            シフトJIS X 0213文字一覧 (1/4) 8040-8FFF  9040-9FFF  E040-EFFF  F040-FCFF 新漢字則(JIS X 0213:2004)に戻る トップに戻る

                                            • Unicode と JIS / EUC / シフトJIS 間の変換 - by AOK

                                              AOK's JavaScript Library IE6.0 (Win2000) で動作確認しています。 /********************************************************************** * * Unicode <-> JIS / EUC / Shift JIS * * Copyright (c) 2005 AOK <soft@aokura.com> * **********************************************************************/ var jis_table = " 、。,.・:;?!゛゜´`¨^ ̄_ヽヾゝゞ〃仝々〆〇ー―‐/\〜‖|…‥‘’“”()〔〕[]{}〈〉《》「」『』【】+−±×÷=≠<>≦≧∞∴♂♀°′″℃¥$¢£%#&*@§☆★○●◎◇◆□■△▲▽

                                              • シフトJISのデータを読み取るには?[WP 8]

                                                Windows Phone 8では、Win32 APIを利用してシフトJISのバイト列データをUnicode文字列に変換できるようになった。本TIPSでは、その実装方法を説明する。 連載目次 前回、Windows Phone 8(以降、WP 8)では「GetEncoding("Shift-JIS")」というコードが動かず、シフトJISのデータを読み取れないと書いた。WP 7.xまでは実際にどうしようもなく、シフトJISでエンコードされたデータを読み取るには自前で変換テーブルを実装するしかなかった。だが、WP 8からはWin32 APIを利用してシフトJISのデータをUnicodeに変換することが可能になっている。本稿では、WP 8でWin32 APIを使う方法と、シフトJISをUnicodeに変換するコードを紹介する。本稿のサンプルは「Windows Store app samples:M

                                                  シフトJISのデータを読み取るには?[WP 8]
                                                • シフトJISが符号化文字集合? - yanok.net

                                                  文字コードに関して、符号化文字集合と文字符号化方式という区別がいわれることがあります。拙著『プログラマのための文字コード技術入門』でもその分類に従っています。 この区分によると、JIS X 0208やJIS X 0213は符号化文字集合で、シフトJISは文字符号化方式だということになります。 ところが、混乱させることをいうようですが、JIS X 0208:1997では、シフトJISは符号化文字集合だと書かれています。ウソだと思うなら、JIS X 0208:1997の附属書1を見てみると良いでしょう。 これはどういうことでしょう。シフトJISが文字符号化方式だというのが間違っているのでしょうか、それとも97JISの記述が間違っているのでしょうか? 結論をいってしまうと、これは単に用語法の問題ということになります。 そもそも、「符号化文字集合と文字符号化方式」という区分はISOやJISといった

                                                  • 「シフトJIS」では対応不可能な新常用漢字表 | yasuokaの日記 | スラド

                                                    今日発売された『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、早速、文化審議会国語分科会に陳情したいのだがどうしたらいいのか、という質問が複数あった。本文中の どうしても「𠮟」がサポートできそうにないなら、その旨を文化審議会国語分科会に陳情する、という手も残されている。新しい常用漢字表は改正案の段階であり、2009年12月24日までは一般からのコメント(パブリックコメント)を受け付けているからだ。「𠮟」ではなく「叱」を常用漢字にしてほしい、あるいは、「𠮟」の「許容字体」として「叱」を認めてほしい、と陳情するのだ。 に呼応したものだ。とりあえず、パブリックコメントのページをお教えしたが、うーむ、本文中にURLかメールアドレス(kanzihyo@bunka.go.jp)く

                                                    • Linux版Oracle 11g XE 文字コードをシフトJISに変更

                                                      Oracle 11g XEのキャラクタセットはUTF-8ですが、古いシステムだとシフトJISで使用しているところがあります。 今まで2回だけOracleを使用しているところでの仕事がありましたが、どちらもシフトJISでした。 そのため、データベースのキャラクタセットをシフトJISに変更してみます。 ただし、無料版は同時にインスタンスが1つしか使えないため、デフォルトのデータベースとの共存ができないそうです。 そこで、一旦UTF-8のデータベースを削除して、シフトJISに変更したデータベースを作成します。 データベース削除前の準備 自分でpfileを作成できる人は必要ないですが、Oracleが良く分かってない場合は デフォルトのspfileからpfileを作成するのが簡単かと思います。 そのためデータベースを削除する前に、デフォルトのspfileからinitXE.oraを作成しておきます。

                                                      • 日本語 (シフト JIS) - CP932 - 文字コード表

                                                        「日本語 (シフト JIS) - CP932 - 文字コード表」の文字コード表です

                                                          日本語 (シフト JIS) - CP932 - 文字コード表
                                                        • Shift_JISとかShift-JISとかShift JISとかシフトJISとか

                                                          これにつまずいてしまったので、ざっと触れておきます。 アンダーバー付き「Shift_JIS」は IANA の character set の登録名です。 で、character set という言葉から「Shift_JIS は符号化文字集合」とつい思ってしまいますが、それは完全に間違いです。IANA の character set は符号化文字集...Shift_JISとかShift-JISとかShift JISとかシフトJISとか これにつまずいてしまったので、ざっと触れておきます。 アンダーバー付き「Shift_JIS」は IANA の character set の登録名です。 で、character set という言葉から「Shift_JIS は符号化文字集合」とつい思ってしまいますが、それは完全に間違いです。IANA の character set は符号化文字集合と文字符号化方式

                                                          • シフトJISのテキストファイルをUTF-8に変換するバッチ - シーゴの Excel 研究室

                                                            今回の記事では、テキストファイルのエンコーディングを、シフト JIS から BOM あり/なしの UTF-8 に変換するバッチプログラムを紹介します。 内容が Excel から少し離れますが、次の記事で CSV ファイルの文字化け問題を取り上げる予定で、それに関連して Windows でのテキストエンコーディングの話題を本記事として切り離し、先行公開するものです。 【本記事のバッチは非推奨です】 改善された最新版の UTF-8 変換バッチを公開しました。 本記事のバッチは非推奨とさせていただきます。 本記事の一部バッチにあった不具合を解消したうえ、信頼性、使い勝手もよくなっていますので、今後はこちらのご利用をよろしくお願いいたします。 www.shegolab.jp 【更新 2018/05/12】 バッチプログラムを一部修正しました。Windows 10 の UTF-8 サポートへの対応で

                                                              シフトJISのテキストファイルをUTF-8に変換するバッチ - シーゴの Excel 研究室
                                                            • 【改良版】シフトJISをUTF-8に変換するバッチ - シーゴの Excel 研究室

                                                              以前の記事で公開した「シフトJIS⇒UTF-8変換」バッチを改良しましたので再度公開します。 バッチを書き直しました 【本記事のバッチは非推奨です】 本記事のあとにさらに改善された UTF-8 変換バッチを公開しました。 本記事の一部バッチにあった不具合を解消したうえ、信頼性、使い勝手もよくなっていますので、今後はこちらのご利用をよろしくお願いいたします。 www.shegolab.jp 以前、当ブログの記事で「シフトJIS⇒UTF-8変換」バッチを紹介しました。 シフトJISのテキストファイルをUTF-8に変換するバッチ - シーゴの Excel 研究室 実はこのバッチ、入力ファイル名に半角カッコ「()」など特定の記号が含まれていると、そのファイルを処理できない問題があることが最近判明しました。これは Winodow バッチの限界に起因する問題で手の打ちようがなく、困っていました。 そん

                                                                【改良版】シフトJISをUTF-8に変換するバッチ - シーゴの Excel 研究室
                                                              • シフトJIS(Shift_JIS)コード の漢字文字(2バイトコード)

                                                                太陽光発電状況リアルタイム表示 [日本語文字コード] シフトJIS(Shift_JIS)コード の漢字文字(2バイトコード) JIS X 0208 (1990) to Unicode 漢字コード表に存在する(区点コードの)区を区単位で集めました、水色エリアは存在しないコードです 01区 シフトJIS(Shift_JIS)コード表 8140814181428143814481458146814781488149814a814b814c814d814e814f 、。,.・:;?!゛゜´`¨^ 8150815181528153815481558156815781588159815a815b815c815d815e815f  ̄_ヽヾゝゞ〃仝々〆〇ー―‐/\ 8160816181628163816481658166816781688169816a816b816c816d816e816f ~∥|…‥‘

                                                                • シフトJIS漢字コード表 - とほほのWWW入門

                                                                  #!/usr/local/bin/perl print <<END_OF_DATA; <style> th { background-color: #c0c0c0; } td { text-align: center; } td.x { background-color: #ffcccc; } </style> END_OF_DATA print "<table border=1 bordercolor=\"#999999\""; print " bordercolordark=\"#ffffff\" cellspacing=0 cellpadding=2>\n"; print "<tr bgcolor=\"#c0c0c0\"><th><br></th>"; for ($c4 = 0; $c4 < 16; $c4++) { printf("<th>%02x</th>", $c4); } p

                                                                  • シフトJISを発明したのは誰か? - もじのなまえ

                                                                    今はマイクロソフトを退社された古川享さんが、精力的にブログを更新しておられる。あるコメントに僕が「古川さんはシフトJISの発祥についてごぞんじありませんか」と質問を書いたところ、ありがたいことに詳細なご返答をいただいた。 http://spaces.msn.com/members/furukawablog/Blog/cns!1pmWgsL289nm7Shn7cS0jHzA!2225.entry#comment うーん、うまくクリッカブルにならないなあ(おしえて!はてな)。上記文字列をコピペして読んでください。 中で僕がつまらない勇み足をしていたりして恥ずかしいのだが、ともあれ、これは非常に貴重な証言なのではないかと思う。シフトJISのあの巧妙なマッピングを考案したのは、アスキーの山下良蔵さんであるようだ。ググってみると山下さんは少なくとも2002年まではアスキーに在籍しておられる様子。 証

                                                                      シフトJISを発明したのは誰か? - もじのなまえ
                                                                    • 安岡孝一の日記: シフトJISの誕生

                                                                      清水哲郎の「シフトJIS」って何のためにあるの?(キャリア・ラボIT「文字コードで世界に出る」, 第11回, 2005年11月)を読みながら思ったのだが、「シフトJIS」誕生の過程はあまりに知られていない。特に Windowsの前身にあたるMS-DOS開発時にマイクロソフト社などによって考え出されたのが「JIS漢字のコード領域をごっそり1バイト文字の領域と重ならないコード領域にズラしてしまえ」という方法、すなわち「シフトJISコード」でした という誤解を非常に多く見かけるので、「シフトJIS」誕生に関して私が知る限りのことを、ここに記しておこうと思う。 「シフトJIS」を最初に採用したのは、三菱電機『MULTI 16』搭載の『日本語CP/M-86』で、1982年4月20日出荷開始(この時点の『日本語CP/M-86』は暫定版)である。この『日本語CP/M-86』を開発したのは、マイクロソフト

                                                                      • シフトJISの『tr』によるひらがな→カタカナ変換は要注意(0x837Fに割り当てないよ〜) - smilerubyのブログ

                                                                        知らなかった・・・ 【シフトJIS】 ひらがな:[ぁ-ん]([0x829F-0x82F1]) カタカナ:[ァ-ン]([0x8340-0x8393])、[ヴ-ヶ](0x8394-0x8396) 文字コード数比較: # -*- coding: Windows-31J -*- ## ひらがな文字数[ぁ-ん] 0x82F1 - 0x829F # => 82 ## カタカナ文字数[ァ-ン] 0x8393 - 0x8340 # => 83 カタカナの方が文字コード数が多い(>_<) 調べてみると0x837Fに割り当てがないんです!コレは気が付かないって。 気が付かないまま何をしていたかというと・・・ ひらがな→カタカナ変換: # -*- coding: Windows-31J -*- puts %w[にしとうきょう ひがしくるめ ひがしむらやま むさしむらやま].map{|s| s.tr('ぁ-ん',

                                                                          シフトJISの『tr』によるひらがな→カタカナ変換は要注意(0x837Fに割り当てないよ〜) - smilerubyのブログ
                                                                        • LinuxでシフトJISが使えた - tmtms のメモ

                                                                          ふと、最近の Linux って EUC-JP ロケール使えるんだっけ? と思ったんで調べてみた。環境は Ubuntu 22.04。 EUC-JP ロケール locales パッケージが入ってない場合はロケールはこれだけ: % locale -a C C.utf8 POSIX locales と language-pack-ja をインストール: # apt install locales language-pack-ja locale-gen コマンドを実行すると ja_JP.utf8 が増える: # locale-gen Generating locales (this might take a while)... ja_JP.UTF-8... done Generation complete. # locale -a C C.utf8 POSIX ja_JP.utf8 /etc/loc

                                                                            LinuxでシフトJISが使えた - tmtms のメモ
                                                                          • Matzにっき(2007-03-06) シフトJISを捨てられるか?:ITpro

                                                                            << 2007/03/ 1 1. [Ruby] Rubyist Magazine - Rubyist Magazine 0018 号 2. ストレートタイプのスマートフォン「NOKIA E61」レポート 3. ITmedia エンタープライズ:TopCoderで世界と渡り合う日本IBMの異才 - 夷藤勇人 4. My Sleepless Nights in the Big Apple: Apple、サブノート市場へ再参入へ 5. ITmedia Biz.ID:失敗しないプロジェクトマネジメント -- Appleやはてな、Googleに学ぶ3つのヒント 6. 平成19年度「情報大航海プロジェクト(モデルサービスの開発と実証)」に係る委託先の公募について 7. [言語] PyCon 2007 Review 8. [Ruby] deep_science:Re:バザール「オープンソース、そして「R

                                                                            • JIS記号の UCS BMP へのマッピングの問題および MS漢字とシフトJISの違い (JIS-UCS mapping issues and difference between JIS and MS-KANJI)

                                                                              • シフトJISを発明したのは誰か?(2) - もじのなまえ

                                                                                まったく年の瀬も押し迫ったというのに、こんなに面白い話題が出てくると他のことが手につかなくなっちゃう。というわけで、ここでちょっと落ち着いて古川さんの証言を検討してみたいと思う。 シンクロニシティということはあるもので、この話題が出る数日前、驚いたことに安岡さんが自身の日記で、シフトJISの誕生について書いていた。 シフトJISの誕生 それで「古川さんが、これについて詳しいことを書いてますよ」と僕がコメントした。それに対する安岡さんの答えがこちら。 Re:古川享さんがシフトJIS誕生について書いています 安岡さんは、山下良蔵説について、「すごく気になってるんですけど、どうやってもウラが取れない」とおっしゃっている。一方、マイクロソフトウェア・アソシエイツの方は具体的な資料が残っていて、ウラがとれると。たとえば、『漢字CP/Mのコード体系』とかね(手書きなんですよ、この論文。こういう貴重な資

                                                                                  シフトJISを発明したのは誰か?(2) - もじのなまえ
                                                                                • Visual Studio Code のファイルエンコードにシフトJISを使用する

                                                                                  軽量で軽快な Microsoft Visual Studio Code ですが、文字のエンコードが標準で UTF-8 になっています。通常このままで問題ないのですが、私はいまだにMS-DOSやCP/M用のコードを書く用事があってシフトJISが使えないと不便です。 そこでエンコードをシフトJISに変更したのですが、設定の方法に気が付きにくかったのでメモを残しておきます。 指定したエンコードでファイルを開き直す 右下に「UTF-8」等のように現在のエンコードが表示されていて、そこをクリックすると現在開いているファイルのエンコードを変更できます。 「Reopen with Encoding」を選べば指定したエンコードでファイルを開き直す。 「Save with Encoding」で指定したエンコードでファイルを保存する。

                                                                                    Visual Studio Code のファイルエンコードにシフトJISを使用する