並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 1444件

新着順 人気順

シフトJISの検索結果1 - 40 件 / 1444件

  • 無料でここまでできる→日本語を書くのに役立つサイト20選まとめ

    (例文/コーパス) ◯KOTONOHA「現代日本語書き言葉均衡コーパス」 少納言 www.kotonoha.gr.jp/shonagon/search_form 現代の日本語の書き言葉の全体像を把握できるように集められた約1億語収録の『現代日本語書き言葉均衡コーパス』をジャンルを指定したり、前後にくる言葉を指定した上で検索できる。用例を探したいときはまずここを当たる。 ◯コーパス検索ツールNINJAL-LWP for BCCWJ (NLB) nlb.ninjal.ac.jp/ 『現代日本語書き言葉均衡コーパス』を検索するために、国語研とLago言語研究所が共同開発したオンライン検索システム。上の少納言との違いは、名詞や動詞などの内容語の共起関係や文法的振る舞いを網羅的に表示できるところ。 たとえば「タバコ」を検索すると、用例が「タバコ+助詞+動詞」や「動詞+タバコ」+「タバコ+助詞+形容詞

      無料でここまでできる→日本語を書くのに役立つサイト20選まとめ
    • UnicodeとUTF-8の違いは? - Humanity

      という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

        UnicodeとUTF-8の違いは? - Humanity
      • ふい字置き場

        ふい字 v2.9 → ダウンロードはこちらから (2007.08.01) HuiFont29.lzh 約2.4MB ふい字P v2.9 → ダウンロードはこちらから (2007.08.01) HuiFontP29.lzh 約2.4MB <説明> ・TrueTypeフォント。WinXPまで/MacOS X以降で使えます。 ・日本語2バイトかな文字フォント。ひそかに縦書き対応。 「ふい字」は等幅、「ふい字P」はプロポーショナル。 ・入ってる文字は、 ひらがな/全角・半角カタカナ/全角・半角数字/ 全角・半角アルファベット/ギリシャ文字/ロシア文字/各種記号/ シフトJIS第一水準漢字/シフトJIS第二水準漢字/絵文字 他 ■こっちの「萌」も違ってる気がする……ね……。近々直します。 《軽量版》 ふい字 v1.09 → ダウンロードはこちらから (2007.08.01) HuiFont109.l

        • いますぐWindowsを捨ててデスクトップでGNU/Linuxを使う10+の理由

          言及するのが既に周回遅れ気味だが、いますぐコマンドプロンプトを捨てて、Cygwinを使うべき10+の理由という記事がとても人気だったようだ。 Cygwinはご存知の方も多いだろうが、元々はCygnus Support(後にCygnus Solutionsに改名)という会社が開発した、Windows向けのGNU関連のツール群だ。Cygnusという名前にはGNUの3文字が含まれているが、これは「GNUのシノニム」というのが名前の由来だからだ。Cygnusが開発したWindows向けのGNUツール群=Cygwinというわけだ。CygwinはまさにGNUオペレーティングシステムの一部のWindows移植版なのである。このへんのことはCygwinのFAQにも書いてある。余談だが、Cygwinの対抗馬としてはMinGWが出てくるが、こちらは「Minimalist GNU for Windows」の略だ

            いますぐWindowsを捨ててデスクトップでGNU/Linuxを使う10+の理由
          • 文字コード再入門 ─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!|ハイクラス転職・求人情報サイト AMBI(アンビ)

            文字コード再入門 ─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう! 文字コードには、どのような種類があり、それぞれどのような意味を持つのか、といった、文字コードの基本的な概念、従来の文字コードを紹介し、現在のUnicodeの構成を概説し、プログラミングにおいて注意すべき箇所をいくつか取り上げます。 ソフトウェア開発に携わる方の多くは、何らかの形で文字コードに触れることがあるでしょう。文字や記号をコンピュータ上でデータとして扱うには、文字コードの知識が必要不可欠です。 本稿では、書籍『プログラマのための文字コード技術入門』の著者である矢野啓介さんが、知っておきたい基礎知識を分かりやすく解説します。 文字コードとは? Unicode以前の文字コード Unicodeとその主な符号化形式 UTF-16 UTF-32 UTF-8 Webで文字コードを指定する仕組み

              文字コード再入門 ─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!|ハイクラス転職・求人情報サイト AMBI(アンビ)
            • 普通のHTMLの書き方

              保守しやすく、規模に依存しないHTML文書のために 一般 DOCTYPEで始める 置き換えられるべきまたは旧式のDOCTYPEを使わない XML宣言を使用しない 文字参照はできる限り使わない &と<、>、"、'は名前文字参照を使ってエスケープする 制御文字や不可視文字は数値文字参照を使う コメントではその内容の前後へ空白文字を置く 終了タグを省略しない 空要素の書き方を混ぜない タグや属性値の前後へ空白文字を置かない 大文字・小文字を混ぜない 引用符を混ぜない 属性を2文字以上の空白文字で区切らない 真偽値を取る属性の値は省略する 名前空間は省略する XML属性は使わない data-*とMicrodata、RDFa Lite用の属性と通常の属性を混ぜない デフォルトの暗黙のARIAセマンティックスを尊重する 文書要素 lang属性を追加する lang属性の値はできる限り短くする できる限り

              • 絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道

                Unicodeが携帯電話の絵文字を収録へ 絵文字ってなに?そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな! 8割の女性は「恋人以外にも使う」』(RBB NAVI)なんていうニュースもありました。携帯電話の個人普及率が9割を上回る(平成20年内閣府消費動向調査)この国において、絵文字はごくありふれたものになっている現実があります。 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。 まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するもの

                  絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道
                • 「ソフトウェアは工業製品ではない」、Rubyのまつもと氏が講演 - @IT

                  2009/04/10 ソフトウェアは工業製品ではない――。Rubyの生みの親としてしられるまつもとゆきひろ氏は2009年4月9日、InfoQ主催のイベント「QCon Tokyo 2009」の基調講演で、ソフトウェアと何であり、何でないのか、それはどういう性質のものであるのかを雄弁に語った。 コードとは設計である 「ビューティフルコード」と題した基調講演を行ったまつもと氏は、2007年に共著者の1人として出版した同名の書籍に書いたエッセイに込めた思いを、次のように語る。 「世界に冠たる日本の製造業のノウハウを適用することで生産性を上げることができるに違いないという発想がありますが、ソフトウェアは工業製品ではない。そうした誤解を正していきたい」。 ソフトウェア産業界では、よくエンジニアが何十万人足りないということが言われる。しかし、まつもと氏は、これは工業生産と同じ方法論を当てはめることから来

                  • Sambaサーバ構築、5つのべからず:2008年版(1/2)

                    - 若葉マーク管理者に捧げる - LinuxやUNIXをWindowsのファイルサーバ/プリントサーバとしてしまうことができる「Samba」は、手軽にファイル共有環境を構築することができ、サーバ管理入門にもぴったりです。インターネット上の関連情報も豊富ですが、しっかり出所を確かめないと誤った設定を招く恐れがあります。 オープンソース・ソリューション・テクノロジ株式会社 代表取締役 チーフアーキテクト 小田切 耕司 2008/4/22 Windowsとのファイル交換を手軽に実現するSamba Sambaは、LinuxやUNIXをWindowsのファイルサーバ/プリントサーバとしてしまうことができるオープンソースソフトウェア(OSS)です。Sambaの導入によって、LinuxとWindowsが混在する環境で、手軽に情報共有を行えるようになります。 Sambaは、大きく以下の4つの機能を提供しま

                    • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

                      普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

                        新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
                      • BOMなしUTF-8によってWindowsでもたらされる困惑 (1/2)

                        かつてWindowsでテキストファイルといえばシフトJIS形式のものが大半だった。しかし最近では、UTF-8形式のテキストファイルも普通に見かけるようになってきた。世の中はUTF-8が主流になりつつあると言っていいだろう。 しかし、WindowsでUTF-8を使うと、ちょっと困ったことがある。それは、エクスプローラーの検索欄などで用いるWindows Searchが、UTF-8にはしっかり対応していないのである。正確に言うと、Windows Searchはファイル先頭に「BOM」のあるUTF-8は認識して正確にインデックス化し、ファイルの全文検索が可能になるが、BOMのないUTF-8では正しくインデックス化できず、ファイルの全文検索はASCIIコードのみ可能で、日本語などの非ASCII文字では全文検索ができない。 同じ内容のテキストをUTF-8、UTF-8 BOM付き、UTF-16ビッグエ

                          BOMなしUTF-8によってWindowsでもたらされる困惑 (1/2)
                        • 「SQLインジェクション対策」でGoogle検索して上位15記事を検証した - ockeghem's blog

                          このエントリでは、ネット上で「SQLインジェクション対策」でGoogle検索した結果の上位15エントリを検証した結果を報告します。 SQLインジェクション脆弱性の対策は、既に「安全なSQLの呼び出し方」にファイナルアンサー(後述)を示していますが、まだこの文書を知らない人が多いだろうことと、やや上級者向けの文書であることから、まだ十分に実践されてはいないと思います。 この状況で、セキュリティのことをよく知らない人がSQLインジェクション対策しようとした場合の行動を予測してみると、かなりの割合の人がGoogle等で検索して対処方法を調べると思われます。そこで、以下のURLでSQLインジェクション対策方法を検索した結果の上位のエントリを検証してみようと思い立ちました。 http://www.google.co.jp/search?q=SQLインジェクション対策 どこまで調べるかですが、以前NH

                            「SQLインジェクション対策」でGoogle検索して上位15記事を検証した - ockeghem's blog
                          • 外字を使うのはやめてくれ! Unicodeへの移行を呼びかけるMicrosoftの公式ブログ記事が話題に/今や「メモ帳」でさえテキストファイルをUnicodeで保存する時代! Shift_JISはやめよう【やじうまの杜】

                              外字を使うのはやめてくれ! Unicodeへの移行を呼びかけるMicrosoftの公式ブログ記事が話題に/今や「メモ帳」でさえテキストファイルをUnicodeで保存する時代! Shift_JISはやめよう【やじうまの杜】
                            • 文字コード規格の基礎:ITpro

                              この記事は,日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。 文字コード規格の基礎を手早く理解したい場合などにお役立てください。 文字コードは間違いなく情報を交換するための「決まりごと」なので,正確を期すため厳密な仕様が規定されている。だが,その仕様そのものを実装するプログラムを作る場合を除けば,プログラマが仕様の詳細を隅々まで理解している必要はない。六法全書を読んでいなくても問題なく普段の生活ができるようなものだ。 ここでは,通常のプログラミングをするうえで必要と思われる範囲のことを,なるべく簡潔に説明したい。「半角カナ」のような呼び名は正確さを欠くものだが,多くの人に伝わりやすいので説明の中でも使っていく。説明を簡略化するため「正確な仕様を知りたいときは規格書そのものを必ず参照してほしい」と書きたいところだ

                                文字コード規格の基礎:ITpro
                              • シフトJISを使い続ける上場企業をまとめてみた - megamouthの葬列

                                srad.jp こういうニュースがあった。世界のWebサイトの90%がutf-8を使用している、という。 昔、シフトJISでエンコードされたPHPファイルを編集させられた時、「表示」が表示できず(文字通りの意味である)バイナリリテラルを書いていたことを思い出す。 文字コード断絶の歴史を乗り越え、世界はようやくUnicodeの元に集結したのである。 日本の上場企業のcharset指定状況 さて、美しいニッポンである我が国はどうであろうか、 www.pathfindergate.com 私は上記のサイトより早速日本の上場企業のHPのリストをダウンロードさせていただくと、さらっとクローラーを書いてHTTPヘッダのcharsetとmetaタグのcharset、ついでにDOCTYPE宣言を集計することにした。 というのは実は嘘で、去年の12月頃にクローラーは出来上がっていたのだ。この記事が出る前にと

                                  シフトJISを使い続ける上場企業をまとめてみた - megamouthの葬列
                                • 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

                                  by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字

                                    海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
                                  • まつもと×笹田、Ruby 1.9を語る ― @IT

                                    2007/12/25 「そういえばあのretryの話、どう思う?」、「誰も使ってないから害悪が多いっていう話は説得力ありますよね」、「じゃあなくすか……、うん、なくしといて」、「あ、決まっちゃった(笑)」――。 まつもとゆきひろと、笹田耕一。いま、世界が注目するプログラミング言語「Ruby」の生みの親と、開発コアメンバーの2人は、こともなげにRubyの仕様を記者の目の前で変更してしまった。Rubyの開発はどのように行われ、どこへ向かおうとしているのか。現行のバージョン1.8系から大きく様変わりする次期開発版「Ruby 1.9」のリリースを12月25日に控えた2人に、師走の秋葉原で話を聞いた(文中、敬称略)。 Rubyの仕様は密室で決まる!? 冒頭に紹介した2人の会話は、「retry」というRubyの文法の2種類ある使い方のうち、これまでほとんど使われた形跡がない方を文法仕様から取り除くかど

                                    • ZIP中のファイル名の文字化け - @tmtms のメモ

                                      こんな記事がありました。 gihyo.jp これはMacユーザー用の書籍の宣伝記事らしいのですが、「Windowsを使ってる人のためにMac側がひと手間かけてあげよう」なんて殊勝なことをマカーが言うとは時代も変わったもんです。([追記] はてブのコメントを見たらさすがマカーという意見が並んでて安心しました) まあ私はWindowsユーザーでもMacユーザーでもないのでどうでもいいのですが、文字化けなネタなので食いついてみます。 記事中に、「付物出稿.zip」というファイルを開いた時の画像が載ってます。 文字の並びからして、UTF-8文字列をシフトJIS(CP932)とみなして表示してしまった文字列でしょう(「繧ォ繝上y繝シ繝輔か繝ォ繧ソ繧・」の元の文字は「カバーフォルダ」で、「蟶ッ繝輔か繝ォ繧ソ繧・」は「帯フォルダ」)。 つまり、Macはファイル名をUTF-8でZIPに書き込み、Wi

                                        ZIP中のファイル名の文字化け - @tmtms のメモ
                                      • 「ドコモの絵文字が見づらい問題」を考える なぜ、今のスマホにそぐわないのか

                                        携帯電話を用いたコミュニケーションの手法の1つに「絵文字」がある。日本で生まれたこの絵文字は、GoogleとAppleによって標準化され、今ではさまざまなスマートフォンやPCでもでも閲覧できる。 その一方、ドコモで販売されるAndroidスマートフォンには、いまだフィーチャーフォン時代の絵文字が表示される。しかしこれが今のスマートフォンにそぐわない側面が出ている。この絵文字問題について考察したい。 今の絵文字は日本のものをベースにGoogleとAppleが標準化を提案 絵文字を携帯電話に採用したのは、NTTドコモが最初だ。この後にDDI(現au)、J-フォン(現ソフトバンク)が採用する形で続く。絵文字にはシフトJISというコードが用いられていたが、互換性維持の空き領域に絵文字を割り当てたことから、キャリア間で互換性がなく、文字化けの要因となっていた。 後に自動変換サービスも展開されたが、使

                                          「ドコモの絵文字が見づらい問題」を考える なぜ、今のスマホにそぐわないのか
                                        • Unicode対応 JIS X 0208 文字コード表

                                          Unicode対応 JIS X 0208 文字コード一覧 JIS X 0208 の区点番号、JISコード、シフトJISコード、EUCコード、Unicode(UTF-8, UTF-16)の文字コード対応一覧です。 文字コードとその文字を順に出力しているだけですので、表示される文字はフォントによって決まります。 01区~08区 JIS非漢字(各種記号、英数字、かな) 13区~13区 NEC特殊文字(機種依存) 16区~47区 JIS第1水準漢字 48区~84区 JIS第2水準漢字 文字コードについてのページや、文字コード一覧についての説明もあります。 JIS X 0208 JIS非漢字 文字コード表 区 点 JIS SJIS EUC UTF-8 UTF-16 字 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001

                                          • シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories

                                            2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。 おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。 変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。 変換表に求めら

                                            • 新元号「令和」と文字コード(主にUnicode)の問題

                                              境 真良@iU/GLOCOM/IPA(あーりん推し/芸能人スキャンダルネタ要らない) @sakaima 「令和」ですが、「令」はUnicode「U+4EE4」、UTF-8だと「E4 BB A4」、シフトJISだと「97DF」、また「和」はUnicode「U+548C」、UTF-8で「E5 92 8C」、シフトJISだと「9861」です。とりあえずご参考まで。 #さてお仕事ですよ 2019-04-01 11:46:49

                                                新元号「令和」と文字コード(主にUnicode)の問題
                                              • 漢数字が数字順にソートされない理由を調べてみた - give IT a try

                                                はじめに:「なぜ漢数字は数字順に並ばない!?」 先日、こんなツイートをしたところ、結構たくさんの人にリツイートされました。(執筆時点で50件以上) 「漢数字はソートしても数字順に並ばない」という事実を生まれて初めて知った。まさかのサプライズ。 pic.twitter.com/Eqx3ltIfHs— Junichi Ito (伊藤淳一) (@jnchito) 2014年11月27日 「なぜ漢数字は数字順に並ばないのか」という問いに対して、表面的な回答をするなら「数字順に並ばないのは、数字の大きさではなく文字コード順でソートされているから」ということになります。 いや、もちろんそれはわかってるんです。 問題は「そもそもなんで数字順に文字コードを振らなかったの!?」ということです。 感覚的には「一郎、二郎、三郎」って並んでほしいじゃないですか。でも、プログラム上でソートすると「一郎、三郎、二郎」

                                                  漢数字が数字順にソートされない理由を調べてみた - give IT a try
                                                • 第4回 HTMLからXHTMLへの移行方法(1):ITpro

                                                  HTMLからXHTMLにスムーズに移行するには、「書式の違い」をきちんと押さえておくことが不可欠。今回は「XML宣言」「文書型宣言」「XML名前空間と言語コード」「MIMEタイプ」「style要素とscript要素」について見ていこう。 HTMLよりも書式が厳格なXHTML XHTMLはHTMLをXMLで再定義したマークアップ言語であり、HTMLの簡便さを残しつつXMLの論理的厳密性を備えている。そのため、HTMLのようにルーズなコーディング(たとえば終了タグがないなど)でもブラウザで問題なく表示される、ということはほとんどない。したがって、書き方にエラーがないかどうか少し神経質にならなければならない。 また、CSSがきちんと適用されないというトラブルも、実はXHTMLが正しく書かれていないことに起因していることが少なくない。 これらの問題を避けるべく、エラーのないソースにするには、バリデ

                                                    第4回 HTMLからXHTMLへの移行方法(1):ITpro
                                                  • 元カノから毎日送られてくる暗号を解いてくれ:ハムスター速報

                                                    元カノから毎日送られてくる暗号を解いてくれ Tweet カテゴリ☆☆☆☆☆ 1 : 忍法帖【Lv=23,xxxPT】 :2011/08/22(月) 20:35:51.42 ID:lvxPLb7Fi 毎日同じのがメールで送られてくるんだ 「まっようぢえ」 意味が分からない 3 :以下、名無しにかわりましてVIPがお送りします:2011/08/22(月) 20:37:00.80 ID:G2kSUmNA0 >>1逃げろ 4 :以下、名無しにかわりましてVIPがお送りします:2011/08/22(月) 20:37:08.82 ID:sSukRP8j0 まさかとは思いますが、この「元カノ」とは、あなたの想像上の存在にすぎないのではないでしょうか。もしそうだとすれば、あなた自身が統合失調症であることにほぼ間違いないと思います。 あるいは、「元カノ」は実在して、しかしここに書かれているよ

                                                    • 2010-02-14 - 未来のいつか/hyoshiokの日記

                                                      例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ/絵文字… JIS X0208やJIS X0213の解説などは圧巻である。書籍にはWebにない利点がある。Webには即時性があるが、文字コードの解説においては、即時性はそれほど求められない。字体ないし字形の差異についてWebではその字体ないし字形がなければ表現しようがないが、書籍であれば細部までこだわって表現できる。 例えば、包摂された「辻」という字の一点しんにょうと二点しんにょうの字体の差はWe

                                                        2010-02-14 - 未来のいつか/hyoshiokの日記
                                                      • 高木浩光@自宅の日記 - 駄目な技術文書の見分け方 その1

                                                        ■ 駄目な技術文書の見分け方 その1 はてなブックマークのホッテントリを見ていたところ、300を超えるユーザに登録された以下の記事があった。 今夜分かるSQLインジェクション対策, 上野宣, @IT, 2006年11月2日 また上野宣か。顔見知りなのでズバリいくことにする。 しかし、その対策はまだ本当に理解されていないように思える。 へえ。 終わりの方を見てみると、 Webアプリケーションの対策 入力値のSQLの特殊文字を適切にエスケープ 入力値=プログラム(プロセス)に外部から入ってくるもの シフトJISの場合には1バイト文字を整理 SQLの記述をなくすためにO/R(Object/Relational)マッピングを活用 攻撃者に役立つ情報を与えないために、不要なエラーメッセージ(データベースが出力するエラーなど)の表示を抑止 対策に「準備された文」(prepared statement)

                                                        • 由来がはっきりしないWindowsの“謎”仕様──Windowsの雑学(諸説あります)

                                                          由来がはっきりしないWindowsの“謎”仕様──Windowsの雑学(諸説あります):その知識、ホントに正しい? Windowsにまつわる都市伝説(133)(1/3 ページ) 多くの企業では新年度も始まったことですので、今回はIT系企業に入社した新人さん向けに“知らなくてもいい雑学”をご用意しました。昔からよく話題になることばかりかもしれませんが、その由来について思いを巡らせることは、コンピュータの歴史を知る良い機会になると思います。 Windowsにまつわる都市伝説 Windowsに古くからある“謎” Windowsには古くから、幾つかその由来がはっきりしない“謎”が存在します。事実かどうかは別として、その由来に思い当たるものがあると気にならない、ちょっとしたことです。しかし、最近のWindowsしか使ったことがないユーザーにとっては、とても気になることかもしれません。 先に断っておき

                                                            由来がはっきりしないWindowsの“謎”仕様──Windowsの雑学(諸説あります)
                                                          • 第1回 気軽にPythonを始めよう:ITpro

                                                            オブジェクト指向スクリプト言語であるPythonは,日常の作業に利用するちょっとしたスクリプトから,商用サイトや大規模Webシステムまで幅広く適用できる非常に便利なプログラミング言語です。日本ではあまり認知度は高くありませんが,欧米を中心に幅広く利用されており,米Google(米YouTubeを含む)などの有名企業でも採用されています。 ここでは,プログラミング言語Pythonの魅力と使い方を説明します。特にこれからPythonをはじめようというビギナーの方に,とっかかりとなる言語の基礎と導入方法を説明します。 日本でPythonの認知度があまり高くない理由 欧米で人気のPythonですが,国内ではまだまだ認知度が高くないようです。原因としては次のような点が考えられます。 ●日本語コーデックに対する不安 Python 2.3の時代まで,シフトJISやEUC-JPを扱うためには,CJKコーデ

                                                              第1回 気軽にPythonを始めよう:ITpro
                                                            • Windowsで文字化けしないZIPファイルをMacで作る | ライフハッカー・ジャパン

                                                              MacBook Proを購入してから、Macばかりの傍島です。非常に機嫌良く使っているのですが、唯一面倒なのが、WindowsユーザーとのZIPファイルのやりとりです。 多くのMacユーザーが経験していると思いますが、Mac OS Xの標準機能で作成したZIPファイルをWindowsで解凍すると、ファイル名が文字化けします。これは、Mac側がUNICODEで処理し、Windows側がシフトJISで処理している為です。Windowsの解凍ソフトがUNICODEに対応していれば問題ないのですが、そうでないことも多いので、Mac側で何とかすることになります。 私の場合、仕事でZIPファイルをやりとりすることがあるので、念には念を入れて、圧縮の為だけにVirtualBoxでWindowsを起動して、ファイルを圧縮するという、大げさなことをしていました。こんな面倒なことをしている人は少ないと思います

                                                                Windowsで文字化けしないZIPファイルをMacで作る | ライフハッカー・ジャパン
                                                              • Ubuntuの日本語環境 | Ubuntu Japanese Team

                                                                Ubuntuは、できる限り多くの言語に対応すべく国際化が進められており、もちろん日本語での利用も可能です。 Ubuntu Japanese Teamでは、Ubuntu日本語サポートをより良いものとする活動を進めています。しかしながら、他の言語環境に悪い影響を与えてしまう変更が必要であるなどの理由で、現段階ではオリジナルのUbuntuに含めることが難しい修正が必要な場合もあります。 そこでJapanese Teamでは、現在のところUbuntuに追加できていない修正を加えたパッケージ、および日本語環境に必要とされるパッケージを収録したRemixイメージを作成・配布しています。このJapanese Teamのパッケージを含むイメージを、オリジナルのUbuntuと区別するために「日本語 Remix」と呼んでいます。 日本語 Remix イメージのダウンロード 日本語に関する問題への対応 文字エン

                                                                • 「コーポレート・ロゴ(ラウンド)」フォント無料ダウンロード – 転職サイト・エージェント情報のLOGOTYPE.JP

                                                                  他社様のフォントと名称が類似していたため、フォント名を変更いたしました。ご迷惑をおかけし誠に申し訳ございません。(2018/08/23) 「コーポレート・ロゴ(ラウンド)」の提供情報「コーポレート・ロゴ(ラウンド)」はオープンソースの源ノ角ゴシックにオリジナルのひらがな・カタカナに変更し、加工を加えたフリーフォントです。ひらがなとカタカナは、本サイトで配布している「コーポレート・ロゴ」フォントを丸ゴシック体に加工したものです。無料ダウンロード可能で、Windows・Mac OSともに対応しています。 本フォントファイルは、源ノ角ゴシックと同じSIL Open Font License 1.1のもとで利用でき、商用場面での利用も可能です。 「コーポレート・ロゴ(ラウンド)」フォントのデザインよく目にする企業ロゴの文字イメージをフォント化した「コーポレート・ロゴ」フォントを、丸ゴシック化したフ

                                                                    「コーポレート・ロゴ(ラウンド)」フォント無料ダウンロード – 転職サイト・エージェント情報のLOGOTYPE.JP
                                                                  • 文字コードの話

                                                                    本稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次 はじめに 第1章 日本語のコード体系 第2章 ASCIIと1バイト文字コード 第3章 JIS漢字コードとエンコーディング法 第4章 ISO 2022 第5章 ISO 2022の実例 第6章 中国語・韓国語の文字コード 第7章 ISO 10646とUnicode おわりに 参考文献 はじめに ASCIIだけで用が足りるアメリカと違って、 私たちは日本語を扱わなくてはならないため、 より深く文字コードの問題と関わらざるをえません。 それでも、MS-DOS/WindowsやMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日本語コードに頭を

                                                                    • 文明が病理であるというポモの誤解

                                                                      メディアリテラシーの練習問題;室井尚の奇妙な反・嫌煙運動プロパガンダ論 山形浩生 (2005/9/30) 目次 はじめに:『ハッカー宣言』書評から嫌煙話まで 嫌煙キャンペーンは嘘八百ってホントかな? 2.1. 肺ガン・気管支ガンが喫煙と無関係ってホント? 2.2. 肺ガン死者数が多いなんて単なる数字の解釈ってホント? 2.3. たばこの発ガン物質なんて大したことないってホント? 2.4. 自分にも周辺にも害がないってホント? 2.5. 喫煙有害説に根拠がなくてただの陰謀ってホント? まとめ 3.1. メディアリテラシーってどの口で? 3.2. 喫煙文化論について 3.3. おわりに 追記: 文明の病理とは (2005/10/1) さらに追記: 室井の「反論」について (2005/10/3, 2007/3/15) 1. はじめに:『ハッカー宣言』書評から嫌煙話まで 『ハッカー宣言』なる本の、

                                                                      • C#で高精度なテキストファイル文字コード自動判別(2014年版) - hnx8のブログ

                                                                        C#(.NET Framework)に限ったことではありませんが、汎用的にテキストファイルを扱うようなアプリケーションを作っていると、よく 特定の文字コードのファイルしか読み出せないのでは困る ⇒文字コードを自動判別し、テキストの内容を取り出したい 読み出したファイルと同じ文字コードでファイルを書き出したい ⇒読み出したファイルの文字コードを知りたい といった場面に出くわします。 ですが、C#(.NET Framework)標準のライブラリではそのような機能は提供されていないため、文字コードを判定するには、 自前で文字コード判定のロジックを実装する 出来合いの外部ライブラリ、Windows版NKF32.dll、ICU4Cなどを利用する IE用の文字コード判別ライブラリ(mlang.dll)を利用する ※COMコンポーネント呼び出し要 のいずれかの方法を取ることになります。 HNXgrepと

                                                                          C#で高精度なテキストファイル文字コード自動判別(2014年版) - hnx8のブログ
                                                                        • ウノウラボ Unoh Labs: Web Application Testing cheatsheet

                                                                          こんにちは! やまもと@テスト番長です。 先日マサトさんに教えてもらったのですが、 こんなウェブアプリケーション用のチェックシートがあるそうです。 SECGURU: Web Application Testing cheatsheet なかなか面白いので、軽く日本語にしてみました。(Special thanks to: ジュンヤさん) ※間違ってたらごめんなさい。  1. アプリケーション名とバージョン 2. コンポーネント名 3. 通信プロトコル SSLならばバージョンと暗号方式 4. パラメーターのチェックリスト URLリクエスト URLエンコーディング クエリストリング ヘッダー クッキー フォーム フォーム(Hidden) クライアントサイドのヴァリデーションチェック 使用していない余計なパラメータの存在 文字列長の最大/最小値 連結したコマンド(Concatenate

                                                                          • 日本語と文字コード

                                                                            コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基本単位として扱う前提で作られているものが中心です。そのなかで日本語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日本語の文字コードに関する基本を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号

                                                                            • 【山田祥平のRe:config.sys】さよならシフトJIS、主なしとて春な忘れそ - PC Watch

                                                                                【山田祥平のRe:config.sys】さよならシフトJIS、主なしとて春な忘れそ - PC Watch
                                                                              • UNIXコマンドリファレンス

                                                                                インターネットへ接続_________ TOPページ(Alt+B) UNIXコマンドリファレンス ディレクトリ操作系 cd  ls  mkdir  pwd  rmdir ファイル操作系 cat  more  less  head  tail  sort  uniq  grep  wc  diff  chown  chgrp  chmod  compress  uncompress  gzip  gunzip  zcat  tar  split  ln  find  cp  mcopy  mdel  mv  rm  touch  nkf  |  >  <  >>  >&  tee システム管理系 which  jobs  sleep  date  cal  whoami  groups  id  w  finger  chfn  history  alias  unalias  type 

                                                                                • リンク/ジャンクション作成ツール

                                                                                  更新履歴 2006-09-10 v1.05 ダウンロード シンボリックリンクの作成時に、リンク先を相対パスで指定すると不正なリンクが作成されてしまう問題を修正。v1.04で作成されてしまった不正なリンクは、単にdelやrmdirで削除できます。v1.05で作り直してください。 ビルドで使うSDKをWindows Server 2003 R2 Platform SDKに更新。 2006-07-23 v1.04 Windows Vistaのシンボリックリンクに対応。Windows 2000/XP上で作成することもできます。必ず注意事項をご覧ください。 Windows 2000にはzip形式フォルダが標準で存在しないので、x86版の圧縮形式をcabに変更。 作成できるリンクはハードリンクだけではなくなったので「ハードリンク/ジャンクション作成ツール」から改名。 2006-06-17 Window