サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは本日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
充実した機能と高い操作性を兼ね備えたバイナリエディタ。さまざま文字コードに対応する。「FavBinEdit」は、プログラムや設定ファイルなどのバイナリファイルを編集するためのソフト。大きな特徴が「4GBを超えるファイルでも編集できる」こと。大容量ファイルも即座に開くことができ、快適に編集作業を行える。複数ファイルを一括で検索することが可能なgrep機能も備える。 メイン画面は、左側にアドレス、中央に16進データ、右側にはデコード文字列が表示される構成。画面上部には、編集や検索などのツールボタンが並ぶ。文字コードは、JIS/Shift JIS/EUCをはじめ、Unicodeの文字符号化方式(UTF-32/16/8/7)などに対応する。 カスタマイズ性の高さも特徴のひとつ。ショートカットキーやツールボタンの設定を任意に行える。キーアサインは操作性が重視され、標準状態ではVisual C++と同
Linuxで日本語のファイル名を持ったファイルをzip圧縮すると、Windows側で文字化けして読めないということがある。どうしても日本語のファイル名を使いたい場合は、ファイル名をUTF8からShiftJISに一時的に変更してzip圧縮する必要がある。 Windows, Linuxでのファイル名の文字エンコード別状況 UbuntuでShiftJISエンコードのzipを閲覧 → NG UbuntuでUTF8エンコードのzipを閲覧 → OK WindowsでShiftJISエンコードのzipファイルを閲覧 → OK WindowsでUTF8エンコードのzipファイルを閲覧 → NG つまり、どちらかのエンコードを選択すれば、両環境で閲覧できる「最適解」は存在しない。 自己解決というアタリマエのことが出来ない人が相対的に多いWindows環境に合わせて、ShiftJISエンコードでzip圧縮す
こんにちは、@todokrです。これは絵文字 / Emoji Advent Calendar 2016 3日目の記事です。 さっそくですがクイズです。以下のJavaScriptのコードの実行結果はどうなるでしょうか? (すぐお試しいただけるようgistにコードをアップしてみました) ... ... ... 結果はこちらです。 なんと!ママが入れ替わってしまいました! 「家族」の1文字に対してreplace したのに何故でしょうか? 「なんだこの文字は!?」に遭遇したらやることはただひとつ、そう16進ダンプでバイナリを見ることです。1 まずはプレーンな「家族」の絵文字から見てみましょう このようなテキストファイルを用意します。 odコマンドでダンプした結果が以下です。 エンコーディングはUTF-16なので2バイトずつで0xD83Dと0xDC6Aですね 先頭バイトの0xD83Dが上位サロゲート
mysqlの文字コードはチェックする場所が多いので原因を突き止めるのに毎回苦労します。 大きく二種類に分けられて、 クライアント側、サーバー側(mysqlサーバー)、及びそれらの接続の文字コード データベース/テーブル/カラムの文字コード です。 デフォルトをきちんと設定しておく そもそも作成したDBの文字コードが意図しない設定になっていたら、デフォルトの設定が間違っている可能性が高いので、再度同じ問題を起こさないためにも、設定見直し→DBをdrop→DBをcreateという順番で直しに行きます。 1も2もデフォルトの設定は下記を実行すればok。 +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+-----------
mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] ) は文字エンコーディングを変換する関数です。 mb_convert_encodingに潜む問題 第3引数の $from_encoding には変換前の文字エンコーディング名を指定しますが、ここを"auto"と指定しておくと、環境によっては Warning: mb_convert_encoding(): Unable to detect character encoding のようなエラーが発生し、文字エンコーディングの変換が失敗する場合があります。 ですので、"auto" は極力使わず、文字エンコーディングを指定することをおすすめします。 autoとphp.iniの依存関係 なぜこのようなエラーが発生するかというと、autoは
結論 (2018年8月2日現在)検索対象にマルチバイト文字が含まれていても、抽出したい文字に含まれていなければ不要。 しかし安全のため、どんな時でもパターン修飾子"u"を付けるべき。 実験 デモ: http://sandbox.onlinephpfunctions.com/code/dab6f408a93e5113f5db0def7e58014f3a1c1ff2 <?php $subject = '漢字abcdひらがな한글Кириллица'; $patterns = array( '/\w+/', '/\w+/u', '/[a-z]+/', '/[a-z]+/u', '/[あ-ん]+/', '/[あ-ん]+/u' ); $v = phpversion(); echo "PHP: {$v}<br>"; echo "検索対象: {$subject}<br><br>"; foreach ($p
↓動作サンプルを作りました 文字コード変換 動作サンプル Unicode の変換が可能になりました。 文字コード配列から URLエンコード/デコード が可能になりました。 あと説明とサンプルも少し載せました。。(説明不足でごめんなさい) こないだの 「JavaScriptだけでzipファイルの解凍 - Unzipper.js」が SJIS ファイルとかだと表示で文字化けするので、ついつい。。 動作確認は、zip ファイル解凍のデモページでわかると思います。 zip の中に SJIS や EUC-JP のファイル (ファイル名) がある場合でも UTF-8 表示で化けなければ問題なしです。 zip 解凍デモページ ↑のデモページを開いて、デスクトップなどから zip ファイルをドロップすると 解凍して結果のテキストを表示します。 ※ JavaScript だけで動いていて、どっかのサーバなど
概要 javascriptの文字列はUTF-16で String#charCodeAt(i) で取得出来る数値は2byte(0x0000から0xffff)になる。 escape("あ") は UTF-16がそのままエスケープされ "%u3042" になるが encodeURI("あ"),encodeURIComponent("あ") などではUTF-8に変換されて "%E3%81%82" になる。 var str = "文字列をUTF-8に"; var utf8str = unescape(encodeURIComponent(str)); var utf16str = decodeURIComponent(escape(utf8str)); if (str == utf16str) {alert(true);} //=> true とすることで UTF-16<=>UTF-8 の変換は出来
こんにちは、hachi8833です。 少し前に、babaさんから「Rubyの内部文字コードはUTF-8じゃないよ」とツッコミがありました。 (追記: 上は会話の途中から切り取りましたのでご了承ください) いきなりの展開にくらくらきましたが、babaさんはさらにたたみかけます。 こうしたことはとっくにご存じの方も多いと思いますが、「Rubyといえば2.0以来UTF-8完全対応なんじゃないの」と勝手に思い込んでた私は脳に掌底を食らったような思いです。ああ、でもこういうことがあるから面白い。 ⚓ プログラミング言語と内部文字コードの関係 まず最初に押さえておきたい点です。プログラミング言語で文字コードに関連する部分は、「文字列」「正規表現」「入出力」「コード中の文字リテラル(""の中など)」「コード中の文字リテラル以外の要素(変数名など)」「ファイル名」などが中心になります。そして文字列に関連し
TypeKey認証やコメント投稿の後で文字化けが発生するという質問を最近何件か頂いています。TypeKeyの文字化けについてはHTTPリダイレクトを伴っており、ページ直前のHTTPレスポンスで返却されたcharsetを見てしまうのが文字化けの要因と思われます(発生するサイトとしないサイトの違いは不明です)。下記のサイトに解説があります。 エンタープライズ:Linux Tips:リダイレクト先で文字化けしてしまう ただしコメント投稿後の文字化けは原因不明(リダイレクトではないという認識)です。 上記のサイトにも少し書かれていますが、リダイレクトによる文字化け解消について .htaccess を利用する方法がありましたのでご紹介します。 1..htaccess ファイル作成 まず .htaccess というファイルをテキストエディタ等で新たに作成し(既に存在する場合はその中)、そこに下記のいず
これ1つあれば安心!Linuxにインストールしておきたい解凍ソフト 2015/6/4 2015/9/9 アプリケーション 多言語、マルチプラットフォーム下でのファイル名、フォルダ名文字化け対策の第3弾です。 前回の記事はこちら⇒「圧縮・解凍で文字化けしない!Windowsにインストール必須の無料ソフト3選」 今回は、Linux側での対応です。 Linuxで使える万能解凍ソフトを紹介します。 いろいろな文字コードを自動判別して解凍してくれる、 なんとも賢い頼れるヤツです。^^ Linux側で文字コードを自動判別して解凍してくれるアプリを使用する その名は、「unar」。 unarchiveの略ですかね? ※別に「unrar」というアプリがありますが、「unrar」ではないので間違えないように注意してください。 使ったことがないのですが、公式サイトを見るとMac、Windows版もあるようです
まえがき 俗字の字典で、「〇:漢数字のゼロ」について触れました。しかし他の用事で資料をあさっているうちに、いろいろ面白いネタが集まってしまいました。もったいないので、本稿にまとめておきます(貧乏性ですな)。 歴史的な考察 基本的なトコだけ押さえておきます。 数字の「0」自体も、インドで7世紀ごろに成立したもの。それ以前には存在しない文字。 漢字の「零」は、『玉篇』・『説文解字』にもある古い字で、7世紀以前から存在する。意味としては「しずかに降る雨」とか。これを、いつから数字の「レイ、ゼロ」に当てたのかについては未調査。『諸橋大漢和』は「邦訓」とするが、中国でも例えば『漢語大字典』に新しい用例ではあるが数字のゼロの意で載っている。『大漢林』は「現代の用法」として数字のゼロの意をあげる。 和算など東洋の数学史関係を調べれば多分わかるのだろうけど、パラパラ立ち読みした限りでは見出せなかった。 日
基本、ほとんどのプロジェクトがUTF-8だけど、 たまに違うときがある。 ファイル毎変更して開くのは面倒なので、プロジェクトの文字コードを変更する。 Preferences ー> 左メニューより、File Encodings ・右上の[Autodetect UTF-encoded files]のチェックを外す ・プロジェクトフォルダ毎変更したいので、プロジェクトフォルダの右側のDefault Encodengを変更 (Default Encodingの列をクリックするとプルダウンが出てくるので、そこから選択) 「OK」ボタンで保存し、PhpStormを再起動。 プロジェクトを開くと、変わってる♪ 参考ありがとう:http://fiahfy.blogspot.jp/2013/02/phpstorm_22.html
日本語などのマルチバイト文字を、「¥uXXXX」形式のユニコードエスケープに変換します。 ユニコードエスケープからの逆変換も出来ます。 下記テキストエリアに入力したのち、[変換]ボタンを押すと、画面下部の結果ボックス内に変換結果が表示されます。 変換に使ってるJavascriptの解説はこちら。 テキストをここに入力する: ¥uXXXX形式に変換(Escape) 日本語に変換(Unescape) 結果:
・「美乳」で文字化けが直るって本当? オンラインDVD&CDレンタルなら月々1980円で借り放題のDMMがお得! えっ? って聞きなおしたくなるようなタイトルですが、「この『美乳』という文字をヘッダー部分にコメントとして挿入しておくと、文字化けが直る」という話は確かに存在します。ただし、これは大前提としてEUC-JPのページを作成するならば、という話になります。 <HTML> <HEAD> <meta http-equiv=Content-Type content="text/html; charset=EUC-JP"> <!-- 美乳 --> <TITLE>テスト1</TITLE> </HEAD> <BODY bgcolor="#FFFFFF"> このページはアダルトサイトとは無縁です。ヌード画像などは一切ありません。 </BODY> </HTML> では、なぜ、この「美乳」がおまじない
一般に、HTML 文書では<meta>要素で使用されている文字コードのエンコーディングを指定します。 標準規格では、シフトJISコードは charset=shift_jis と書くのですが、古くから charset=x-sjis と言う指定も使われてきました。 ここでは、この指定に関するお話をします。 x-sjis とは何か。 もともと、シフトJISコードに関する正式な表記法が定まっていなかった頃、ネットスケープ社が取敢えず日本語対応するためにネットスケープ 2.0から導入したものが x-sjis と言う表記です。 この他にも、日本語EUCを表す x-euc-jp もありました。 当時のネットスケープのシェアが圧倒的だった事もあって、多くのオーサリングツールなどがこれを採用しました。 その後、公式に shift_jis が定義され、ネットスケープも3.0からこれに対応しております。 しかし
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く