タグ

encodeに関するebibibiのブックマーク (8)

  • quoted-printableでの「=」の扱い - OKWAVE

    > 「3D」を含む文字(「週」とか「そ」とか「出」とか)は、出てきた「=」についてもう一度エンコードしておかないと、デコードの際に問題が発生する、という感じで大丈夫でしょうか? 「エンコード」も「デコード」も一回こっきりです。「もう一度エンコードする」のではなく、一度のエンコードで、データ中の「1B や3Dを全て変換」するのです。 「エンコードしたものをまたエンコード」したり「デコードしたものをまたデコード」することはありませんし、してはいけません。 文字化けの要因は、おそらくデコードしなくていい文字列をさらにデコードしてしまっているということでしょう。 たとえば「そして=3D今週中」という文字列は、ISO-2022-JPでは 「ESC $B$=$7$F ESC (B=3D ESC $B:#=5Cf ESC (B」 (1B 24 42 24 3D 24 37 24 46 1B 28 42

    quoted-printableでの「=」の扱い - OKWAVE
  • バッチで,BASE64のエンコード+デコードする方法 (WSH/JScriptで,バイナリのファイルをテキスト符号化) - 主に言語とシステム開発に関して

    バッチのまとめTOPへ BASE64を使えば,バイナリのファイルをテキストデータ(英数字)に変換できる。 もちろん,元のファイルに戻す事もできる。 だから, 「ファイルのアップロード」は不要になる。 (ファイルではなく,文字列を書き込んでどこかに保存すればよい。) 「ファイルの添付」は不要になる。 (テキスト文字列をコピペするだけで,ファイルを送受信できる。) Base64とは http://ja.wikipedia.org/wiki/Base64 バイナリを英数字文字列に変換する。 メールの添付ファイル送信などの際に使われている技術。 データ量は約138%となる。 以下は,Windowsのバッチ(WSH)で バイナリのファイルを,BASE64の文字列に変換する。 BASE64の文字列を,バイナリのファイルに変換する。 ためのサンプルコード。 エンコード・デコードの両方とも,コマンドプロン

    バッチで,BASE64のエンコード+デコードする方法 (WSH/JScriptで,バイナリのファイルをテキスト符号化) - 主に言語とシステム開発に関して
    ebibibi
    ebibibi 2012/01/19
    これがお手軽そうだ。
  • URL エンコード、デコードもできる UTF8/16 変換ライブラリ [ JavaScript ]

    UTF8/16 | URL Encode / Decode 文字列の URL エンコード、デコードもできる UTF8/16 変換ライブラリ IE4+, NN4.06+, Opera6 説明 JavaScript で何かしらのビット演算、文字列の符号化、復号化するとき 日語等のマルチバイト文字をサクサク扱えるようにできるライブラリです。 拙作の Base64encode/decode、 blowfish、 arcfour等でも利用されています。 ついでに URL エンコード / デコード も行なえます。 機能 文字列を UTF8/16 の文字コードへ UTF8/16 の文字コードから文字列へ UTF16 <=> UTF8 (文字コードの変換) URL 文字列のエンコード、デコード DownLoad Download [utf.js] URL Encode/Decode Sample 変換し

  • 本当は怖い文字コードの話 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    本当は怖い文字コードの話 記事一覧 | gihyo.jp
    ebibibi
    ebibibi 2009/07/08
    これは面白そう。
  • 日本語のe-mail、ISO-2022-JP以外のcharsetを使うのは是か非か | スラド IT

    問題をよく考えましょう. 単独で動作するアプリケーションの話ではなく,不特定多数の相手との通信アプリケーション 直接に相手の(文字コードなどの)能力仕様を確認する手順を踏まずに, 仮定(相手が ISO-2022-JP 等を処理できると決めうち)の上でいきなり送りつける (SMTPによる MTA 間のやり取りはEHLO 等で仕様確認して調整する余地があるが, MUA間のやり取りは RFC822,RFC2822,RFC5322 などの仕様で書かれたものを,完全一方通行で送る) (とりあえず 8bit through かどうかはまた別の問題ということで置いておく) さてここで,歴史的に考えるとこんな感じになります. 原始時代: 英語? ローマ字?(私はよく知らない) pre-MIME時代: メッセージには JIS(≒ISO-2022-JP)を使うという プロトコル外の「共通の了解事項」を設定する

    ebibibi
    ebibibi 2009/01/23
    文字集合と文字符号化方式は別のもの。
  • perl - Encode 中級 : 404 Blog Not Found

    2008年05月08日04:00 カテゴリLightweight Languages perl - Encode 中級 以前書いた 404 Blog Not Found:perl - Encode 入門 は大好評でしたが、 ウェブで利用される文字コード、UnicodeがASCIIを上回る--グーグルが明らかに:マーケティング - CNET Japan UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。 という時代に完全対応するには、入門以上の知識がちょっと必要になります。 例えば、blogをホストしてくれているlivedoor blogの文字コードはEUC-JP。「時代はUnicode」だと言っても、こうした事情もまだ

    perl - Encode 中級 : 404 Blog Not Found
  • 404 Blog Not Found:perl - Encode 入門

    2008年04月09日01:00 カテゴリLightweight Languages perl - Encode 入門 すでにOSCONでもYAPCでも、あちこちそちこちでこの基方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改め だまってコードを書けよハゲ 入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです!とにかくこの基方針をまもっていれば幸せになれます。ここでは、EUC-JPでエンコードされたファイル中の「小飼弾」「こがいだん」「コガイダン」「Kogai Dan」を正規表現で書き換えて標準出力にEUC-JPで出力するプログラムを例にとって説明します。 decode() then encode(

    404 Blog Not Found:perl - Encode 入門
  • ページ移転のお知らせ

    ご指定のホームページは下記のアドレスに移動しました。 ブックマークなどの登録変更をお願いします。 http://tomneko.la.coocan.jp/ ※10秒後に自動的に移転先のページにジャンプします。

  • 1