並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 1615件

新着順 人気順

UTF8の検索結果241 - 280 件 / 1615件

  • ja_JP.UTF-8 vs ja_JP.utf8

    それは某IRCチャンネルの何気ない一言から始まった. @xxxx | .UTF-8 or .utf8? 僕は何も疑問を持たずに,こう答えた. @Kojima | ja_JP.UTF-8 そしたら彼は, @xxxx | .utf8 on 'locale -a'と返答してきた. 確かに,手元の環境で locale -aを実行してみると,utf8 になっている. $ locale -a C POSIX en_US en_US.iso88591 en_US.utf8 ja_JP ja_JP.eucjp ja_JP.ujis ja_JP.utf8 japanese japanese.euc @matsuu 先生が以前 eselect locale を入れたときにこうつぶやいていたのを思い出したので,「matsuu先生がこういってるんだから,.UTF-8なんだよ!」としておいた. ja_JP.utf8

    • テンプレートShift_JISでそれ以外UTF-8の場合 - Unknown::Programming

      っていうのがなかなかできなくて。 テンプレートファイルはShift_JISなんだけどソースコードやDBはUTF-8でやりたい。 でさらに最終出力は携帯用サイトなのでShift_JISでっていうレアなケースを実現したいと。 テンプレートをUTF-8にさえすればCatalyst::Plugin::Charsets::Japaneseで一発OKなんだけどね。 テンプレートをクライアントが触りたいとかってケースでUTF-8とかわからんからShift_JISでお願いとかって結構あるのでそーゆー場合のお話ですね。 まぁクライアントが触る部分だけをうまく切り離してなんとかするってのが普通のやり方なのかもしれないけどとりあえず。 ってことでまずはShift_JISで書かれたテンプレートを動的にUTF-8に変える必要があります。 それはTemplate::Provider::Encodeでできるわけです。

        テンプレートShift_JISでそれ以外UTF-8の場合 - Unknown::Programming
      • ものかの » UTF-8-MAC は文字コードかな…

        昨日の記事「UTF-8-MAC なんていう文字コードはありません」は言いすぎだったようです。一夜明けて思い直したので、ここで修正しておきます。 「文字コード」というは、各人各様でかなり...UTF-8-MAC は文字コードかな… 昨日の記事「UTF-8-MAC なんていう文字コードはありません」は言いすぎだったようです。一夜明けて思い直したので、ここで修正しておきます。 「文字コード」というは、各人各様でかなり広くて大雑把な言葉です。それなのに「文字コードではない」と断定的に言ったのはまずかった。 それから「テキストエンコーディング」。この言葉はただ単にエンコーディングとも呼ばれますが、符号化方式のことではありません。言ってみれば、名が体を表していない。たとえば、CP932 と MacJapanese。この2つはエンコーディング名として区別されていますが、符号化方式はまったく同じです。 エ

        • UTF-8環境で GNU Screen の日本語表示が崩れる件 - OSのようなもの

          イントロ Debian lenny の screen は UTF-8環境だと日本語を上手く表示してくれない。問題発覚当初 putty や emacs を疑ったが,こいつらには何の罪も無かったんだ。そう,黒幕は screen だった。ここでの環境は次の通り。 Debian lenny PuTTY 0.60 ごった煮版 GNU Screen 4.0.3 この問題は Unicode の曖昧な文字幅(East Asian ambiguous char width)に起因するものらしい。大抵のソフトウェアは独自の方法でこの問題を解決していて,具体的に emacs や vim はユーザーがオプションを加えることで UTF-8環境で日本語を正常に表示できる。 screen には GNU Screen - bug #16666 の cjkwidth パッチがあるのだけど,Debian lenny の sc

            UTF-8環境で GNU Screen の日本語表示が崩れる件 - OSのようなもの
          • WindowsでEncoding.default_externalをUTF-8にするには - すがブロ

            Ruby製のツールを扱う際にデフォルトエンコーディングがUTF-8じゃなくて人生厳しい場合がある やりたかったこと 自分が使ったわけじゃないんですけど、compassを使うときにSASSファイル等はUTF-8なんだけどWindows環境でcompassを使ってビルドしようとするとデフォルトエンコーディングの違いからWindows-31Jじゃないプギャーと言わるらしい。 一般的なやり方と回避方法 当然ググったりしてみるんですけど、そうするとターミナル上でset LANG=ja_JP.UTF-8したり環境変数にLANGを登録しておけば良いと書いてある。 だがしかし、どうもRuby1.9系ではそれで対応できるらしいけど、Ruby2.0系では対応できないようだ。 追記 コメント欄で教えてもらいましたが、set RUBYOPT=-EUTF-8でエンコーディングを指定すれば良いのでした*1。そっちのほ

              WindowsでEncoding.default_externalをUTF-8にするには - すがブロ
            • Webページの文字コードをUTF-8にする方法(前編)

              • Java のプロパティファイルは UTF-8 エンコーディングで記述したい

                「えーマジ native2ascii!?」「プロパティエディタプラグインが許されるのは J2SE 5.0 までだよねー」 ジャバエンジニアはそろそろ、プロパティファイルを扱う場合に native2ascii やら各種プロパティエディタプラグインやらの呪縛から解放されてもいいと思うのです… 概要 Java でアプリケーションの各種設定を記述したプロパティファイル (.properties) を取り扱う場合、 Properties クラスもしくは ResourceBundle クラスのお世話になるかと思います。 一昔前までは、プロパティファイル内で日本語などいわゆるマルチバイト文字を含む場合に、 native2ascii コマンドを利用して ASCII コードの文字のみで表現できる ユニコードエスケープ (!= UTF-xx エンコーディング) 表現に変換することが必要とされていました。 しか

                  Java のプロパティファイルは UTF-8 エンコーディングで記述したい
                • Don't use DBIx::Class::UTF8Columns - JPerl Advent Calendar 2009

                  Don't use DBIx::Class::UTF8Columns - JPerl Advent Calendar 2009 Perl に関するちょっとした Tips をのっけてみるよ。ちゃんと続くかな? 自分のつくったもジュールを紹介するハッカートラックということで、僕は DBIx::Class に同封されている DBIx::Class::UTF8Columns について書きます。 まず最初に、このモジュールをつかわないでください。 DBIx::Class::UTF8Columns は DBIx::Class のコアモジュールになってから、utf8 を扱う場合はこのモジュールを使うといいよという記述をいろいろなところで目にします。しかしこのモジュールがしていることを理解せずに使用すると予期せぬ不具合に悩まされるかもしれません。今日はこのモジュールを使わない方が良い理由と、その代替案を示

                  • UTF-8 対応の msysGit 1.7.10 リリース! いよいよ Windows で git できるよ!!!

                    UTF-8 対応の msysGit 1.7.10 リリース! いよいよ Windows で git できるよ!!! 先日、msysGit(Git for Windows)がいよいよ公式に UTF-8 をサポート! という記事で「UTF-8 対応のコードがコミットされた」ことをお伝えしましたが、ついに、UTF-8 対応の新バージョン、msysGit 1.7.10 がリリースされました。 いよいよ Windows でも日本語ファイル名を扱えるようになったので、「git では "詳細設計仕様書.xlsx" をコミットできないんでしょ?」とブーブーいってた人を説得できる材料はそろいました!!!! それを記念して、この記事では UTF-8 対応の msysGit 1.7.10 を試してみたブーブーいう人を黙らせるための「GUI で git する Windows 向けツール」まとめ の2本立てでお送り

                      UTF-8 対応の msysGit 1.7.10 リリース! いよいよ Windows で git できるよ!!!
                    • 吉野家HDと高島屋が日本語UTF-8メール普及コンソーシアムを設立 | スラド IT

                      ストーリー by hylom 2012年04月01日 10時00分 一方、村井純は「.junet」ドメインを計画した 部門より 株式会社吉野家ホールディングスと株式会社高島屋は、日本語メールでの UTF-8 使用を推進する団体として「日本語UTF-8メール普及コンソーシアム」の設立に合意した。 両社の正式名表記は「吉」や「高」ではなく、「つちよし」と呼ばれる吉や「はしごだか」と呼ばれる高の字を用いる。しかし、これらの文字は Unicode では表示が可能であるものの、現在の日本語メールで主流となっている ISO-2022-JP では表示させることができない。したがって、発行しているメールマガジンでは一般的な「吉」や「高」の文字を使わざるを得ない状況となっている。 現在のパソコンや携帯端末は UTF-8 を扱える OS を採用していることが多く、搭載している MUA も UTF-8 対応であ

                      • XML::SimpleのXMLinで、UTF-8 flagがonになるときとならないときがあるのはなぜでしょう?→解決 - 結城浩のはてなブログ

                        いつも教えてクンで申し訳ありません。PerlのUTF-8 flagに詳しい方に質問です。 以下のCGIをWindowsで動かしたときと、Freebsdで動かしたときに振る舞いが変わる理由を知りたいと思っています。 sample.cgi #!/usr/bin/perl use strict; use warnings; use Encode; use Data::Dumper; use XML::Simple; my $ref = XMLin('input.xml'); print "Content-type: text/html; charset=UTF-8\n\n"; print '<pre>'; print Dumper($ref); if (utf8::is_utf8($ref->{name}->[0])) { print 'ON'; } else { print 'OFF'; }

                          XML::SimpleのXMLinで、UTF-8 flagがonになるときとならないときがあるのはなぜでしょう?→解決 - 結城浩のはてなブログ
                        • 文字化け/MySQL4.1系UTF-8の場合

                          <?php require_once'DB.php'; $username = "dbuser"; $password = "dbpass"; $host     = "dbhost"; $database = "dbname"; $db = DB::connect("mysql://$username:$password@$host/$database"); if (DB::isError( $db )) { die($db->getMessage()); } // SET NAMES クエリの発行 $sql = "SET NAMES utf8"; $result = $db->query($sql); ?>

                          • UTF-8のバリデーションとモノイドと半群

                            この記事はUTF-8のバリデーションとオートマトンの続きです。 前回はUTF-8のバリデーションが8状態のオートマトン (DFA) で表現できることを見ました。状態と遷移を擬似コードで書けば次のようになるでしょう: -- 8つの状態 data State = START | TAILx1 | TAILx2 | TAILx3 | A | B | C | D -- 入力バイトに応じて次の状態を返す。次の状態が該当しなかったら Nothing を返す next :: Word8 -> State -> Maybe State +----+----+-----+----+ | a0 | a1 | ... | aN | 8ビット整数列 +----+----+-----+----+ | | | v v v +----+----+-----+----+ | m0 | m1 | ... | mN | モノ

                              UTF-8のバリデーションとモノイドと半群
                            • ウェブサイトにおける文字コードの割合、UTF-8が90%超え。Shift_JISやEUC-JPは?【やじうまWatch】

                                ウェブサイトにおける文字コードの割合、UTF-8が90%超え。Shift_JISやEUC-JPは?【やじうまWatch】
                              • Eclipse 上で UTF-8 のソースから javadoc を生成する方法 - Be an Idealistic Realist

                                UTF-8 のソースからの javadoc 生成でおこられる Eclipse から javadoc を起動する際、ソースファイルをシステムのデフォルトエンコーディングで読み込もうとします。おいらの環境ではシステムのデフォルトエンコーディングが MS932 なのですが、ワークスペースのデフォルトエンコーディングを UTF-8 にしているため、javadoc 生成時におこられてしまいます。 javadocのオプション javadoc には、エンコーディングに関して以下のようなオプションがあります。 オプション 効果 -encoding ソースファイルのエンコーディングの名前 (EUCJIS/SJIS など) を指定します。このオプションが指定されていない場合は、プラットフォームのデフォルトコンバータが使われます。 -docencoding 生成される HTML ファイルのエンコーディングを指定

                                  Eclipse 上で UTF-8 のソースから javadoc を生成する方法 - Be an Idealistic Realist
                                • iandeth. - SafariでJSON - json.jsがUTF-8な文字列をparseできない

                                  不具合 - 日本語が含まれるUTF-8文字列をparse出来ない var s = '{"key":"value"}'; var obj = s.parseJSON(); alert(obj.key); // 結果: value 通常は上記のように JSON な文字列を parseJSON() メソッドにかけてあげることで javascript オブジェクトに変換されるのですが、 この文字列にUTF-8な文字列(日本語)が含まれていると、Safariの場合に限り、うまく動作しません: var s = '{"key":"値"}'; var obj = s.parseJSON(); alert(obj.key); // 結果: undefined [ サンプルコードはこちら ] obj 自体が undefined になります。ディープに調査してないのですが、見た感じ、parseJSON() メソ

                                  • sambaの文字コードはUTF-8に設定するとベスト - サーバー技術メモ

                                    はてな人力検索への回答です。 http://q.hatena.ne.jp/1182403623 文字コードいろいろ 日本語文字コードの代表としては、「Shift_JIS」「EUC-JP」「UTF-8」があります。 このうち「Shift_JIS」と「EUC-JP」には完全な互換性がありません。 また「UTF-8」へ変換するための正式な変換テーブルもないためこれが標準というのはありません。 Shift_JIS 日本語Windows標準 EUC_JP 日本語UNIXの業界標準 UTF-8 国際規格 まだ運用を始めて間もないなら「UTF-8」のままがお奨めです。 Debianのsambaで確認しましたが、デフォルト「UTF-8」のようです。 どれを取っても若干の問題がでてくるので、国際規格を選択したほうが後々いいような気がします。 文字コード関連の設定 とりあえず「UTF-8」前提で説明します。

                                      sambaの文字コードはUTF-8に設定するとベスト - サーバー技術メモ
                                    • perl utf8→sjisで文字化け - (゚∀゚)o彡 sasata299's blog

                                      2008年07月25日23:32 Perl perl utf8→sjisで文字化け 以前のEncodeモジュールの話に関連した話なんですが、 今日、ある症状が出て困っていました。utf8を、sjisにした際に「〜(波ダッシュ?)」や「−(全角のマイナス)」が文字化けしてしまったのです(;´Д`) とりあえずその場は「Unicode::Japanese使えば大丈夫だよ」と教えていただいて対処したんですが、どうにも府に落ちなくてちょっと調べてみました。そしたらありましたよ、解決策が.。゚+.(・∀・)゚+.゚ もともと、 encode('shift_jis', decode_utf8($str)); こんな感じでutf8からshift-jisに変換していました。これを encode('cp932', decode_utf8($str)); とすることで、無事文字化けすることなく変換できました。

                                      • screenでUTF-8を表示されるにはUTF-8モードにするのが楽みたい

                                        screenで、今までutf8に対応するために.screenrcに defencoding utf8 encoding utf8 utf8 とかやって、かつ各文字コードを行き来するために bind ^U encoding utf8 utf8 bind ^E encoding eucjp utf8 bind ^W encoding sjis utf8 というようなのを設定してたんですが、DettachしてあるプロセスをAttachする毎に毎回C-t C-uとしてやらないとemacsのutf8の日本語文字列が「?」になってしまっていた。 ちゃんと設定してるはずなんだけどなぁと思っていたのですが、今日調べてみたらscreenを起動する際に「-U」オプションをつければC-t C-uしなくても表示されることを発見した。 -U Run screen in UTF-8 mode. This option

                                        • Pythonで"coding: utf-8" 書くの面倒くさいのでShellscriptでなんとかする - Qiita

                                          Help us understand the problem. What are the problem?

                                            Pythonで"coding: utf-8" 書くの面倒くさいのでShellscriptでなんとかする - Qiita
                                          • UTF-8サポートを強化したNTFS互換ドライバ「NTFS-3G 2009.1.1」 | パソコン | マイコミジャーナル

                                            NTFS-3Gプロジェクトは22日 (米国時間)、オープンソースのNTFSドライバ最新版「NTFS-3G 2009.1.1」をリリースした。対応プラットフォームはLinuxやMac OS Xなど各種UNIX系OS、動作にはユーザランドファイルシステムのFUSE、およびMacFUSEなどの移植版が必要。 バージョン命名ルールの変更後初のリリースとなる今回は、ビルトインの機能としてUTF-8の透過変換を実装。これまでマウント時に指定していた「locale=」は必要なくなり、常にUTF-8が使用されるよう仕様が変更された。一部のファイルにアクセスできないことがあるなど、マルチバイト文字を含むファイル名に起因する問題も解決されている。 Mac OS Xへの対応も強化。タイムスタンプ機能がサポートされ、ファイル作成時における日付設定や作成後の日付情報取得が可能になった。 NTFS-3Gは、FUSE

                                            • UTF-8環境での eclipse findbugs-plugin の文字化け解消 - ihirokyの日記

                                              日本語メッセージがShift-JISでエンコードされており、かつ適切にハンドリングされていないようなのでUTF-8環境のeclipseでfindbugsを実行すると文字が化ける(findbugs-1.3.9)。簡易処置として、すべての日本語メッセージファいるをすべてUTF-8に変換する。ECLIPSE_HOME を eclipse インストールディレクトリ、findbugs-pluginがeclipseにインストールされているものとして、以下のコマンドを実行。 $ cd ECLIPSE_HOME/plugins/edu.umd.cs.findbugs.plugin.eclipse_1.3.9.20090821/ $ mkdir tmp $ cd tmp $ jar xvf ../findbugs-plugin.jar $ find . | grep _ja ./edu/umd/cs/fin

                                              • ちゃんとUTF-8 flagを処理する : 404 Blog Not Found

                                                2005年09月30日14:33 カテゴリLightweight Languages ちゃんとUTF-8 flagを処理する ちょ、ちょっとまったぁ。 naoyaのはてなダイアリー - XML::Parser を Hack して utf8 フラグ問題から解放される ちゃんとやりたい方は、 Unicode::RecursiveDowngrade Object::Apply あたりを使いましょう。 これ、「ちゃんとした」方法って言われちゃうとなあ。 Perl 5 Portersのラフコンセンサスとしては、UTF-8 flagの処理のガイドラインは、 文字列としての処理はflagを付けて バイト列としての処理はflagを落として というもので、翻訳すると 内部で扱いはflag付き 外部に出す寸前でflag落とし ということになります。よって「いつflagを落とすか」は、「出力時」というのが望まし

                                                  ちゃんとUTF-8 flagを処理する : 404 Blog Not Found
                                                • fudist - UTF-8 → cp932(Shift_JIS)変換表

                                                  UTF-8にはcp932(Shift-JIS)に存在しない文字があるため、cp932(Shift_JIS)前提のシステムで使用することができないことがあります。 基本的に ♥ ♠ ♦ ♣ のようにcp932(Shift_JIS)に存在しない記号は (はぁと) や外字などへ適当に変換するしかありません。 ただし実際にはcp932(Shift_JIS)でも置換可能な文字だけが問題で変換エラーになっているケースが多数あります。 本ページでは文書ファイルをUTF-8からcp932(Shift-JIS)に変換するとき単純置換してさほど問題ない文字の対応表を記します。 cp932(Microsoft定義のShift_JIS) と Shift_JIS とは厳密に言うと ~ など一部の文字コードが異なります。 このためWindowsとLinuxでunicode(UTF-8)へ変換した場合異なる文字コードに

                                                  • auブラウザ、いまだにUTF-8が使えず! | 株式会社シンメトリック公式ブログ - 携帯開発から生まれる技術情報

                                                    キャッシングをご利用したら借りた分に利息を付けて返済することが必要です。昔の消費者金融ではグレーゾーン金利と言って利息制限法の上限以上かつ出資法の上限以下で貸付しているところがあり、利息20%以上何て言う高金利もありましたが、最近では利息制限法の上限を超えてはならないと決められています。 もしキャッシングでお金を返せなくなった場合は職場に電話連絡されることはありません。自宅に取り立てに来て厳しく催促されることもありません。返済を滞納してしまった時は自宅へ返済が確認できないとお電話が掛かってくることが多いです。 キャッシング会社では遅延損害金というペナルティーを設けていますが、いきなり課せられることは少ないです。しかし自宅へかかってきたお電話後にも返済に応じないと遅延損害金が発生します。遅延損害金は通常のキャッシングの金利より高めに設定されており、遅れれば遅れるほど利息のように負担が増えてし

                                                    • Shift_JIS「もしかして・・・・・・」 UTF-8「私たち……」 : ふぇー速

                                                      引用元: http://tomcat.2ch.sc/test/read.cgi/livejupiter/1514990323

                                                        Shift_JIS「もしかして・・・・・・」 UTF-8「私たち……」 : ふぇー速
                                                      • Excel 2016でUTF-8のCSVファイルがサポートされるようになりました。 | 初心者備忘録

                                                        Power Automate for desktop 2024.04.5 [Power Automate for desktop]Copilotでフローの説明文を生成できるようになりました。 Power Automate for desktop(PAD) バージョン 2.43 でCopilotを利用した新たな機能として、フローの説明文を生成する機能が追加されました。コンソールの「自分のフロー」タブから説明を生成したいフローのプロパティを開き、「説明の生成を Copilot に任せる」ボタンをクリックすると、フローを開くことなく、Copilotにより説明文が生… Power Automate for desktop 2024.04.5 [Power Automate for desktop]Python 3スクリプトを実行できるように… Power Automate for desktop(

                                                          Excel 2016でUTF-8のCSVファイルがサポートされるようになりました。 | 初心者備忘録
                                                        • Googleトランジット(http://www.google.co.jp/transit)で、無茶な歩き方を指示される例をピックアップしてください。 例:http://www.google.co.jp/transit?ie=UTF8&f=d&.. - 人力検索はてな

                                                          Googleトランジット(http://www.google.co.jp/transit)で、無茶な歩き方を指示される例をピックアップしてください。 例:http://www.google.co.jp/transit?ie=UTF8&f=d&saddr=%E5%A4%A9%E6%96%87%E9%A4%A8%E9%80%9A&daddr=%E4%BD%90%E5%A4%9A%E5%B2%AC&ttype=dep&date=4/23&time=21:27&z=10&ll=31.299675,130.58075&spn=0.767416,1.274414&om=1 6時間5分歩くように指示され、さらに海まで歩かされる。

                                                          • utf8オンな文字列のバイト数の取得方法 - Unknown::Programming

                                                            use utf8している時のlengthは文字数を数えてしまうけど、それ以外のときは、バイト数を数えるそうだ。ところで、以下のようにしたらutf8のバイト数が取れるんじゃないかと思うんだけど、あまりutf8文字列のバイト数に需要がないのか、ググっても例が出てこない。 何か見おとしているのかもしれないな。 use utf8; my $bytes = length unpack('a*',$utf8_str); use utf8での文字列のバイト数 これ、僕も昔取得方法わかんなくて困ったことがある。 ってことで啓蒙活動しとく。 bytes::lengthを使います。 use utf8; require bytes; my $bytes = bytes::length $utf8_str; 「require bytes」が大事ね「require bytes」が。もし「use bytes」しちゃっ

                                                              utf8オンな文字列のバイト数の取得方法 - Unknown::Programming
                                                            • Content-type:text/htmlのcharset指定はUTF-8,utf-8,utf8どれが正しいの?調べてみた。 · DQNEO日記

                                                              Home Subscribe UTF-8? utf-8? UTF8? utf8? 気になったので調べてみました。 結論 公式名称は "UTF-8" である。 UTF-8, a transformation format of ISO 10646 大文字小文字は区別されない。 UTF-8でもutf-8でもどちらでもいいようです。 " HTTP character sets are identified by case-insensitive tokens. " Hypertext Transfer Protocol -- HTTP/1.1 したがって、 Shift_JIS/shift_jis EUC-JP/euc-jp どちらでもOKということになります。 気になるあのサイトでは? 世の中的にはこうなっていました。(2011/8/17現在)

                                                                Content-type:text/htmlのcharset指定はUTF-8,utf-8,utf8どれが正しいの?調べてみた。 · DQNEO日記
                                                              • UTF-8コード表(1)

                                                                UTF-8の仕組み UTF-8は1~4バイト(初期の定義では6バイトまで)の可変長コード Unicodeスカラ値, UTF-16を含め、詳しい説明は Unicode にあります。 コード カテゴリ 備考

                                                                • Excel CSV形式ファイルにおける今どきUTF-8文字コード問題の傾向と対策

                                                                  環境依存文字を含むデータをCSV形式でやりとりするには 人名や地名の中には、環境依存文字(異字体など)が含まれていることがある。環境依存文字を含むExcelのシートをCSV形式でやりとりしなければならない場合、文字コードにUTF-8を指定するとよい。なお画面の住所録は、「テストデータ・ジェネレータ」によって作成した架空のサンプル用のデータを記事用に修正したものである。 「Microsoft Excel(エクセル)」で作成した表を、CSV形式で保存し、別のアプリケーションに読み込ませることはないだろうか。また、取引先にデータを送る際に、XLSX形式ではなく、CSV形式が要求されることもあるだろう。逆にCSV形式で受け取ったデータをExcelで読み込んで処理したいというケースもあり得る。 このような場合、環境依存文字(機種依存文字)が含まれていると、CSV形式に変換する際に、正しく文字が出力さ

                                                                    Excel CSV形式ファイルにおける今どきUTF-8文字コード問題の傾向と対策
                                                                  • ExcelでUTF-8のCSVを開く方法 (CodeZine編集部ブログ)

                                                                    Unicodeが実装レベルで登場してからずいぶんたった今では、UTF-8のファイルを普通に扱うことが多くなりました。ほとんどのアプリケーションも何なくUTF-8のファイルを読むことができるようになっています。 ところが、です。最近UTF-8のCSVファイルで作業していて、これをダブルクリックしてExcelで開くと文字化けすることに気づきました。 最初はUTF-8からExcelが好きそうなS-JISに変換していたのですが、ちょっと複雑なデータになると「変換できない文字があります」というアラートがでます(長母音記号などが鬼門)。できればUnicodeのままでExcelに読み込ませられないものか。 以前よりマイクロソフト社製品はすべて内部的にはUnicodeを全面的にサポートしているはずなので、読み込ませられないわけはないはず…とおもって検索したりしていたところ解決方法がわかりました。 <解決方

                                                                    • UTF-8文字コードファイルの扱いTips

                                                                      最近は、UTF-8文字エンコードしたファイルを利用することが多くなりました。GnomeなどのGUI環境を利用している場合は、UTF-8対応のエディタが標準で備わっているため問題ないですが、コンソール環境などでは、必ずしもLinuxで快適に利用できる環境が最初から揃っているとは限りません。 そこで、UTF-8文字エンコードされているファイルを扱う環境を作成していきます。 'cat'や'less'コマンドを皆さん利用されているでしょう。しかし、'cat'や'less'ではUTF8エンコードされたファイルを正しく表示できません。UTF-8ファイルを利用する場合は、これに変わるコマンドとして、'lv'コマンドを利用しましょう。 Debianでは、"apt-get install lv"で利用できるようになります。 例) %lv [FileName]

                                                                      • FreeBSDで日本語環境(UTF-8対応)を整える | レンタルサーバー・自宅サーバー設定・構築のヒント

                                                                        FreeBSDで日本語環境(UTF-8対応)を整える

                                                                        • Rubyで数値文字参照をUTF-8にする - くふんを狙え

                                                                          どういうわけか書いた、数値文字参照をUTF-8にするスクリプトがあったのであげてみる。完成品はラストの一行だけなんですけどねー、ねー。 $KCODE='u' # 文字は 16bit と仮定 s1 = '人生オワタ'.unpack('U*').collect {|c| c >= 255 ? '&#' + c.to_s + ';' : c.chr }.join s2 = '\(^o^)/'.unpack('U*').collect {|c| c >= 255 ? '&#x' + c.to_s(16) + ';' : c.chr }.join s = s1 + s2 puts '元データ ("人生オワタ"は10進,"\(^o^)/"は16進)' puts s #=>&#20154;&#29983;&#65397;&#65436;&#65408;&#xff3c;(^o^)&#xff0f; puts

                                                                            Rubyで数値文字参照をUTF-8にする - くふんを狙え
                                                                          • HTML文書はUTF-8に書き換えないとダメ? - らいちのヒミツ基地

                                                                            Introduction こんにちは。阿豆らいち(@AzuLitchi)です。 今回はhtml標準がutf-8に・・・という話について調べてみました。 とうじょうじんぶつ 阿豆らいち: フリーランスのデザイナー。初めて使ったhtml編集ソフトは「クラリスホームページ」。 ミンスクさん: らいちの妻。有能。 HTML文書のエンコーディングはUTF-8に決定? id:momdo さんのこちらの記事の件を調べてみたのでまとめました。 HTML文書は文字エンコーディングUTF-8でなければなりません - 水底の血 文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。 4.2.5.5 文書の文字エンコーディングを指定する - HTML Standard 日本語訳 リンク先のHTML Standard 日本語訳に

                                                                              HTML文書はUTF-8に書き換えないとダメ? - らいちのヒミツ基地
                                                                            • Webページの文字コードをUTF-8にする方法(前編)

                                                                              • #PHP でもutf8_decodeは使ってはならない

                                                                                (Last Updated On: 2009年9月22日)Twitterで書いた方が良いようなエントリですが、たまには良いでしょう。 #perl – utf8::decode()ではなくEncode::decode_utf8()を使うべき理由 という記事がありました。PHPにも似た関数、utf8_decodeがあります。PHPでも使ってはなりません。日本人というよりマルチバイト圏で使っている人はほとんどいないはずです。理由はコードを見れば一目瞭然です。 /* All the encoding functions are set to NULL right now, since all * the encoding is currently done internally by expat/xmltok. */ xml_encoding xml_encodings[] = { { "ISO-

                                                                                  #PHP でもutf8_decodeは使ってはならない
                                                                                • DBDでUTF8 flaggedな文字列を返す - hide-k.net#blog

                                                                                  \mysql_enable_utf8 => 1 で DBIC::UTF8Columns 要らなくなるっぽい - 僕ト云フ事@はてな出張版 恥ずかしながら知りませんでした。 DBIx::Classの場合、DBIx::Class::UTF8Columnsを使ってutf8_columns()でUTF8フラグを立てたいカラムを指定するのですが、特定のカラムだけにUTF8フラグを立てるというのは稀で、全ての文字列のカラムに立てるのが多くの場合だと思います。 ので、DBDのレイヤーで吸収するこの方法が個人的にもベストプラクティスだと思います。 vkgtaro++ 備忘でまとめておくと各DBDの接続オプションで mysql: mysql_enable_utf8 postgresql: pg_enable_utf8 sqlite: unicode に1を指定することにより、全ての文字列のカラムの値にUTF