[B! encoding] [2ページ] a2ikmのブックマーク

a2ikm id:a2ikm

encodingに関するa2ikmのブックマーク (110)

ここ（Windows）に「☭」という名前のファイルがあるじゃろ？ - Qiita
Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up
a2ikm 2014/07/22
Firefoxでやっと読めた

encoding

golang
リンク
Guessing a String's Encoding Under Ruby 1.9
We ♥ web applications! At mobalean we love to build innovative web services for Japan and the world. Our experience will help transf orm your ideas into successful online services. » more Mobalean is lead by Henri Servomaa, the original founder and mobile developer. At Mobalean we strive to develop services which are loved by our clients and users. By working in an agile manner, quickly adapting to
a2ikm 2014/05/16
ruby

encoding

tips
リンク
Ruby 1.9で文字コードの自動判別を行う
たまにRubyの話題でも。 Ruby 1.9で文字コードの自動判別をさせようとおもったら、意外に良いライブラリが見つからなくて苦労しました。結局ICUをbindingした、charlock_holmesがちゃんと使えたので、メモです。 OSXで使う場合は、下記の様にしてICUライブラリをインストールします。Linuxでは適当なパッケージシステムを使ってインストールしてください。 curl -O http://download.icu-project.org/files/icu4c/4.8.1.1/icu4c-4_8_1_1-src.tgz tar xvzf icu4c-4_8_1_1-src.tgz cd icu/source ./runConfigureICU MacOSX --with-library-bits=64 --disable-samples --enable-static
a2ikm 2014/05/16
ruby

encoding

gem
リンク
ExcelでUTF-8エンコーディングされたCSVファイルを開く方法 - 小さい頃はエラ呼吸
photo credit: gonzalo_ar via photopin cc はじめにこのエントリでは、ExcelでUTF-8エンコーディングされたCSVファイルを開く方法を紹介します。 Excel VBAのプログラミングのツボとコツがゼッタイにわかる本―最初からそう教えてくれればいいのに!Excel2007/2003対応posted with amazlet at 12.12.23立山秀利秀和システム売り上げランキング: 1,346 Amazon.co.jp で詳細を見る結論以下のような３つの方法があります。拡張子をcsvからtxtに変更してから開く。 CSVファイルをBOMつきのUTF-8ファイルに保存しなおしてから開く。 CSVファイルの保存形式をANSIに変更してから開く。 ExcelはCSVファイルをShift_JISで開こうとする Excelは、CSVファイル
a2ikm 2014/05/15
BOMを付ける、もしくは「データ」→「外部データの取り込み」で開く

excel

csv

utf8

encoding
リンク
UTF8にはサロゲートペアはありませんが異字体セレクタがあるので最大８バイトしかも・・・ | レビログ　(Make a little happier) 13周年+2i年
レビログ　(Make a little happier) 13周年+2i年レビログの半分は管理人の独断と偏見でできています。残りの半分は現在残　希少につき　入荷待ちです。旧称　貧乏だけど心は萌え : UTF8にはサロゲートペアはありませんが異字体セレクタがあるので最大８バイトしかも・・・ 2014年4月16日 Category > 6_日記 > うだうだ日記 > TAG( ) Comment : 1 (link this page) 31bitまで表現できるのでサロゲートペアが必要ない Unicodeを斬りたい – Yahoo! JAPAN Tech Blog 残念ながらUTF8にも異字体セレクタというものが有り。ユニコード＋異字体セレクタという構造を取り、異字体セレクタはU+FE00〜U+FE0FおよびU+E0100〜U+E01EFにマッピングされているので３バイトまたは４バイトのU
a2ikm 2014/04/17
utf8

encoding

charset
リンク
GitHub - brianmario/charlock_holmes: Character encoding detection, brought to you by ICU
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
a2ikm 2014/02/24
エンコーディング判定、rchardet19よりもこっちのがいいのかな

ruby

encoding
リンク
UTF-8にもいろいろある - ザリガニが見ていた...。
前回からの続き。改行コードの違いを体感してみる - ザリガニが見ていた...。文字エンコードとロケールを体感する - ザリガニが見ていた...。改行コードの違いも知った。文字コードとロケール、ターミナルの言語環境との関係も知った。これで文字にまつわる悩みとはおさらばできると思ったら、まだダメだった...。実験環境 OSX 10.8 Mountain Lion以前((OSX 10.9 Mavericksでは、Mac仕様なNFDのUTF-8を表示しようとするとエラーになってしまったため、10.8以前の環境で実験した。Assertion failed: (width > 0), function conv_c, file /SourceCache/shell_cmds/shell_cmds-175/hexdump/conv.c, line 137. ** ** Abort trap: 6
a2ikm 2013/11/25
そうか、UTF-16の世界に逃げればいいのか

utf8

encoding

mac
リンク
ActiveRecordでデフォルトの照合順序を変更する - Qiita
MySQLには文字列の照合順序(collation)というのがあって、MySQL側でのcharset utf8のときのデフォルトの照合順序はutf8_general_ciです。 ActiveRecord::Migrationでは明示的に照合順序を指定しない場合、charset utf8で照合順序utf8_unicode_ciのデータベースを作成しますが、これは少なくとも日本語圏では多くの人が期待する挙動ではないと思われるので注意が必要です。たとえば、以下のようなファミリーテーブルをrake db:migrateすると # coding: utf-8 class CreateFamilies < ActiveRecord::Migration def change create_table :families do |t| t.string :name t.string :relation
a2ikm 2013/10/02
activerecord

mysql

rails

qiita

collation

charset

encoding

kamipo
リンク
【Objective-C】URL encode/decodeする方法（URLエンコード：修正の必要ありコード）
以下のような方法でURLエンコード／デコードできると書かれているサイトが沢山あるが、大嘘つきもいい所だ。特殊文字を取りこぼしまくってる。 //encoding NSString *escapedUrlString = [plainString stringByAddingPercentEscapesUsingEncoding:NSASCIIStringEncoding]; //decoding NSString *decodedUrlString = [escapedUrlString stringByReplacingPercentEscapesUsingEncoding:NSASCIIStringEncoding]; 多分これで全部フォローできていると思うが、もし足りない文字があればコメントで教えて欲しい。 //encoding NSString *escapedUrlString =
a2ikm 2013/08/09
objective-c

encoding

url

nsstring

nsurl
リンク
Rubyのエンコーディングその2 - tmtms のメモ
この前「Rubyのエンコーディング」という記事を書いたのですが、それをネタに 8/25 の NSEG で発表しました。 Rubyのエンコーディング from Masahiro Tomita この中で、エンコーディングが原因で予期しないところで落ちてしまうことが結構あるという話もしたんですが、今回はプログラムが落ちないようにするにはどうすればいいかを考えてみます。エンコーディングが原因で落ちてしまうのは大体次のパターンのようです。文字列や正規表現のエンコーディングが異なる文字列中に不正な文字が含まれている文字列や正規表現のエンコーディングが異なる正規表現をリテラルで生成していれば、エンコーディングは敢えて指定しない限りは普通はスクリプトエンコーディングになってると思うので、問題は文字列の方です。特にファイルから読み込んだ文字列のエンコーディングが何になっているかに注意しましょう。
a2ikm 2013/05/15
valid_encoding?知らなかった

ruby

encoding

tmtms
リンク
http://www.unicode.org/Public/UNIDATA/Blocks.txt
a2ikm 2013/04/12
unicode

encoding

charset
リンク
Emoji Symbols: Background Data
Background data for Proposal for Encoding Emoji Symbols L2/09-027R Date: 2009-Feb-06 Authors: Markus Scherer, Mark Davis, Kat Momoi, Darick Tong (Google Inc.) Yasuo Kida, Peter Edberg (Apple Inc.) The carrier symbol images in this file point to images on other sites. The images are only for comparison and may change. See the chart legend for an explanation of the data presentation in this chart
a2ikm 2013/04/10
unicode

encoding

google

emoji
リンク
「これは絵文字ですか？」「はい、Unicode6.0です」 | Geisha Tokyo Engineers' Blog
スマートフォン時代の絵文字の取り扱い方は？既存のサービスを持っているところは現状維持が妥当とは思いますが、これから新規にサービスを立ち上げようとする場合はどのようにするのが良いでしょうか？方法は、 Unicode6.0標準をそのまま使用する Unicode6.0標準の下位16bitを使うのどちらかかと思います。なるべくなら、前者をおすすめします。理由その1 すべての絵文字を網羅している 3キャリアの絵文字では相互に変換できない絵文字が存在するため、どうしても特定のキャリアで使えない絵文字が出来てしまいます。 Unicode6.0であれば、３キャリアの絵文字 => Unicode6.0への変換はもれなく行うことができます。またUnicode6.0 => 3キャリアの絵文字へは変換できない場合もありますが、絵文字の名前が定義されているので絵文字の変わりにその名前を表示することも可
a2ikm 2013/04/10
android

encoding

google

emoji

ios

unicode
リンク
Unicode 6.0絵文字対応Encode::JP::Emoji 0.60をリリース(Perl) Kawanet Blog II/ウェブリブログ
「ウェブリブログ」は 2023年1月31日をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 BIGLOBEのサービス一覧
a2ikm 2013/04/10
emoji

unicode

perl

encoding
リンク
Table for Working Draft Proposal for Encoding Emoji Symbols
The images in this file point to images on other sites. The images are only for comparison and may change. See the chart legend for an explanation of the data presentation in this chart. Symbol ID Symbol Name & Annotations DoCoMo KDDI SoftBank Google
a2ikm 2013/04/10
emoji

encoding

unicode

google

charset
リンク
Unicodeで「漢字」の正規表現 – ものかの
改訂：2017/07/22 Unicode 10.0に合わせて書き直し。正規表現を簡易にしようとしてやりすぎていたのを修正。改訂：2023/03/21 U+30000以降を追加。InDesignの正規表現を追記。正規表現で漢字の範囲指定をする場合、Unicodeではどうするかが悩ましいところです。 Unicodeの漢字の範囲として [一-龠] にしている例を見かけます。しかしこれは旧規格JIS X 0208の漢字が含まれる範囲をUnicodeの中から切り出しているだけです。互換漢字ブロックをまるごと取りこぼしているので、WindowsのシフトJIS（CP932）の拡張漢字に当たるものが含まれていません。現規格JIS X 0213の第３・第４水準漢字も考慮されていません。簡易な範囲指定だとしても、新常用漢字の「𠮟」が含まれておらず、今から見るとあまりに時代遅れです。 Unicodeのす
a2ikm 2013/04/10
Unicodeスクリプト

unicode

encoding

regexp
リンク
MODULE.JP - 日本語に絡むUnicodeブロックとスクリプト(正規表現)
といった感じ。ちなみにjava.util.regexとPerlのUnicodeブロックは接頭子Inを使うが、.NETの場合は接頭子Isを使う、という差異があります。 Unicodeスクリプトとブロックの違いがビミョーに見えるけど、ブロックがコードブロックをゴリッと指定したものに対して、スクリプトは特定言語に関係する文字の種類を直接指定するものなのでブロックよりも断定的、って感じで見れば良かなと。ちなみにUnicode関連のドキュメントによるとUnicodeプロパティとスクリプトで日本語の文章を表そうとすると m/(?:(?:\p{Hiragana}|\p{Katakana}|\p{Han}|\p{Latin}|\p{Common}) (?:\p{Inherited}|\p{Me}|\p{Mn})?)+/x; こんな感じになるそうな。実際流通している文章はこれより多様なので現実とは微妙に乖離
a2ikm 2013/04/10
\p{Latin}は数字を含まないような

unicode

regexp

programming

encoding

charset
リンク
perl - 最速のUTF-8処理法 : 404 Blog Not Found
2013年03月04日14:45 カテゴリTipsLightweight Languages perl - 最速のUTF-8処理法 Perl Cookbook (English, Kindle Ed.) Christiansen / Torkington [邦訳: Perlクックブック] というわけで解説。 2013/03/04:Unicode::UTF8 がガチ爆速すぎる - bayashi.net encode より decode のが差が大きい感じ。encode だけだと、文字列長くなると Encode の方が速いっぽい。まずは改めて検証してみましょう。 https://gist.github.com/dankogai/5079930 確かにその通りになっています。Unicode::UTF8はEncodeはおろかPerl組み込みのutf8::decodeより高速なのか(文字列をコピ
a2ikm 2013/03/04
perl

unicode

encoding
リンク
Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話 : sonots:blog
a2ikm 2013/02/18
encoding

ruby
リンク
ActiveSupport::Multibyte::Chars
Active Support Multibyte Chars Chars enables you to work transparently with UTF-8 encoding in the Ruby String class without having extensive knowledge about the encoding. A Chars object accepts a string upon initialization and proxies String methods in an encoding safe manner. All the normal String methods are also implemented on the proxy. String methods are proxied through the Chars object, and
a2ikm 2013/02/05
activesupport

encoding
リンク
前のページ 1 2 3 4 5 6 次のページ