タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字コードとprogrammingに関するt-tanakaのブックマーク (4)

  • 文字列を反転させたい|nona

    こんにちは。徒然なるままにTweetを眺めていたら、Tanakaさんがこのようなことを呟いていました。 そういやRustのStringにreverseメソッドないなと思ったけど、まあよく考えたらUTF-8で文字逆転させるとか地獄のような話になるしそもそも長さが変わるケースとかあったりしそうで怖いわな・・・(´・_・`) — Hideyuki Tanaka (@tanakh) May 1, 2021 背景等はよくわからないですが、文字列の反転というのは確かに難しい問題ですし、どう難しいのかというのを、ちょっと真面目に考えて解説してみました。というノートです。 文での表記についてこれから文字とそのバイト表現の話をしていきます。文字のエンコードの方式で同じ数値でも色々意味が分かれてしまいますので、文では以下のように表記することにします。 Unicodeコードポイント(以下、単にコードポイント

    文字列を反転させたい|nona
    t-tanaka
    t-tanaka 2021/05/02
    「Javaをお使いでしたら、BreakIteratorのCharInstance」最新のJava使えるのならばね。Java8で,これと同機能を実装しないといけないこととかあるんですよ。地獄ですよ。
  • my slides for #pyconjp : 404 Blog Not Found

    2012年09月16日15:15 カテゴリLightweight Languages my slides for #pyconjp ご来場ありがとうございました。 残念ながら参加できなかったみなさん、私のスライドはこちらです。 http://www.dan.co.jp/~dankogai/pyconjp2012/python.html 話題ゆえ絵文字がそのまま使われているので、ブラウザーを選ぶかも… Dan the Speaker Thereof 「Lightweight Languages」カテゴリの最新記事

    my slides for #pyconjp : 404 Blog Not Found
    t-tanaka
    t-tanaka 2012/09/18
    そう,Pythonをさわって最初に感じたのが文字コードまわりの杜撰さ。
  • 2010-02-14 - 未来のいつか/hyoshiokの日記

    例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ/絵文字… JIS X0208やJIS X0213の解説などは圧巻である。書籍にはWebにない利点がある。Webには即時性があるが、文字コードの解説においては、即時性はそれほど求められない。字体ないし字形の差異についてWebではその字体ないし字形がなければ表現しようがないが、書籍であれば細部までこだわって表現できる。 例えば、包摂された「辻」という字の一点しんにょうと二点しんにょうの字体の差はWe

    2010-02-14 - 未来のいつか/hyoshiokの日記
  • バイナリとテキストの本当の違い : 404 Blog Not Found

    2009年04月09日00:15 カテゴリLightweight LanguagesCode バイナリとテキストの当の違い うーむ、Wikipediaですら「見た目」の違いしか説明していない。 バイナリ - Wikipedia コンピュータが扱うすべてのデータはバイナリデータ(バイトの並び)であり、プレーンテキスト(または単にテキスト)もバイナリデータの一種ではあるが、通常バイナリとテキストは対比して用いられる。テキストとはデータの内容すべてを人間が読んで理解できる (human-readable) 表現形式を指し、バイナリとはそうでない表現形式を指すことが多い。 Binary file - Wikipedia, the free encyclopediaA binary file (.bin) is a computer file which may contain any type

    バイナリとテキストの本当の違い : 404 Blog Not Found
    t-tanaka
    t-tanaka 2009/04/11
    用語の定義・用法が一般と違うので,ぱっとみ,でたらめを言っているように見えるが,論旨自体は正しい。
  • 1