並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 77 件 / 77件

新着順 人気順

文字コードの検索結果41 - 77 件 / 77件

  • 文字化け対策:VSCodeで文字コードを自動判別する設定

    Visual Studio Codeのデフォルト文字コードはUTF-8となっており、日本語のShift-JISなどのテキストファイルを開くと文字化けして表示されます。 拡張子ごとに文字コード設定を変更などといったことは面倒なので、VSCodeに文字コードを自動判別してもらう方が楽です。以下設定方法です。 VisualStudio Codeで文字コード自動判別設定方法 ファイル > ユーザ設定 > 設定 をクリックする。 表示された設定ウインドウの上部にあるテキストボックスに「files」と入力。 リストアップされた中から「Files: Auto Guess Encoding」の項目を探し出し、チェックを入れる。 文字化け表示されているファイルは一旦閉じてから再度開くと文字化けが解消されている。 ファイルの内容によっては自動判別がうまくいかない場合ももちろんあるが、大抵はここの設定で問題ない

      文字化け対策:VSCodeで文字コードを自動判別する設定
    • PowerShell起動時、文字コードをUTF-8に変える方法 - Qiita

      Goal ショートカット設定でPowerShell起動時に文字コードをUTF-8に変える。 経緯 プログラムをコンソールから実行した時、 日本語が含まれていると文字化けが 発生します。 特にWindowsでは、UIの文字コードを UTF-8にするためには、システム全体の 表示言語を英語にする必要があり、 UIは日本語、文字コードはShift-JIS (CP932、Windows-31J)を妥協して 使っている方が多いと思います。 プログラムをコンパイルして実行する前に、 chcp 65001を打ち込んで文字コードを 変える儀式を繰り返すことは無駄だと 気付いた時、即座にリンク先の中に 下記の内容を記述しましょう。 手順 PowerShellショートカットのプロパティを開く。 リンク先を編集する。 プロパティのOKボタンをクリックする。 詳細説明 PowerShellのショートカットの場所を

        PowerShell起動時、文字コードをUTF-8に変える方法 - Qiita
      • なにやら文字コードについてMSが言ってるようなのでツッコミ入れておこうと思う|JunTajima

        ツッコミポイント・Windowsにおける外字ってそういうのを多用してるのはどうせお役所とかだろうからそっちに直接言ったらどうか ・たかが外字持って行っただけでOSのハングアップやブルースクリーンって何だw どうせUnicodeのPUA使ってるだけだろう ・Unicodeで文字が定義されてるかどうかとそいつが手元の環境で出せるかどうかは別問題だ。フォント入れろフォント ・MacでShift_JISのファイル読めないんてことはないよ。cp932(JISX0208のMSによるオレオレ拡張)依存の丸数字が化けたりするけど ・OneDriveのポンコツ実装をユーザーのせいにするなw ・お前のとこの「メモ帳」のデフォルト保存文字コードが長らくcp932だったからずっとShift_JISが残っているのだぜ ・お前のとこの表計算ソフトでCSVをcp932決め打ちで開く挙動どうにかしろ ・お前のとこの圧縮解

          なにやら文字コードについてMSが言ってるようなのでツッコミ入れておこうと思う|JunTajima
        • Hideyuki Tanaka on Twitter: "文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY"

          文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY

            Hideyuki Tanaka on Twitter: "文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY"
          • PowerShellの文字コードについて解説!文字化けで困らないための対処法 | テックマガジン from ネプラス

            PowerShellの文字コードとは? PowerShellはMicrosoftが開発したシェル機能です。シェルとはウィンドウでコマンドを入力して色々な処理ができる機能です。Windowsには以前からコマンドプロンプトと言うシェルがありますが、PowerShellはそれの機能強化版と言えます。 文字コードは文字を表現するルールです。文字にはそれぞれ番号がついていて、コンピュータの内部では、文字列は数値として処理されていますが、その番号の付け方のルールを文字コードと言います。 PowerShellを使うにあたり、文字コードをどう扱うかをこの記事で解説します。 US-ASCIIは文字コードの基本 PowerShellでの文字コードの扱いを解説する前に、まず文字コードについて知っておきましょう。たくさんある文字コードの中で、知っておくべきものは4つあります。まず1つめはUS-ASCIIです。 U

              PowerShellの文字コードについて解説!文字化けで困らないための対処法 | テックマガジン from ネプラス
            • Rubyだけで文字コード変換を実装する - Eggshell

              Ruby Advent Calendar 2021 - Qiita の5日目の記事です。 こんにちは。ima1zumiです。 私はRubyKaigi Takeout 2021 で Dive into Encoding というタイトルでオレオレ文字コードを作って文字コードを学ぶ話をしました。 その中で、C拡張のgemとして自作文字コードの Encoding::IROHA をRubyで使えるようにしました。 それがこちらです。 https://github.com/ima1zumi/encoding_iroha/ このgemを使うことで、みなさんのお手元でもEncoding::IROHAという文字コードが使えるようになります。 どう作るかとかそういった話はRubyKaigi Takeout 2021のアーカイブをご覧ください。 ですが思ったのです。C拡張のgemってビルド要るからめんどくさいで

                Rubyだけで文字コード変換を実装する - Eggshell
              • 「わたなべ」の漢字の多さで如実にわかる、デジタル化を阻む文字コード問題 自分の名前がデジタル化できない日本語の問題を認識しているか? | JBpress (ジェイビープレス)

                私が書いた「マイナンバーの呪い」の反響によって、多くの思いもよらない意見や主張が寄せられ、筆者としても非常に参考になった。中でも、「番号などなくても、氏名・住所・性別・生年月日で個人を特定できる」と信じている人がいることに驚いた。マイナンバー制度創設のきっかけとなった年金納付記録問題を知らないのだろうか。 【関連記事】 ◎1回目「デジタル庁が発足して1年、ちっとも進まないデジタル化の根源に横たわる呪い」(https://jbpress.ismedia.jp/articles/-/72056) ◎2回目「デジタル化のメリットが反映されていないマイナンバー制度の致命的欠陥」(https://jbpress.ismedia.jp/articles/-/72230) ◎3回目「マイナンバーカードと健康保険証の一体化、今のままでは大惨事が起きかねない」(https://jbpress.ismedia

                  「わたなべ」の漢字の多さで如実にわかる、デジタル化を阻む文字コード問題 自分の名前がデジタル化できない日本語の問題を認識しているか? | JBpress (ジェイビープレス)
                • 現代のプログラマが40年前に転移してしまうと「メモリが8KB?画面幅が40文字?コードは紙に…?」となってなにも無双できなさそう

                  きしだൠ(K1S) @kis 現代プログラマが40年前くらいに転移してしまうと「え?メモリ8KB?え?画面幅40文字?え?コードは紙に。。。え?」とかになってなんも無双できなそう 2022-07-15 16:24:37 きしだൠ(K1S) @kis 「この場合はこういうアルゴリズムで。。。処理対象の倍のメモリが必要。。。無理。。。」 「よし、再帰で簡単に書けるぞ。。。スタックは64バイトまで。。。はい。。。」 2022-07-15 16:35:24 きしだൠ(K1S) @kis 「画面が狭いので紙で考えておいて。。。入力。打ち終わった!動かすぞ!あ、コンパイルに15分、なるほど。じゃあ休憩するか」 「うごいた!けどうごかない!どこが悪いんやろ。デバッグコードを仕込んで。。。おくメモリの余裕がない!デバッガは。。ICE?は先輩が使ってる、紙で動作チェックや」 2022-07-15 16:44

                    現代のプログラマが40年前に転移してしまうと「メモリが8KB?画面幅が40文字?コードは紙に…?」となってなにも無双できなさそう
                  • PHPにてテキストファイルの文字コードをutf-8に統一する方法| eラーニングシステムのlearningBOX

                    QuizGeneratorの生みの親、作り出しッペの西村です。実は、learningBOXの初期開発には参加しておらず、バージョン2.0のリリース頃から本格参戦しました。この度、文字コードの取り扱いに関するPull Requestを受けまして、文字コードについてもう少し語っておかないといけないなと思い、記事にまとめました。 今回の記事では「PHPにてテキストファイルの文字コードをutf-8に統一する方法」をご紹介いたします。本稿もどうぞよろしくお願いします。 目次はこちら 1. Shift-JISは避けられない 2. 文字化けの回避方法について 3. どうやって文字コードを判定するのか? 4. まとめ Shift-JISは避けられない learningBOXやQuizGeneratorのようなシステムでは、CSVなどのテキストファイルを受け取ることがあります。現代のWebシステムにおいて、

                      PHPにてテキストファイルの文字コードをutf-8に統一する方法| eラーニングシステムのlearningBOX
                    • pythonでファイルの文字コードをさくっと変換する | DevelopersIO

                      データアナリティクス事業本部の森脇です。 pythonでの文字コード変換方法を調べていたところ、codecs.StreamRecoderを使うとさくっと変換できそうだったのですが サンプルがあまり見つからなかったので試してみました。 https://docs.python.org/ja/3/library/codecs.html#streamrecoder-objects StreamRecoder はデータをあるエンコーディングから別のエンコーディングに変換します。 異なるエンコーディング環境を扱うとき、便利な場合があります。 pythonのバージョンは3.8.1です。 作ってみる 例として、Shift-JISのローカルファイルをutf-8に変換してみます。 import codecs import io src_file_path = "./sjis.txt" src_codec =

                        pythonでファイルの文字コードをさくっと変換する | DevelopersIO
                      • 文字コードを変換するツール | i_Tools

                        テキストファイルの文字コードを変換して出力するツールです. chg_cc.2020.01.30.zip エクスプローラなどから,変換対象のテキストファイルをドロップします. 変換後のフォルダ(%TEMP%\…\)が自動的に開かれます. %TEMP% 以下の変換後ファイルは終了時に削除します. 出力先フォルダをドロップすると,そこに変換先を切替えます. その場合,変換後ファイルは削除しません. この投稿は役に立ちましたか? 役に立った 役に立たなかった 0 人中 0 人がこの 投稿 は役に立ったと言っています。 The post 文字コードを変換するツール first appeared on i_Tools.

                          文字コードを変換するツール | i_Tools
                        • マクロでShift_JIS文字コードか判定する|VBA技術解説

                          最終更新日:2019-07-13 マクロでShift_JIS文字コードか判定する 環境依存文字・機種依存文字をチェックしたいという話は時々聞くことなのですが、 何をもってして判別するかという事が実はとても難しい問題になります、 ①②もIMEでは[環境依存]と表示されますが、通常これが問題になる事はないでしょう。

                            マクロでShift_JIS文字コードか判定する|VBA技術解説
                          • Faraday Net::HTTP adapter v2.0.0.alpha-2以降で、Content-Typeに応じた文字コードがセットされるようになった - Qiita

                            Faraday Net::HTTP adapter v2.0.0.alpha-2以降で、Content-Typeに応じた文字コードがセットされるようになったRubySinatraencoding文字コードFaraday Qiita株式会社 Advent Calendar 2021の14日目の担当は、Qiita株式会社CX向上グループの@kyntkです! はじめに タイトルにある変更が対応されたPull Requestはこちらです。 前提 Faradayに2012年に以下のissueが作成されているように、FaradayでContent-Typeがtext/html; charset=utf-8のようなレスポンスが返ってきても、response.bodyの文字コードはASCII-8BITになっています。 そのため、response.body.encodingでは実際のbodyの文字コードがわ

                              Faraday Net::HTTP adapter v2.0.0.alpha-2以降で、Content-Typeに応じた文字コードがセットされるようになった - Qiita
                            • Railsで既存のMySQLのデータベースの文字コード(characterset)と照合順序(collation)を変更する方法 - Qiita

                              Railsで既存のMySQLのデータベースの文字コード(characterset)と照合順序(collation)を変更する方法RailsMySQLcharactersetMySQL8.0collation 株式会社TECH LUCKという会社で代表兼エンジニアをしている齊藤です。 Railsアプリケーションで稼働しているMySQLのデータベースの文字コード(characterset)と照合順序(collation)を変更する機会があったのでまとめました。 Rails内部のソースコードまで追えていないので、実行した結果から「おそらくそうなんだろうな」という推測での記事になります。 前提 Ruby:2.7.3 Ruby on Rails:6.0.0 MySQL:8.0.32 結論 MySQL内にすでにデータベースが作成されている場合には、database.ymlのencoding、chara

                                Railsで既存のMySQLのデータベースの文字コード(characterset)と照合順序(collation)を変更する方法 - Qiita
                              • 文字コードの異なるフォームへのPOST(UTF8 to Shift_JIS)

                                文字コードの異なるページへのPOSTって悩ましいですよね。 具体的には、こちらのサイトがUTF-8で作られていて、相手先がShift_JISだったりする場合。 そもそも相手サイトにPOSTしなきゃいけない理由とは SPAMサイトじゃあるまいし、普通は自サイト以外へのPOSTってあんまり考えられないかも知れません。 でも、実際はあるんです。例えばECサイトが良い例。 「ご購入ありがとうございました。決済手続きは次の画面でお願いします。」 みたいなの。 いまどきそんなの古いよーという方もいらっしゃるかも知れませんが、きっとそれは大手の通販サイトを使用されていることが多いからでしょう。ショッピングモールにさえ出店しない、個人商店レベルのサイトではこんなのいっぱいあります。 中の人いわく、「個人経営のショップサイトでクレジットカード番号を入力するのは怖いというお客様がいらっしゃる」とか。なるほど、

                                  文字コードの異なるフォームへのPOST(UTF8 to Shift_JIS)
                                • MySQL 8.0.24 の文字コードまわり - tmtms のメモ

                                  2021/4/20 にリリースされた MySQL 8.0.24 について私が気になったものについて。 まあ文字コードまわりだけなんだけど。 utf8 を utf8mb3 として出力する Client applications and test suite plugins now report utf8mb3 rather than utf8 when writing character set names. (Bug #32164079, Bug #32164125) Important Note: When a utf8mb3 collation was specified in a CREATE TABLE statement, SHOW CREATE TABLE, DEFAULT CHARSET, the values of system variables containing c

                                    MySQL 8.0.24 の文字コードまわり - tmtms のメモ
                                  • UTF-8の文字コード表 - 備忘帳 - オレンジ工房

                                    UTF-8の文字コード表なのです。いつも検索して、よそ様のページを参照させていただいていたのですが、面倒なので自分で作りました。 perlのスクリプトでガーッと出したので、見栄えはアレですが、とりあえず。 1バイト文字 2バイト文字 3バイト文字 E2 9C 80 ~ Dingbats、昔からある記号、絵文字とか E3 80 80 ~ 全角ひらがな・カタカナ EF BC 80 ~ 全角英数字、半角カナ 4バイト文字 F0 9F 8C 80 ~ たぶん今どきの皆さんの言う絵文字 F0 9F 98 80 ~ 顔文字 更新履歴 (2018-05-10 追記) コード表を全体的に再出力しました。変更点は以下の通りです。 unicode追加面、4バイト文字の表もつくりました。 各文字ブロックにタイトルを付けました。英語タイトルはUnicode仕様書PDFへ直リンクしています。 表示されてないけど、ど

                                    • Pythonで学ぶ文字コード - Qiita

                                      この記事は Python Advent Calendar 2021 23日目の記事です。 はじめに 最近、文字コードを考慮したシステム設計をする機会がありました。 文字コードは今までなんとなくの知識でやり過ごしてきましたが、基礎知識から学び直す良い機会となりました。 この記事では、文字コードの知識についてPythonを使い理解を深めることを目的としています。 なお、Python固有の知識よりは文字コードの基礎知識にフォーカスしていますので、Pythonの知識が無い方にも参考になればと思います。 想定読者 文字コードについて、そもそも何かわかってない人 聞いたことはあるけどよくわかってない人、理解に自信が無い人 前提 Python 3.8 Mac OS Catalina 文字コードとは何か 「文字コード」という言葉を調べると、Unicode, UTF-8, SJISなどさまざまな単語が登場し

                                        Pythonで学ぶ文字コード - Qiita
                                      • Pythonのchardetモジュールが、"testあ"という文字列(UTF-8)の文字コードを"Windows-1254"だと判定する

                                        "testあ"のUTF-8表現は、74 65 73 74 e3 81 82 (1バイトデータの表記は全部16進、以下同様, python3風に書くとb'\x74\x65\x73\x74\xe3\x81\x82')で、chardetが判定するのは「文字列」ではなく、このバイト列です。 ちなみにこのバイト列をUTF-8, Shift_JIS, EUC-JP, ISO-8859-1, Code Page 437, Windows-1254で解釈すると、以下のようになります。 UTF-8 testあ (まぁ、当たり前) Shift_JIS (不正) EUC-JP (不正) ISO-8859-1 testã (81 82 は制御コードにあたるので見えないが不正ではない) CP437 testπüé Win1254 testã‚ (81は未定義なので本来は不正、chardetは未定義にあたるバイトが現

                                          Pythonのchardetモジュールが、"testあ"という文字列(UTF-8)の文字コードを"Windows-1254"だと判定する
                                        • 日本語版の SQL Server の文字コードの基本 at SE の雑記

                                          日本語版の SQL Server をインストールした環境の文字コード / 文字コードに関連するドキュメントについてまとめておきたいと思います。 今回はインストールタイプ (Box) の SQL Server を日本語版でインストールした環境をベースに考えていますが、これは、SQL Server のデータベースエンジンをベースとしている環境で共通の考え方になります。 過去のバージョンの情報にはなりますが、次の情報も参考になります。 SQL Server 2005 のインターナショナル機能 2007 年 6 月改訂版 Microsoft SQL Server 2005 のインターナショナル機能 日本語版の SQL Server で使用される文字コードですが、基本的には次の 4 種類になるかと思います。 CP932 (Microsoft コードページ 932 : Shift_JIS 拡張) Un

                                          • 【Python】encode・decodeメソッドで、文字列⇔文字コードをかんたん変換!(UTF-8・Shift_JIS)

                                            Python 【Python】encode・decodeメソッドで、文字列⇔文字コードをかんたん変換!(UTF-8・Shift_JIS) Pythonを使っていると、文字コードや文字列の変換が必要になることがありますよね。 でも、文字コードって何?どうやって変換すればいいの?と疑問に思ったことはありませんか? やり方はかんたんです。 「encode」メソッドと「decode」メソッドを使えば、あっという間に文字列と文字コードの変換ができるようになります! UTF-8、ASCII、Shift_JISといった代表的な文字コードの変換プログラムもまじえて解説しています。 実際にプログラムを動かすことで、どのように文字列と文字コードを変換するのか理解が深まると思います。ぜひ実際にコードを入力して動かしてみて下さいね。

                                              【Python】encode・decodeメソッドで、文字列⇔文字コードをかんたん変換!(UTF-8・Shift_JIS)
                                            • Windows10でテキストファイルの文字コードを変換する方法 | 4thsight.xyz

                                              Windows10環境でテキストデータを処理する場合、用途によって適切な文字コードでデータを用意しなければなりません。 たとえば、コマンドプロンプトでのテキスト処理では「ANSI(Shift-JIS)」、レジストリファイルの作成では「UTF-16LE」、WSLでの処理では「UTF-8」といった具合です。 Windows10でこれらの文字コードでテキストデータを用意する場合、サードパーティーのテキストエディターを利用する必要があると思いがちですが、標準搭載の「メモ帳」でもそれぞれの文字コードに変換することができます。 そこで、ここではメモ帳で文字コードを変換する方法と、複数ファイルの文字コードを一括で変換するのにおススメのコマンドラインツールを紹介します。

                                                Windows10でテキストファイルの文字コードを変換する方法 | 4thsight.xyz
                                              • 文字コードとは?~UTF-8はパソコンの世界共通語~|データ分析用語を解説 - GiXo Ltd.

                                                本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1) Unicode、ASCIIコード、Shift-JIS、UTF-8、UTF-16の関係を理解する データ分析を行っていると、必ず出てくる専門用語で「文字コード」がありますが、それぞれの文字コードの概念は、曖昧になってはいませんか? これから説明する内容は、文字コードとは何かを代表的な文字コードの関係性から説明します。 UnicodeとUTF-16は別物 ~符号化文字集合と符号化形式について~ 若い情報処理系の技術者に対して、「代表的な文字コードって何?」と質問した時、返ってくる内容として「ASCIIコード、Shift-JIS、UTF-8、UTF-16、Unicode…」と答えるケースがあります。これは、厳密にいえば正しい答えではありません。 Unicodeは「符号化文字集合

                                                  文字コードとは?~UTF-8はパソコンの世界共通語~|データ分析用語を解説 - GiXo Ltd.
                                                • 「EmEditor」v19.8が正式リリース ~「uchardet」の採用で文字コードの検出精度を向上/Windows 10向けの漆黒テーマもベータ提供

                                                    「EmEditor」v19.8が正式リリース ~「uchardet」の採用で文字コードの検出精度を向上/Windows 10向けの漆黒テーマもベータ提供
                                                  • MySQLのテーブル作成後に、文字コードをutf8mb4に変更する

                                                    MySQL のテーブルの文字コード latin1 と utf8mb4 が混在しているシステムを utf8mb4 に統一する機会がありました。調査した内容や実行したコマンドを残しておきます。MySQL のバージョンは 5.7 です。 目次 やったこと データベースの文字コードと照合順序を確認する テーブルの文字コードと照合順序を確認する 利用できる照合順序を確認する カラムの文字コードと照合順序を確認する テーブル内のすべての文字カラムを変換する データベースの文字コードを変更する テーブルの文字コードを変更する カラムの文字コードを変更する やったこと データベース、全テーブルの文字コードを調べる文字コードが utf8mb4 ではないテーブルを見つけたら、そのテーブルのカラムの文字コードを調べるカラムとテーブルの文字コードを utf8mb4 に変換するデータベースの文字コードを変更する 順

                                                      MySQLのテーブル作成後に、文字コードをutf8mb4に変更する
                                                    • MySQLの文字コード変更

                                                      MySQLを5.7から8へバージョンアップする過程で、文字コードを utf8mb4 に変更する必要が生じたため、方法をメモします。 現在の状況確認↓まずMySQLに接続して、現在の状況を確認します。 # MySQLへ接続 mysql -u root -p # 変更対象のDBを選択 mysql> use hogehoge; # 文字の設定を管理している環境変数を表示 mysql> show variables like "chara%!"(MISSING); # 出力結果 +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_clie

                                                        MySQLの文字コード変更
                                                      • 文字コード

                                                        文字コード変換 文字コードは標準ライブラリの codecs モジュールで扱える。直接これを使わなくても、いろいろな関数が encoding=... オプションで文字コード指定を受け付ける。デフォルトはUTF-8である。例えばコマンドライン引数で与えたEUC-JPのファイルをUTF-8に変換して utf8/ サブディレクトリに保存するには、次のようにすればよい。 import sys def convert(source, target): with open(source, 'r', encoding='euc_jis_2004', errors='replace') as f: content = f.read() with open(target, 'w', encoding='utf-8') as f: f.write(content) if __name__ == "__main_

                                                        • 文字コードを変更してコピー

                                                          「文字コードを変更してコピー」するツールと,その副産物(派生ツール)です. copy_cc_2024_01.zip copy_cc.2020.01.31.zip 使い勝手はまだまだですが,私個人の用途としてはある程度満たしています. 操作手順 copy_cc.exe を起動します. 文字コードを変換するテキストファイルを「エクスプローラ」などからドロップします. 変換する文字コードを指定します. 「変換してコピー」でテンポラリ(%TMP% 以下)に変換してコピーします. 「Explorer」で開くと ilc ファイルと指定したテキストファイルが存在します. その ilc ファイルを変換先のディレクトリにコピーまたは移動します. そしてその 変換先に移した ilc ファイル をこのツールにドロップします. ilc をドロップすることでこのツールに登録されます. 登録された ilc は

                                                            文字コードを変更してコピー
                                                          • エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開 - yanok.net

                                                            「エンジニアHub」にて記事を執筆しました。「文字コード再入門 ─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」として公開されています。 若手エンジニア向けのWebメディアとのことで、プログラミング上の注意点にフォーカスした内容になっています。コード例にはJava, Python, Rubyを用いています。 拙著をすでにお読みの方には復習となる内容ですが、まだの方はこの機会に是非お読みいただければと思います。記事の最後に拙著『[改訂新版]プログラマのための文字コード技術入門 (WEB+DB PRESS plusシリーズ)』の版元へのリンクも設定されていますので、興味を持たれた方には書籍の方もお読みいただければ幸いです。 当記事編集担当の方には「とても品質の高い記事」とのことで感謝のお言葉をいただきました。読者のお役に立つことを願っています。

                                                            • Powershell で文字コードを変更する(clip.exe へのリダイレクトもね)

                                                              PowerShell だけで処理しているときには、文字コードが default の UTF-8 になっていても問題無いのですが、PowerShell 以外と連携する際に文字コードの違いが問題になることがあります。 ファイル出力の Out-File とかには -Encoding オプションがあるので、S-JIS にするのであれば Default を指定すれば S-JIS で出力されます。 ところが、オンメモリーで文字コードを変更するにはファイル出力コマンドレットは使えません。 そんな時は、こんな感じで .NET Framework の System.Text.Encoding を使って文字コード変換します。 function Conv2SJIS($UTF8String) { $ByteData = [System.Text.Encoding]::UTF8.GetBytes($UTF8Stri

                                                              • 主要RDBMS製品の比較 – 文字コード, 文字セット, 照合順序 | コーソルDatabaseエンジニアのBlog

                                                                Microsoft SQL ServerMySQLOracle DatabasePostgreSQL主要RDBMS製品の比較 2022.09.28 渡部 亮太 主要RDBMS製品の比較 – 文字コード, 文字セット, 照合順序 Oracle ACE Proの渡部です。 主要なRDBMS製品を比較します。 大枠を整理することが最大の目的です。細かい例外事項や拡張機能は適宜記載を割愛しています。 2022年9月時点の最新バージョンをベースに記載していますが、記載内容にバージョン依存は少ないはずです。 時間ができた時に随時追記予定です。 もし誤りを見つけた場合は、優しく教えていただけると嬉しいです。→ https://twitter.com/wrcsus4 or ryota.watabe at cosol dot jp 「主要RDBMS製品の比較」ページ一覧 アーキテクチャ, スキーマ, データ

                                                                • Javaで文字コードを推測する - Qiita

                                                                  Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationWhat you can do with signing up

                                                                    Javaで文字コードを推測する - Qiita
                                                                  • 仮名合字・合略仮名の文字コード - yanok.net

                                                                    合字とは 合字というものがあります。複数の文字を組み合わせて一文字となったものです。欧文の「Æ」のような文字はどこかで見たことがある人が多いでしょう。いうまでもなくAとEの組み合わせです。ドイツ語の「ß」も「ss」を表す合字です。合字を英語ではligatureといいます。 漢字にも,「麻呂」を組み合わせて一字になった「麿」や,「久米」の「粂」等の合字があります。 仮名文字にも合字があります。今日,通常の文章には用いられませんが,昔のものには見ることができます。こうしたものは仮名合字や合略仮名と呼ばれます。 ここではそれらのうち,現在符号化されているものについて文字コードをまとめてみます。 仮名合字の文字コード 文字読みJIS X 0213UnicodeUnicode文字名Unicodeブロック ゟより1-2-25U+309FHIRAGANA DIGRAPH YORIHiragana ヿコト

                                                                    • MySQLの文字コードをutf8mb4に変更 - Qiita

                                                                      +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | utf8mb4 | | character_set_connection | utf8mb4 | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | utf8mb4 | | character_set_server | utf8mb4 | | character_set_system | utf8mb4 | | char

                                                                        MySQLの文字コードをutf8mb4に変更 - Qiita
                                                                      • VBA 文字コードを変換や判定、文字化けを解消する

                                                                        はじめに Excel VBA 文字コードを変換や判定、文字化けを解消する方法を紹介します。 VBA の文字コードは Unicode (UTF-16) です。ただし Shift_JIS に存在しない文字 頰 などを入力すると ? に文字化けします。 「StrConv 関数」から、Unicode (UTF-16) を Shift_JIS に変換できます。逆に変換もできます。 「ChrW 関数」から、Unicode 文字やサロゲートペア文字 𩸽 や 😃 などを入力できます。 「Asc 関数」から、Shift_JIS の文字か、Unicode のサロゲートペア文字か判定できます。 Unicode (UTF-8, UTF-16) のファイルを読み込めるかどうかは、何を使って読み込むかによって変わります。 文字コードと文字化けについて VBA の文字コードは Unicode (UTF-16) です

                                                                          VBA 文字コードを変換や判定、文字化けを解消する
                                                                        • 第17回:OracleDatabaseで異なる文字コード間におけるデータ移行時の注意点 - システムエグゼ コーポレートサイト

                                                                          Oracle Databaseの移行案件を扱っていると、異なるキャラクターセットへの移行を任され、文字コードやデータサイズの違いに戸惑う技術者の方も多いのではないでしょうか。 今回は、データベースリプレイス案件時に調査を行ったJA16SJIS(TILDE)からAL32UTF8への移行時の注意点についてご紹介したいと思います。 目次 1.キャラクターセット Oracle Databaseで取り扱う文字コードは、データベース作成時に設定するデータベースキャラクターセット(CHARACTER SET)、各国語キャラクターセット(NATIONAL CHARACTER SET)で決定されます。 ※作成後、変更が出来ないので十分検討が必要です。 データベースキャラクターセット:以下データ型で取り扱う文字コードが決定されます。 CHAR VARCHAR2 LONG CLOB 各国語キャラクターセット:以

                                                                            第17回:OracleDatabaseで異なる文字コード間におけるデータ移行時の注意点 - システムエグゼ コーポレートサイト
                                                                          • APPLE][のキーボードと文字コード - J-PLUSでのカナの扱い|kzn

                                                                            さて、PET2001でカナをどう扱ったかを PET2001 - 悪評の高かったキーボードと PETSCII で書いたのでAPPLE][の場合はどうだったのかもまとめておきます。 APPLE][のキーボードと文字コードについては、 APPLE][のキーボードと文字コード に書いたので、J-PLUSでどのようにカナ文字を入れたかということになります。カナ文字はヘッダ写真にもあるように、それぞれのキーの手前の面に刻印されています。スラッシュで区切って2つ刻印されている文字は、そのまま入力できる文字が左、シフトが必要な文字が右です。 上がシフトを押しながら、下がそのままで入力できるカナカナキーはなく、英数字とカナの切り替えは、CTRL-T を押すことでトグル切り替えになります。 この配列は JISではありませんが、どこかで見覚えがありませんか。そうです大部分は PET2001 のカナ配列と同じです

                                                                              APPLE][のキーボードと文字コード - J-PLUSでのカナの扱い|kzn