タグ

日本語と文字に関するshidhoのブックマーク (11)

  • Netflixにおける日本語字幕の導入

    (Please note that this article is a localized (to Japanese) version of a corresponding tech blog article in the English language) Netflixでは、2015年9月の日における配信サービス開始時から日語字幕を提供しています。 今回のブログでは、日語字幕提供に至るまでの技術的な取り組みについて説明します。 字幕ソースファイルの仕様、字幕ソースファイルからNetflix配信用字幕への変換モデル、Netflixにおける日語字幕の納品モデルなどを取り上げます。さらに、W3C字幕規格Timed Text Markup Language 2 (TTML2)導入に向けた対応についても触れます。 2014年の終盤にかけて、Netflixでは2015年9月に予定していた日

    Netflixにおける日本語字幕の導入
    shidho
    shidho 2018/05/25
    けっこうしっかり考えてる。srtだとどこまで出来るか意外とわからないんだよな。仕様書と解説サイトはどこにあるのか。
  • ダンボールに文字修正のシールが→ワクワクしつつシールを剥がして爆笑「予想の斜め上というか」「なぜそうなった」

    もこ @_moco_moco_mo せっかく文字修正されてるけど「ク」ではなく「ワ」だし、このシールの下にどんな字が…とワクワクしながらそっとシールを剥がしたら想像以上だった。 pic.twitter.com/z7MSSeXJz5 2017-10-28 11:57:35

    ダンボールに文字修正のシールが→ワクワクしつつシールを剥がして爆笑「予想の斜め上というか」「なぜそうなった」
  • プレス発表 文字情報基盤の約6万種の漢字を、JIS第4水準(JIS X 0213)範囲の約1万種の漢字に置き換えを行う際の参照情報「縮退マップ(検証版)」を公開:IPA 独立行政法人 情報処理推進機構

    IPA(独立行政法人情報処理推進機構、理事長:藤江 一正)は、人名等の正確な表記が求められる行政の実務に必要な約6万種の漢字(*1)を、市販コンピュータに通常搭載されている約1万種の漢字(*2)に置き換えて表記する場合に参照するための「縮退マップ(検証版)」を、2015年3月31日に公開しました。 URL:http://mojikiban.ipa.go.jp/4141.html IPAでは、内閣官房 IT総合戦略室、経済産業省とともに、人名等の正確な表記が求められる行政の実務に必要な約6万種の漢字を、情報システムで利用可能にするため、文字フォントの整備や文字コードの国際標準化を行う「文字情報基盤整備事業」を推進しています(*3)。 閣議決定「世界最先端IT国家創造宣言(*4)」では、利便性の高い電子行政サービスの提供を実現するために、「文字の標準化・共通化に関しては、今後整備する情報システ

    プレス発表 文字情報基盤の約6万種の漢字を、JIS第4水準(JIS X 0213)範囲の約1万種の漢字に置き換えを行う際の参照情報「縮退マップ(検証版)」を公開:IPA 独立行政法人 情報処理推進機構
  • 青空文庫の「ケヶ」問題と「行頭括弧の字下げ」問題: 栽培生活blog

    沙流川二風谷ダム・平取ダム問題 沙流川流域に建設された、または建設中のダムに関する詳しい情報が得られます。Sasaki Akiraさん、作。 地場・旬・自給 笹村出さんのブログ。「自己紹介」には「あしがら農の会の仲間 Peace Cafeの常連 水彩人同人 水彩連盟会員 「発酵利用の自然養鶏」出筆」とあります。 井圓~生活記事 - 樂多日誌 台湾のプユマ族出身のシンガーソングライター、陳建年(チェン・ジェンニェン)さんのブログ。陳さんは、現役の警察官でもあります。 わたしは、中国語が読めませんが、漢字なので、何となく分かるような分からないような。でも、写真とイラストを見ているだけでも楽しいです。 北の縄文デジタルミュージアム 特別展「北の縄文-美の世界-」の図録。 北海道をはじめ、青森県、秋田県、岩手県等の貴重な文化遺産。 【木の素材屋さん】 北海道芦別市にある材木屋さんの「道央ランバ

    shidho
    shidho 2013/01/08
    例示に上がっている「金ヶ崎町」がこのエントリの2年前に役所自ら「金ケ崎町」に変えているという話を考える度にもにょる。
  • 日本語フォントを1文字¥105から買えるWebサービス

    サイトの見出しなどにちょっと変わったフォントを使いたい場合、アルファベットだと無料 or 数百円で購入できますが、日語は1フォントが数万円する場合が多くなかなか気軽に購入できませんよね。 昨日、たまたまフォントを1文字¥105〜バラ売りするサービス Font Garage を見つけたので紹介します。 トップページの中央下、「アウトラインデータを探す」タブをクリックして、[アウトライン購入する文字を入力]の部分に見出しにしたい文字(15文字以内)を入力し、検索をクリックします。 [詳細を見る]ボタンをクリックします。 フォント1文字あたりの価格が表示されました。 フォントによってだいぶ値段は異なるようで、1文字¥105〜¥420位までありました。 変わり種の文字は急に必要になることがあるので、知っておいて損はないかもしれません。 Font Garage

    日本語フォントを1文字¥105から買えるWebサービス
  • いろんな日本語EUCについてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    語EUC(EUC-JP)にはいろいろあって頭がこんがらがってきたので、サルにもわかるように(つまり、自分があとから見て理解できるように)まとめてみた*1。まず、EUC-JPにはどんな種類があるのだろうということで、わたしの環境で実装例を確認できるものをピックアップしてみた。下図のうちeucJP-openとIANAのEUC-JPについては身近な実装例を思いつかなかったが、これを外すわけにはいかないだろうと思って入れておいた。 各EUC-JPのレパートリをまとめたのが、下図。eucJP-openには上図に示したようなバリエーションがあるが、レパートリは共通。「JIS X 0208の国際基準版・漢字用8ビット符号 + JIS X 0201片仮名」については、これを一言で表現できる呼称を思いつかないので、以下の図では仮に「TextEdit」と表記する。 下図は、各EUC-JPのレパートリと符号

    いろんな日本語EUCについてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    shidho
    shidho 2011/04/06
    めんどうくさいな。
  • 居酒屋のお品書きを連想させる和風カナフォント「YAKITORI」NOT SUPPORTED

  • 『避難者名簿をテキスト化している有志の皆さんへ』

    避難所の名簿をテキスト化して下さっている有志の皆さんへ。 手書きには癖字・略字があったり、氏名には旧字、異体字などが多様されています。 それらに対応する為に何か御役に立てたらと、略字に慣れない方へ向けた参考資料を作ってみました。 新しい写真の投稿がある迄の間、眺めていただけると、入力の際に「この字は入力できる」 「この字は環境依存文字だから、両方で登録した方が良い」 「この字は入力できない文字だから、置換した方が良い」 等のひらめきに繋がると思います。 又、斎と斉などの別字を混同してしまうと、最悪の場合、せっかく登録して頂いたのに、検索してもヒットしない等となる可能性も有ります。 又、住所の入力間違いは、ヒットするしないにも関わります。 どうかご一読下さい。 (一人で取り急ぎ作ったものです。タイプミスや分かりづらい表記、ご容赦下さい。尚、明らかなミスが有った場合はメッセージ頂けましたら幸い

    『避難者名簿をテキスト化している有志の皆さんへ』
    shidho
    shidho 2011/03/27
    読み取りのアドバイスをしている人のエントリにも誤字があることを見ると、日本語って難しいなあと思う。
  • Japanese Unicode Fonts

    [ font samples | what's new? | related links | home | travel phrases ] Introduction Japanese is written using a mixture of three scripts: Hiragana, Katakana, and Kanji. Latin letters (Romaji) and symbols/dingbats (Kigo) are also mixed into modern written Japanese. Hiragana & Katakana are syllabaries. The Unicode Standard refers to Kanji characters as "Han Ideographs". Some Kanji are visually diffe

  • 段落の謎 - 池田信夫 blog

    非常につまらない話だけど・・・ 日の商用ウェブサイトに原稿を出すと、段落が改まるとき、このように空行を入れたうえで、段落の最初に1字、空白をあける。私の知っている限り、新聞社もCNETやASCII.jpなどもすべてそうなっているが、これは日だけの奇習である。海外のサイト(たとえばNYタイムズ)では、空行を入れるだけで、行頭に空白は入れない。当ブログもその方式だし、普通のブログもそれが多い。 空行を入れるのは、PCモニターでは行間が詰まっているのを読みやすくするためだが、これで段落が改まったことはわかるので、行頭に空白を入れるのは無意味である。しかもフォントの大きさがそろっていないと、何かレイアウトがずれたような印象を受ける。この「日の丸標準」はやめてはどうか。 追記:コメントでも出ているように、これは縦書きの「字下げ」のなごりだろう。この新聞や縦書きという奇習もやめてほしい

    shidho
    shidho 2008/03/28
    向田邦子なんかは「横書きは読みにくい。つーか読めない」ってコラム書いてたわけで、この20年の変化はおそろしいもんだな。
  • 横書き文の句読点について

    更新情報 2009-1-8 度重なる追記と修正で,文の前後のつながりなどがおかしくなっていたので全体的に文章を修正。 Googleで検索して読んだ文書を句読点関連の雑文などに追加。 2009-1-5 伝聞を基に,くぎり符号の使ひ方に詔書の句読点についてを追記。 公用文における漢字使用等についての一部を修正。 2009-1-4 国会図書館で古い書物に句読点らしきものを発見したので,句読点の起源を改正。 句読法案の原文(近代デジタルライブラリーで検索すれば画像を観れます)の発見に伴い,句読法案を大幅改正。 JIS規格の句読法(JIS検索(日工業標準調査会)でZ8301で検索すれば画像を観れます)の発見に伴い,くぎり符号の使ひ方と一般的な利用状況に追記。 一般的な利用状況に,半角カンマを使う際のマナーの理由を追記。 2006-12-29 公用文の規定として最新のものを発見したので,公用文におけ

    shidho
    shidho 2006/04/14
    紆余曲折。
  • 1