タグ

日本語とtechnologyに関するja_bra_af_cuのブックマーク (3)

  • コンピューターで全漢字使用可に 6万字コード化 | NHKニュース

    語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。 このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進め

    コンピューターで全漢字使用可に 6万字コード化 | NHKニュース
  • 押下(おうか)にまつわる話 - Qiita

    はじめに 私が仕様書を書くようになったのは30歳を過ぎてからと遅く、仕様書の書き方が分からなくて悩んだことがありました。通常は先輩たちが作成した仕様書等を見て書き方を覚えていくのでしょうが、仕様書も無く直接プログラムを組むような体制の仕事をしていたため、SI系に転職してから苦労したのであった。 仕様書を書く際に、ボタンを「Enterキーを押す」か「クリックする」かで考えて「押下」にすれば両方満たすだろうと、それ以来ずっと使用しています。 押下については、コンピューター雑誌やマニュアル等を読んで憶えていた用語で特に気にも止めていなかったのですが、別ブログの仲間が過去に「ボタン押下?」について書いていたことを思い出し、調べてみることにしました。 調べていくと自分は誤用して使っている気がしますw 押下について 読み方 押下は「おうか」と読みます。ちなみに苗字の押下さん(読方:おしした)は全国でお

    押下(おうか)にまつわる話 - Qiita
  • YouTubeの「日本語音声から字幕を自動生成する機能」登場への感想

    2011/7/14からスタートした、YouTubeの「音声自動解析」&「自動字幕生成・付与」機能関連の記事に対する感想まとめ。多種多様な使い道が出来るとの期待がボンガボンガ。あとで記事にもまとめる予定。 [公式]YouTube 自動キャプション機能が日語に対応。音声認識技術を使って日語の動画に自動で字幕を表示開始 http://youtubejpblog.blogspot.com/2011/07/youtube.html

    ja_bra_af_cu
    ja_bra_af_cu 2011/07/16
    自動翻訳レベルだろと思ったらすごかったw 確かにインタビューとかの文字おこしに使えそうw
  • 1