タグ

日本語に関するohesotoriのブックマーク (5)

  • コンピューターで全漢字使用可に 6万字コード化 | NHKニュース

    語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。 このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進め

    コンピューターで全漢字使用可に 6万字コード化 | NHKニュース
    ohesotori
    ohesotori 2017/12/25
    たとえ一個でも対応してるフォントがあればありがたい。
  • 【聞きこく】聞き間違えない国語辞典 - Panasonic

    「聞き間違えない国語辞典」 サイト/サービス終了のお知らせ 「聞き間違えない国語辞典」の WEBサイト/サービスは 2018年3月9日(金)18時をもちまして 終了させて頂きました。 永らくご利用頂き、 誠にありがとうございました。 「聞き間違えない国語辞典」のWEBサイト/サービスは 2018年3月9日(金)18時をもちまして終了させて頂きました。 永らくご利用頂き、誠にありがとうございました。 パナソニック株式会社 (C)Panasonic Corporation

    【聞きこく】聞き間違えない国語辞典 - Panasonic
  • 中央大学理工学部情報工学科 科学技術系日本語

    上質な日語の文章は書き手の高い知性を連想させ、優れた説得力を生み出します。 日語は自然言語(natural language)の一種ですが、科学技術の分野ではこれを精確に運用することによって他者へ正しく物事を伝えることができ、この意味では、日語も形式言語(formal language)とみなし細部まで気をつかって記述・読解する必要があります。そのための、いくつかのポイントを以下に示します。人工知能技術のスピンオフ(副産物)です。

  • 無料でここまでできる→日本語を書くのに役立つサイト20選まとめ

    (例文/コーパス) ◯KOTONOHA「現代日語書き言葉均衡コーパス」 少納言 www.kotonoha.gr.jp/shonagon/search_form 現代の日語の書き言葉の全体像を把握できるように集められた約1億語収録の『現代日語書き言葉均衡コーパス』をジャンルを指定したり、前後にくる言葉を指定した上で検索できる。用例を探したいときはまずここを当たる。 ◯コーパス検索ツールNINJAL-LWP for BCCWJ (NLB) nlb.ninjal.ac.jp/ 『現代日語書き言葉均衡コーパス』を検索するために、国語研とLago言語研究所が共同開発したオンライン検索システム。上の少納言との違いは、名詞や動詞などの内容語の共起関係や文法的振る舞いを網羅的に表示できるところ。 たとえば「タバコ」を検索すると、用例が「タバコ+助詞+動詞」や「動詞+タバコ」+「タバコ+助詞+形容詞

    無料でここまでできる→日本語を書くのに役立つサイト20選まとめ
  • 日本語用例検索

    擬似正規表現を拡張(2015/5/21) 例えば、検索文字列に「$てしま$う」を指定すれば 「~てしまう」「~でしまう」の全活用形を検索可能。 (詳しくは上の解説を参照] 収録作品を倍増(2014/12/1) (詳しくは上の解説を参照] 日語KWIC索引生成 KWIC 日語研究文献検索 BCCWJからの用例検索について

  • 1