タグ

imeに関するtakuya-aのブックマーク (2)

  • ニューラルかな漢字変換 - Qiita

    3行まとめ Recurrent Neural Networkによるかな漢字変換をTensorFlowを使って実装しました。 既存手法のN-gramと比べて高い精度(文正解率2.7ポイント向上・予測変換3.8ポイント向上)を実現しました。 RNNの特性により離れた単語の共起関係と低頻度語の扱いが改善されました。 かな漢字変換とN-gramモデルの限界 パソコンやスマートフォンで日語を入力するためのかな漢字変換には、同音異義語や単語区切りに曖昧さがあります。この問題に対処するため、現在は大規模な訓練データに基づく統計的言語モデルが主流になりました。その中でも代表的な単語のN-gramモデル1では、連続する単語列の頻度を使って言語モデルを構成し、変換候補の確率が高いほど順位が高いと考えます。 しかし、N-gramモデルには離れた単語の共起関係を考慮できないという問題点(マルコフ性)と、低頻度語

    ニューラルかな漢字変換 - Qiita
  • MacからiOSまで、Apple日本語環境の知られざる歴史が明らかに

    Macの英数・かな切り替えがトグルではない理由、他社の日語変換とはどう違うのか。誰も知らなかった内容を元「中の人」が語る。 Mac語インプットメソッド「ことえり」の生みの親で20数年にわたってAppleの日語環境を支えてきた木田泰夫さんへのインタビューが公開された。 Apple関連情報のニュースサイト、MACお宝鑑定団のDANBOこと山田昇さんが、元Appleシニアマネジャーの木田泰夫さんにポッドキャストbackspace.fmでインタビューを行った。AppleユーザーのイベントであるAUGM KOBE 2016にゲスト参加した木田さんから会場で聞いた貴重な内容だ(ポッドキャストへのリンク)。 ポッドキャストでは「Appleの日語環境を支えた、これまで語られなかった20年」と題して、Apple在籍時代には明かされなかった、Apple日本語入力環境に関する30分間のインタビューを

    MacからiOSまで、Apple日本語環境の知られざる歴史が明らかに
    takuya-a
    takuya-a 2016/03/12
  • 1