タグ

コーパスに関するtsu-neraのブックマーク (2)

  • seq2seq-attnニューラル機械翻訳を試す - Qiita

    @tkngueと共著 TL;DR NMTを試してみました. 翻訳結果を見ると、うまくいっている翻訳は驚きの結果でした. ただ,内容語をとんでもない間違いかたをしているものもあったりして面白かったです. 概要 "でぃ〜ぷらーにんぐ"の波が機械翻訳にも来ていて 大きなパラダイムシフトになりつつあります. その圧倒的な表現能力の高さ や 高価なGPGPUが大量にないと話にならないお金持ちゲーであること や 膨大なハイパパラメータ(学習の際の設定の組み合わせ)が 存在することから 「さわるの嫌だなー」と思いつつも、さわらざるを得ない状況になったので触ってみました. 実際にさわってみて, やっぱり凄かったので 投稿する次第です. 稿では, 再配布可能な対訳コーパスKFTTを対象に日英翻訳をニューラルネット翻訳(NMT)で試してみます. 加えて, これまでのフレーズベースの統計的機械翻訳の典型的なツ

    seq2seq-attnニューラル機械翻訳を試す - Qiita
  • 名大会話コーパス

    『名大会話コーパス』は,科学研究費基盤研究(B)(2)「日語学習辞書編纂に向けた電子化コーパス利用によるコロケーション研究」 (平成13年度~15年度 研究代表者 大曽美恵子)の一環として作成された,129会話, 合計約100時間の日語母語話者同士の雑談を文字化したコーパスです。 現在は国立国語研究所に移管され,文字化テキストなどを公開しています。 ご利用にあたって 『名大会話コーパス』を利用した研究成果等を発表される際は,必ず以下のいずれかの文献の情報を明記してください。 藤村逸子・大曽美恵子・大島ディヴィッド義和、2011 「会話コーパスの構築によるコミュニケーション研究」 藤村逸子、滝沢直宏編『言語研究の技法:データの収集と分析』p. 43-72、ひつじ書房 Fujimura,Itsuko, Shoju Chiba, Mieko Ohso, 2012, Lexical and G

  • 1