タグ

ブックマーク / ksksksks2.hatenadiary.jp (8)

  • Keras Loss Behavior with Language Model - 終末 A.I.

    KerasのModelクラスを使用した際のロスの計算は、Paddingで追加した余計な値を勾配の計算から除外する処理は自動でやってくれるのですが、 historyに記録されるlossの平均値を求める際に、maskを部分的にしか考慮しておらず、padding数が多くなればなるほど、実際のロスより小さくなってしまうという現象が発生します。 この記事は、KerasのModelクラスでLossを利用する、 特にEmbedding層で、mask_zeroをTrueにした場合に、Paddingで追加した余計な値を、勾配の計算に使用しない、ロスの計算から完全に除外する方法についてのメモです。 検証用のコードはこちらです。 マスクを使用したロスの計算は、TensorFlowのチュートリアルを参考にしています。 目次 KerasのLossの種類と種類毎の処理の違い tf.keras.losses.Lossの

    Keras Loss Behavior with Language Model - 終末 A.I.
    KSKSKSKS2
    KSKSKSKS2 2020/02/29
    KerasのModelクラスでロスを計算した際に、Embedding層でpaddingのmaskを利用した際に、実際の値より小さい値を返してくるという話
  • Microsoft Academic Search APIで自分専用の論文検索エンジンを作る - 終末 A.I.

    サーベイなどで論文検索をする時によく困るのが、キーワードをこねくり回さないと以外と読むべき論文に出会えないという点です。 特に「Dialogue System」や「Image Captioning」などのように、母数が少ないニッチな分野になると、学術用検索エンジンにキーワードを入力するだけでは、キーワードにマッチするものがトップに上がってくるだけで、必ずしもその分野を代表するような論文がヒットしてくれるわけではありません。 ホットな分野であれば、サーベイ論文、学会のチュートリアル資料など、人工知能学会の「私のブックマーク」を漁ると良さそうな情報が見つかることもありますが、なかなか新しい情報がまとまっていないということも多くあります。 その点で検索しやすいなと思っているのが、Microsoft Academicです。 下記の記事にもまとまっていますように、文献に紐付けられたトピックで論文を絞

    Microsoft Academic Search APIで自分専用の論文検索エンジンを作る - 終末 A.I.
    KSKSKSKS2
    KSKSKSKS2 2020/01/27
    マイクロソフトの論文検索APIを使って自分用の論文検索エンジンを作ってみたという記事です。サーベイなどで包括的に論文探したい時に使えそう? むしろ、みんなどうやって読むべき論文探してるんだろうか
  • VariationalでEnd2EndなDialogue Response Generationの世界 - 終末 A.I.

    この記事は、自然言語処理 #2 Advent Calendar 2019の24日目の記事です。 Open-Domain Dialogueや非タスク指向対話、雑談対話と呼ばれる領域において、発話データのみを使用したEnd2Endな対話応答生成を試みる歴史はそこまで古くなく、[Ritter et al+ 11]や[Jafarpour+ 10]がまず名前をあげられるように、比較的最近始まった研究テーマとなります。 これらは、Twitterなどの登場により、ユーザー間で行われる、ほとんどドメインを限定しない、もしくは多様なドメインにまたがる、大量の対話データを、容易に収集できるようになったことにより、活発に研究されるようになってきました。 初期の研究である[Ritter+ 11]や[Jafarpour+ 10]では、統計的機械翻訳ベースや情報検索ベースの手法でEnd2Endな対話システムを構成して

    VariationalでEnd2EndなDialogue Response Generationの世界 - 終末 A.I.
    KSKSKSKS2
    KSKSKSKS2 2019/12/24
    VAEベースの対話応答生成手法をメインに紹介している記事。入力と出力の関係が1対Nになるような生成モデルに対して、多様な文を生成するために試行錯誤されている内容についてまとめています。
  • End2Endな対話システムの評価指標 - 終末 A.I.

    この記事は、Qiita 自然言語処理アドベントカレンダーの2日目です。 1日目は jojonki さんによるゼロから作った形態素解析器Taiyakiで学ぶ形態素解析でした。 この記事では、End2Endな対話システムの評価指標、特に応答文生成の自動評価指標に注目して、どのような指標があるのか、どのような点が問題と考えられているのかに注目して、現在の動向やどのような課題があると考えられているかについて記載しています。 自然言語処理分野、特にその応用分野へのDeep Learningへの適用は、特にSeq2SeqとAttention機構によって進んできたと言っても過言ではありません、 対話システムでも、機械翻訳や文書要約といったその他の自然言語処理の応用分野と同じく、End2Endなモデルで対話システムを構築しようという試みが多く行われています。 Deep Learning応用の比較的初期の頃

    End2Endな対話システムの評価指標 - 終末 A.I.
    KSKSKSKS2
    KSKSKSKS2 2019/12/02
    生成型の対話システムの評価指標に関する記事。現在の評価指標の問題点と、その解決策(候補)についてもまとめています
  • CNNの精度向上手法のモデルサイズによる効果の違いを調べてみた - 終末 A.I.

    画像認識タスクはDeep Learningにより大幅に精度が向上してきた分野です。 1クラス500枚・100クラスの分類を行う必要がある、比較的難易度が高めのCIFAR-100ベンチマークでも、最新の手法であるGPipeやEfficientNetでは、テストセットにて90%を超えるAccuracyを達成しています。 paperswithcode.com しかし、これらの最高精度を叩き出すような手法はパラメーター数が600Mや、60Mと大量のパラメーターが必要になります。 このように、パラメーター数が多いモデルは、精度を向上させやすい分、推論や学習にパラメーター数に応じた時間が必要な問題があります。 一方で、多くのモデル構造では、パラメーター数が数Mにいくかいかないかの、より小さいモデルを構築することができます。 このようなモデルは、深いモデルに比べ精度面では劣るものの、処理速度は圧倒的に高

    CNNの精度向上手法のモデルサイズによる効果の違いを調べてみた - 終末 A.I.
    KSKSKSKS2
    KSKSKSKS2 2019/09/17
    パラメーター数が少ないモデルでも、精度向上手法が役に立つものなのかについて、ResNet×cifar-100を使って試してみた記事です
  • ニューラルネットワークを使用した対話システム (2)〜機械読解質問応答システム〜 - 終末 A.I.

    記事は、「Neural Approaches to Conversational AI*1」を元に、ニューラルネットワークを使用した対話システムについて解説する記事の二回目です。 前回の記事では、対話システムの概要とKnowledge Base質問応答システムについて説明しました。 ksksksks2.hatenadiary.jp 今回は、二つ目の質問応答システムである、機械読解質問応答システムについて説明します。 機械読解を利用した質問応答システムは、Watsonに代表されるような、大量の文書をもとにユーザーの質問に対して応答を返すシステムのことを指します。 まず、機械読解とは何か、それをどのようにニューラルネットにより実現するかについて説明します。 続いて、機械読解を組み込んだ質問応答システムをどのように実現するかについて、システムの例も見ながら説明していきます。 目次 機械読解をニ

    ニューラルネットワークを使用した対話システム (2)〜機械読解質問応答システム〜 - 終末 A.I.
  • ニューラルネットワークを使用した対話システム (1)〜Knowledge Base質問応答システム〜 - 終末 A.I.

    対話システムは、QAチャットや音声アシスタントなど、様々なところで使用されており、 また、GoogleのDialogflowを始め多くの独自対話システムを構築できるプラットフォームが数年前から続々と登場してきています。 しかし、これらの公開されているシステムは、たくさんある対話システム構成の中でもタスク指向型(特にスロットフィリング型)の設計にのっとっているものが多いのが現状で、作りたいシステムをそのまま構成することが難しいケースが存在します。 この記事シリーズは、ニューラルネットワークを使用している対話システムについて、どのようなシステム設計がありうるのか、どのように機械学習でそのシステムを実現しようとしているのかを、「Neural Approaches to Conversational AI*1」を元に、元資料の引用だけでなく、中で説明されている論文についても、可能な限り概観できるよ

    ニューラルネットワークを使用した対話システム (1)〜Knowledge Base質問応答システム〜 - 終末 A.I.
  • 2018年風TensorFlowでの学習処理の記述方法 - 終末 A.I.

    TensorFlowが登場して早いことで3年近く経とうとしています。 Deep Learning自体がブームになってからだと、それ以上の月日が経っているわけで、人工知能ブームも以外と続いているなあというのが正直な感想です。 Theanoやtorch、chainerに遅れをとって立ち上がったTensorFlowでしたが、はじめのうちはチュートリアルコードですらこのようなありさまで、とてもではありませんが簡単に誰もが使えるというような状態ではありませんでした。 1年ほど前からようやく、Keras の取り込みや Dataset API の実装、MonitoredTrainingSession のようなリッチな Session オブジェクトの導入などで、少し凝ったことをする場合でもかなり簡単に書けるようになってきました。 一方で公式のチュートリアルでは、データセットの読み込みはありもののAPIを使

    2018年風TensorFlowでの学習処理の記述方法 - 終末 A.I.
  • 1