今回の目的 前回はPyTorchのRNNクラスを使って、梶井基次郎の小説データを基に文章生成を行いました。できあがったニューラルネットワークモデルは、「檸檬」を与えると「檸檬などごくありふれている」という文を頻繁に生成するようなものとなっていました。恐らくは訓練データに過剰に適合した(過学習をした)ことにより、このようなモデルになってしまったのでしょう。 そこで、今回はパープレキシティーという損失とは別の指標を導入して、前回のニューラルネットワークモデルがどんなものだったかを観察した後、過学習を避ける仕組みを導入します。果たして、これにより前回よりもよい精度で文を生成できるようになるのでしょうか。 なお、分かち書きされたデータから辞書やデータセット/データローダーを作成するコードなどは前回までに見てきたものと同様なので、本稿ではそれらについては紹介しません。ここでは、前回までのコードに少し