[B! NLP][機械学習] rin51のブックマーク

rin51 id:rin51

NLPと機械学習に関するrin51のブックマーク (28)

GitHub - BandaiNamcoResearchInc/DistilBERT-base-jp
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
rin51 2020/04/24
BERT

機械学習

nlp

バンダイナムコ

バンナム
リンク
自然言語処理でBERTまでの流れを簡単に紹介 - moriyamaのエンジニアリング備忘録
はじめまして@vimmodeです。普段はMNTSQというリーガルテックの会社で自然言語処理をしています。今回はBERTとBERTまでの流れを簡単に紹介します。自然言語処理で今やデファクトスタンダードとなりつつであるBERT。登場当時はモデルの複雑さに伴う計算環境や計算リソースの確保が難しく気軽に動かせなかったが、ColabやKaggleカーネル環境が整備されたきたおかげで誰でも気軽に使えるようになりました。また、haggingface社が公開したBERTと関連モデルのラッパーライブラリであるtransf ormersによりわずか10行程度でBERTモデルを記述できます。一方、自然言語処理を始めて間もない段階でいきなりBERTを突きつけられても理解の壁が高いと思いますので、今回は数式やコードを使わずにBERTに至るまでの流れを簡単に紹介したいと思います。 ※これらはあくまで私の理解であり
rin51 2020/01/24
> KとVはそれぞれ文の各単語ベクトルです。[...] エンジニアの方にわかりやすく言うと、入力文の各単語に対してKとVでkey-value storeを作っているようなものです。

自然言語処理

nlp

機械学習

BERT
リンク
Graham Neubig - チュートリアル資料
学校での講義 Fall 2024: Advanced NLP (CS11-711 @ CMU) Fall 2022: Advanced NLP (CS11-711 @ CMU) Spring 2022: Multilingual NLP (CS11-737 @ CMU) Fall 2021: Advanced NLP (CS11-711 @ CMU) Spring 2021: Neural Networks for NLP (CS11-747 @ CMU) Fall 2020: Multilingual NLP (CS11-737 @ CMU) Spring 2020: Neural Networks for NLP (CS11-747 @ CMU) Fall 2019: Machine Translation and Sequence-to-sequence Models (CS11-7
rin51 2019/04/03
NAISTの自然言語処理資料という

NLP

自然言語処理

機械学習

Machine Learning
リンク
Amazon.co.jp: 言語処理のための機械学習入門 (自然言語処理シリーズ 1): 高村大也: 本
rin51 2019/04/03
NLP

自然言語処理

機械学習
リンク
今更ながらchainerでSeq2Seq（1） - Qiita
chainerでsequence to sequenceの実装をしたので、そのコードと検証はじめに RNN系のニューラルネットワークを使った文の生成モデルとして、有名なものにsequence to sequence（Seq2Seq）というものがあります。今回はこのSeq2Seqをchainerを使って実装した際の方法と検証に結果についてまとめます。 Sequence to Sequence（Seq2Seq） Seq2Seqとは、RNNを用いたEncoderDecoderモデルの一種であり、機械対話や機械翻訳などのモデルとして使用することができます。元論文はこれ Sutskever, Ilya, Oriol Vinyals, and Quoc V. Le. "Sequence to sequence learning with neural networks." Advances in
rin51 2018/10/10
seq2seq

NLP

自然言語処理

機械学習

chainer
リンク
Overview - seq2seq
Introduction tf-seq2seq is a general-purpose encoder-decoder framework for Tensorflow that can be used for Machine Translation, Text Summarization, Conversational Modeling, Image Captioning, and more. Design Goals We built tf-seq2seq with the following goals in mind: General Purpose: We initially built this framework for Machine Translation, but have since used it for a variety of other tasks, inc
rin51 2018/10/10
seq2seq

NLP

自然言語処理

機械学習
リンク
LSTMネットワークの概要 - Qiita
Christopher Olah氏のブログ記事 http://colah.github.io/posts/2015-08-Understanding-LSTMs/ の翻訳です。翻訳の誤りなどあればご指摘お待ちしております。リカレントニューラルネットワーク人間は毎秒ゼロから思考を開始することはありません。このエッセイを読んでいる間、あなたは前の単語の理解に基づいて、各単語を理解します。すべてを捨てて、またゼロから思考を開始してはいません。あなたの思考は持続性を持っています。従来のニューラルネットワークは、これを行うことができません、それは大きな欠点のように思えます。たとえば、映画の中の各時点でどのような種類の出来事が起こっているかを分類したいと想像してください。従来のニューラルネットワークが、映画の前の出来事についての推論を後のものに教えるためにどのように使用できるかは不明です。リ
rin51 2018/10/05
LSTM

機械学習

RNN

自然言語処理

NLP
リンク
ニューラルネット勉強会（LSTM編）
rin51 2018/10/05
機械学習

lstm

chainer

machine learning

自然言語処理

NLP
リンク
クックパッドにおける最近の機械学習について - クックパッド開発者ブログ
こんにちは、研究開発部の山田（@y_am_a_da）です。去る2月16日、「Cookpad Tech Kitchen #5 クックパッドにおける最近の機械学習について」と題して、機械学習に関わっている方々向けの技術交流イベントを行いました。 https://cookpad.connpass.com/event/49324/ 定員が70名のイベントでしたが、告知してから30分ほどで応募者数が定員超えの100人近く集まり、最終的には400人を超す方々にお申込みいただきました。これまでに開催したTech Kitchenの中でも過去最高の申込数であり、機械学習への関心の高さを感じました。昨年7月に発足したばかりの研究開発部では、現在クックパッドに投稿されている250万品以上のレシピを始めとするさまざまなデータに対して、機械学習を活用したサービス開発を行っています。このイベントでは、研究開発部の
rin51 2017/03/04
COOKPAD

機械学習

クックパッド

NLP

自然言語処理

画像認識
リンク
Chainerを用いた対話システムの実装【seq2seq】 - Qiita
はじめに昨今，DNNs(Deep Neural Networks)の進歩が目覚ましくあらゆる分野で成功を収めています．良く耳にするのは，画像分類や音声認識の分野ですが，対話システムも例外ではなくなりました． Pythonのライブラリ環境が充実しつつある今，DNNsを用いた対話システムの構築について簡単に紹介したいと思います．対話システムのためのDNNsモデル対話システムを構築するためのDNNsのモデルは大きく分けて2つあります．大量の応答候補に対するランキング学習 -> 入力に対して応答候補文をそのまま選択発話と応答のペアから，Encoder-Decoderモデルを学習．-> 入力に対して単語単位で応答発話生成本記事では，後者のEncoder-Decoderモデルについて扱います． Chainerなどのライブラリが充実したおかげで，発話と応答のペアとなるデータさえあれば，誰で
rin51 2017/02/20
nlp

機械学習

自然言語処理

chainer
リンク
TensorFlowのSeq2Seqモデルでチャットボットっぽいものを作ってみた - Qiita
のような感じです。これをtest_data_in.txtとtest_data_out.txtも同様に準備をします。訓練用306文とテスト用306文(IN,OUTが153ずつ)の計712文で、語彙数は訓練用とテスト用それぞれ約500ずつです。データは非常に少ないです（泣）学習のコード学習を行うコードです。チュートリアルのデフォルトではバッチ（batch_size）が６４、層の数（num_layers）が3、層のユニット（size）が1024、語彙数が（vocab_size）が40000の大きさでした。 #!/usr/bin/env python # -*- coding: utf-8 -*- # Licensed under the Apache License, Version 2.0 (the "License"); # you may not use this file ex
rin51 2017/02/09
TensorFlow

NLP

自然言語処理

機械学習

ニューラルネットワー

ディープラーニング
リンク
【エヴァンゲリオン】アスカっぽいセリフをDeepLearningで自動生成してみる - Qiita
はじめにエヴァンゲリオン20周年おめでとうございます加えて、アスカの誕生日もおめでとうございます。(4日遅れ) Twitter Bot等でも使われている、文章の自動生成を流行りのDeepLearningの1種であるリカレントニューラルネットワーク(以下:RNN)を使ってやってみました。データ集め何はなくともまずはデータが無いと始まりませんね。書き起こしも覚悟してましたが、アニメ全セリフをまとめてあるありがたいサイトが有りました。感謝。こちらから全セリフを抽出しました。セリフのフォーマットはこんな感じで、キャラ名「セリフ」になってます。放送「本日、12:30分、東海地方を中心とした関東中部全域に特別非常事態宣言が発令されました。住民の方々は速やかに指定のシェルターに避難してください」放送「繰り返しお伝えいたします…」ミサト「よりによってこんな時に見失うだなんて、まいった
rin51 2017/02/09
マルコフ連鎖

NLP

自然言語処理

機械学習

ニューラルネットワー

ディープラーニング

マルコフ連鎖
リンク
わかるLSTM ～最近の動向と共に - Qiita
Machine Learning Advent Calendar 2015 第14日です。去年のAdvent Calendarで味をしめたので今年も書きました。質問、指摘等歓迎です。この記事の目的ここ2～3年のDeep Learningブームに合わせて、リカレントニューラルネットワークの一種であるLong short-term memory(LSTM)の存在感が増してきています。LSTMは現在Google Voiceの基盤技術をはじめとした最先端の分野でも利用されていますが、その登場は1995年とそのイメージとは裏腹に歴史のあるモデルでもあります。ところがLSTMについて使ってみた記事はあれど、詳しく解説された日本語文献はあまり見当たらない。はて、どういうことでしょうか。本記事ではLSTMの基礎をさらいつつ、一体全体LSTMとは何者なのか、LSTMはどこに向かうのか、その中身をまとめ
rin51 2017/02/09
NLP

自然言語処理

機械学習

ニューラルネットワー

ディープラーニング

LSTM

RNN
リンク
JUMAN++ - LANGUAGE MEDIA PROCESSING LAB
日本語形態素解析システム Juman++ † Juman++は言語モデルを利用した高性能な形態素解析システムです．言語モデルとして Recurrent Neural Network Language Model (RNNLM) を用いることにより，単語の並びの意味的な自然さを考慮した解析を行います．それにより JUMAN，MeCab に比べ大きく性能が向上しています．文法・辞書・出力フォーマット等は JUMAN から引き継いだものを利用しています．本システムは CREST「知識に基づく構造的言語処理の確立と知識インフラの構築」の支援により開発されました． ↑ 使用方法 † たとえば，次のようなテキストを入力すると， % cat sample.txt 外国人参政権私もあさって日曜最終日以下の解析結果が得られます． % cat sample.txt | jumanpp 外国がいこく外国
rin51 2017/02/09
NLP

自然言語処理

機械学習

形態素解析
リンク
新形態素解析器JUMAN++を触ってみたけど思ったより高精度でMeCabから乗り換えようかと思った話
JUMAN++は最近黒橋・河原研究室から発表された、JUMANの後継となる形態素解析器です。これまでの形態素解析器と比べて違うのは、RNN言語モデルを用いて意味的自然さを考慮する、ニューラルネットワークを利用した形態素解析器となっている点です。速度や語彙等の課題はあるものの、解析能力自体はMeCab以上なので、導入方法と共に触ってみた所感を述べてみます。導入方法前提 OS X Yosem ite 10.10.5 VirtualBox 5.1.6 Vagrant 1.8.6 インストール vagrant boxは bento/ubuntu-16.04を使用します。推奨はCentOSですが、自分の環境ではCentOSではビルドに失敗しました。また、OSはubuntu16.04でもboxによっては上手くインストールすることができないため、bentoのboxがおすすめです。 $ vagr
rin51 2017/02/09
NLP

自然言語処理

機械学習

形態素解析

juman++
リンク
ディープラーニング(seq2seq)でtwitter chatbotを作ってみた - Qiita
こんにちは。今年は冬休みをとても長くとったのですが、肉や蟹や餅や酒を連日消費しているうちに人体が終わっていき、気持ちになったので(様々な方向に感極まった状態のことを「気持ちになる」と表します)、世間で流行っているらしいディープラーニングの関連情報をつまみ食いしてチャットボットを作ってみることにしました。入力文に対しニューラルネット(RNN)で応答文を生成して返事します。 @neural_chatbot というtwitterアカウントで動かしています。ご興味があればぜひ@neural_chatbotに話しかけてみてください。あらすじニューラルネットというものがあり、関数を近似することができ、知られています。 Recurrent Neural Network (RNN)というものがあり、内部状態を持つことができ、自然言語を含む可変長の系列を取り扱うのに便利で、知られています。 Sequ
rin51 2017/02/09
NLP

自然言語処理

機械学習

ニューラルネットワー

ディープラーニング
リンク
seq2seq で長い文の学習をうまくやるための Attention Mechanism について - Qiita
概要シーケンス（例えば文章）のペアを関連付けて学習させる DeepLearning の手法 sequence-to-sequence learning において、長いシーケンスでの学習の精度を上げると言われている Attention Mechanism の論文を読んだので備忘録を兼ねて概要を書いておきます。元論文: Neural Machine Translation By Jointly Learning To Align And Translate そもそも seq2seq とはシーケンスのペアを大量に学習させることで、片方のシーケンスからもう一方を生成するモデルです。元論文： Sequence to Sequence Learning with Neural Networks tensorflow 上にも実装があります。実用例としては以下のようなものがあります。翻訳: 英
rin51 2017/02/09
NLP

自然言語処理

機械学習

ニューラルネットワー

TensorFlow
リンク
Recurrent Convolutional NNでテキスト分類 - Qiita
機械学習でテキスト分類をできないかと調べたところ、2種類の手法が提案されていました。 CNNによるテキスト分類 RNNで文書分類（Text Classification）前者の手法は既にTensorFlowによる実装があったのと、直接Chainerで記述できなかった(covolution_2dではx軸固定の畳み込みができない)ので、後者を実装してみました。追記この記事を書いた当時はフィルタの幅と入力行列の幅を同じにしたとき、0除算例外が出てしまっていたのですが、今は問題なくできるようになっていました。自分が試した頃は確かversion 1.6あたりだったと思います。 ChainerによるCNN実装例がQiitaにもあります。【Chainer】畳み込みニューラルネットワークによる文書分類こちらの実装では、単語埋め込み表現をword2vecで既に学習させたものを利用していますが、li
rin51 2017/02/09
knokさん

NLP

自然言語処理

機械学習

ニューラルネットワー
リンク
ニコニコ動画の公開コメントデータをDeep Learningで解析する - Qiita
この記事は第2のドワンゴ Advent Calendar 2015の24日目の記事です。ドワンゴエンジニアの@ixixiです。 niconicoのデータをDeep Learningなアプローチで解析してみた話です。 nico-opendata niconicoの学術目的用データ公開サイト　https://nico-opendata.jp が最近オープンしました。これまでも、国立情報学研究所にて、ニコニコ動画コメントデータや大百科データが公開されていましたが、 nico-opendataでは、ニコニコ静画のイラストデータの約40万枚のイラストとメタデータが研究者向けにデータ提供されています。今回は、ニコニコ動画コメントデータ(誰でも取得可能)を用いたDeep Learningによるコメント解析例を紹介します。超自然言語ニコニコのコメントデータに限らず、twitterでのtweetや
rin51 2015/12/24
NLP

自然言語処理

機械学習

ニューラルネットワー

ディープラーニング
リンク
自然言語処理分野におけるディープラーニングの現状
rin51 2015/06/11
機械学習

nlp

deeplearning

人工知能

自然言語処理
リンク
1 2 次のページ