[B! Transformer] nagggのブックマーク

naggg id:naggg

Transformerに関するnagggのブックマーク (26)

GWに徹底理解！GPTの仕組みをめちゃくちゃ分かりやすく解説する無料動画公開 | Ledge.ai
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
naggg 2024/04/29
AI

ChatGPT

Transformer

あとで読む
リンク
「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた - 渋谷駅前で働くデータサイエンティストのブログ
先日、こちらのポストをお見かけしました。 AI 技術開発部の高橋が社内勉強会の資料「時系列予測にTransf ormerを使うのは有効か？」を公開しました。論文Are Transf ormers Effective for Time Series Forecastingの紹介を中心に、時系列予測について解説しています。ぜひご覧ください。https://t.co/LplxTT8b1d pic.twitter.com/nUXb4bGiQ3— GO Inc. AI Tech (@goinc_ai_tech) 2023年9月28日なるほど、NN全盛というかNN一択の時代にあっては時系列予測もNNでやるのが当たり前になったのだなという感想でした。大昔「沖本本」で古典的な計量時系列分析を一通り学んだ身としては隔世の感がありますが、これもまたNN時代の趨勢なのでしょう。なお、元論文2点は上記リンクから辿
naggg 2023/10/27
AI

Transformer

研究
リンク
自称Transformer後継モデル「RetNet」マイクロソフトら開発、脳活動から音楽を生成するAI「Brain2Music」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第4回目は、Googleが開発した、昨今の生成AIの根幹をなすTransf ormerモデルの後継をうたう、マイクロソフトの技術など、5つの論文をまとめました。生成AI論文ピックアップTransf ormer同等の性能でメモリ効率がよく高速なモデル「RetNet」　Microsoft含む研究者らが開発 Meta、商用利用可能な大規模言語モデル「Llama 2」発表画像内の物体テレポーテーションAI「AnyDoor」　アリババ含む研究者らが開発生成AIの処理が高速になる「FlashAttention-2」　米スタンフォード大の研究者が開発脳活動から音楽を生成するAI
naggg 2023/07/31
AI

研究

Transformer

大規模言語モデル
リンク
自然言語処理の技術紹介：危険すぎる（GPT-2）モデルと関連する技術を試してみた話（簡単な翻訳、ニュースの内容とFX動きの予測） - GMOインターネットグループグループ研究開発本部
2019.12.24 自然言語処理の技術紹介：危険すぎる（GPT-2）モデルと関連する技術を試してみた話（簡単な翻訳、ニュースの内容とFX動きの予測）こんにちは。次世代システム研究室のK.S.（女性、外国人）です。そろそろ今年（2019年）も終わるということで、今年、盛り上がっていた人工知能（AI）の一部の関連技術をふりかえってみました。自分の勝手な印象ですが、今年の気になった技術だと、自然言語処理といったAIの一つです。特に、びっくり技術ニュースといえば、危険すぎると言われた自動文章作成モデルGPT-2だろうなと思いました。ということで、今回のブログでは、GPT-2についての勉強と簡単な実装を共有させて頂きたいと思います。遡ってみると、2019年2月に、OpenAIといった有名な人工知能（AI）を研究する非営利団体がテキスト生成などの大規模な自然言語モデル（GPT-2）を発表しまし
naggg 2023/06/24
“BERTはencoder (multi-head attention)を利用するため、空白に単語を埋めるのが得意です。逆に、GPT-2はdecoder（masked multi-head attention）を利用するため、次の単語を予測するのが得意です”

AI

研究

Transformer
リンク
ジェネレーティブAIの基礎を築いた論文「Attention Is All You Need」著者たちの今——期待される〝OpenAIマフィア〟の出現 - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報
2017年の画期的な研究論文「Attention Is All You Need」で、Google は、テキストや画像データ間の連続した関係や深い意味を強力なニューラルネットワークで学習する、つまり AI をより本物の「人」に近づける言語モデル「Transf ormer」を紹介した。 Image credit: Google 2017年、Google は画期的な論文「Attention Is All You Need」を発表し、今日の AI トレンドの基礎を築いた。 Transf ormer の最も重要なブレークスルーは、言語モデルの運用フローとは別に、多くの処理作業を同時に行うことでコンピューティングパワーを利用できるようにする「並列化」だ。スタンフォード大学の研究者は2021年の論文で、「AI 分野のパラダイムシフトを促すだけでなく、AI で何が可能かという想像力を広げる」と、Transf
naggg 2023/05/02
この視点は面白いな〜

AI

Transformer

研究

スタートアップ
リンク
GPT-1→GPT-2→GPT-3→GPT-3.5→ChatGPT→GPT-4までの進化の軌跡と違いをまとめてみた｜スタビジ
当サイト【スタビジ】の本記事では、昨今のAIの進化のきっかけになっているGPTシリーズについてまとめていきたいと思います。GPT-1から始まりGPT-2、GPT-3、そしてChatGPTであるGPT-3.5、GPT-4と進化してきました。この進化の軌跡と違いについて解説していきます。こんにちは！データサイエンティストのウマたん(@statistics1012)です！この記事では最近のAIブームの火付け役になったGPTシリーズについて簡単にまとめていきたいと思います。
naggg 2023/04/08
AI

Transformer

GPT-4
リンク
Anond AI開発日記 - Hatena Developer Blog
こんにちは。Anond AIを研究している id:cockscomb です。私たちはこの度、このAI時代を制するプロダクト、Anond AIを開発しました。本エントリではその詳細について説明します。 Anond AIとは Anond AIはいわゆるGenerative AIで、人類が匿名で日記を書くことをアシストしてくれるものです。私たちは日記に芸術性を感じる文化を持っていて、「日記文学」という言葉もあります。Generative AIによって、名前を隠して楽しく日記を書くことをサポートし、匿名日記文化のさらなる発展に寄与できないか、と考えました。 Anond AIは、rinna/japanese-gpt2-mediumをはてな匿名ダイアリーのデータを用いてファインチューニングし、ドメイン適応させたものです。 Anond AIの開発 Anond AIは実験的なプロダクトのため、Hatel
naggg 2023/04/02
AI

はてな

Transformer
リンク
Transformerに自分の好みのDLsite音声作品を学習させて、癖に刺さる新作を毎日通知するシステムを作った話 - Qiita
Transf ormerに自分の好みのDLsite音声作品を学習させて、癖に刺さる新作を毎日通知するシステムを作った話作ったもの DLsiteの新作音声作品をクローリング -> 好みかどうか推論 -> 好みならSlack通知をするシステムを完全サーバーレス（AWS SAM）で構築しました。さらなる精度向上のため、Slackメッセージのボタンをもとに教師データを蓄積する処理も作りました。デモ（ぼかしMAX）とてもわかりにくいですが、好みであろう作品がPOSTされているSlackの画面です。各メッセージについている「興味あり！」「別に…」ボタンを押すとLambdaが起動し、DynamoDBに新たな教師データとして保存されます。なぜ作ったのか DLsiteが好き、以上。・・・もう少し真面目に書くと、会社でテキストデータに触れることが多いので、うまく扱えるようになりたい音声作品はシチ
naggg 2023/02/25
AI

Transformer
リンク
ネットワーク分析から直感的に理解するTransformerの仕組みと処理の流れ - あつまれ統計の森
グラフ理論と隣接行列グラフ理論は点と線で物事を表す理論です。たとえば駅の路線図では下記のように駅を点、路線を線で表します。東京メトロホームページより上記の路線図では「駅と駅が隣接するかどうか」を中心に取り扱う一方で、それぞれの位置や方角などは厳密に再現はされません。このように、「隣接するかどうか」のみに着目して物事を表す際の理論を「グラフ理論」といいます。グラフ理論では点をノード(node)、線をエッジ(edge)、全体をグラフ(graph)と定義します。数式で表すと$G = (V,E)$のように表しますが、$V$が頂点のVertice、$E$がEdge、$G$がGraphであるとそれぞれ解釈すると良いです。グラフの表記法に関しては主に$2$通りあり、「①図を用いる」と「②隣接行列を用いる」をそれぞれ抑えておくと良いです。例があるとわかりやすいので下記のWikipediaの例を元
naggg 2023/02/21
昔、同じ主張のYouTubeを見て、「詳細は次回」のまま次回がなかったことがあったので、助かるー

AI

Transformer

あとで読む
リンク
30分で完全理解するTransformerの世界
はじめに初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI 技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。深層学習界隈では、2017年に衝撃的なタイトル（Attention Is All You Need）の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transf ormer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。今回はそんなTransf ormerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transf ormers に倣いつつ、適宜、2023年2月上旬現在ま
naggg 2023/02/15
めっちゃ詳しい・・・！参考文献、参考資料もたくさんあって、ありがたい・・・！

AI

機械学習

自然言語処理

Transformer
リンク
https://twitter.com/goto_yuta_/status/1598524732944830469
naggg 2022/12/28
AI

Transformer

Google
リンク
Vertex AI ではじめる「大規模言語モデル」
2017 年に Transf ormer が提案されてから自然言語処理の技術が飛躍的に進化しました。特に GPT-3 や PaLM など Large Language Model (LLM, 大規模言語モデル) は、近年の機械学習で最も関心が高い研究分野の一つであり、テキストや音声データから新しいインサイトを得る方法として注目を浴びています。このセッションでは、LLM を取り巻く環境の変化、Google の T5X などのフレームワークや Google Cloud での LLM 運用についてご紹介します。チャプター： 0:00 イントロダクション 1:02 LLM(Large Language Model) とは 11:31 様々な LLM 26:03 Google Cloud における T5X の活用 35:00 まとめ 36:07 ライブ Q&A • Google Cloud Ja
naggg 2022/12/09
あとで読む

AI

Transformer

Google
リンク
ChatGPT使い方総まとめ - Qiita
こんにちは！sakasegawaです！ ( https://twitter.com/gyakuse ) 今日は今流行のChatGPTについて紹介します！ ChatGPTとは OpenAIが開発するGPT-3(※)というめちゃくちゃすごい言語モデルをベースとしたチャットアプリです。色んな質問にすぐ答えてくれます。この記事ではさまざまな使い方を紹介します。 https://chat.openai.com/ ちなみにGPT-3関連では、noteの以下記事も便利なのでぜひ読んでみてください AIがコミットメッセージ自動生成！神ツール『auto-commit』『commit-autosuggestions』の紹介 ※正確にはGPT-3.5シリーズと呼ばれています ChatGPTの仕組みを考えながらプロンプトを作る手法はこちらに別途まとめています文章質問-応答〜について教えて Wikiped
naggg 2022/12/04
AI

ChatGPT

Transformer
リンク
Introducing Whisper
Whisper is an automatic speech recognition (ASR) system trained on 680,000 hours of multilingual and multitask supervised data collected from the web. We show that the use of such a large and diverse dataset leads to improved robustness to accents, background noise and technical language. Moreover, it enables transcription in multiple languages, as well as translation from those languages into Eng
naggg 2022/09/24
こいつもTransformerなんか。

AI

音声認識

Transformer
リンク
古い白黒映画を“昨日撮影したかのように”AIが修復　フィルムノイズを除去しカラー
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。香港城市大学と米Microsoft Research、Microsoft Cloud+AIによる研究チームが開発した「Bringing Old Films Back to Life」は、劣化の激しい古い白黒映画を修復しカラー映像に変換する深層学習フレームワークだ。古い映像にある独特のフィルムノイズなどを修復し、色付けを行う。古い映画は、現代の観客の心にも響き感動を与えるが、フィルムの経年劣化による解像度の低下やアーチファクトにストレスを抱える視聴者もいるだろう。このような古い映画をよみがえらせるために、映画の修復技術が開発されてきたが、1コマずつ丹念に調べ、傷のレタッチ、ちらつきの修正
naggg 2022/04/11
“学習モデルは、時間的整合性に役立つRecurrent Neural Network（RNN）と空間的復元に役立つTransformer（Swin Transformer）の主要な2つのモジュールの組み合わせで構成”

AI

映画

研究

Transformer
リンク
How to get meaning from text with language model BERT | AI Explained
In this video, we give a step-by-step walkthrough of self-attention, the mechanism powering the deep learning model BERT, and other state-of-the-art transf ormer models for natural language processing (NLP). More on attention and BERT: https://bit.ly/38vpOyW How to solve a text classification probl em with BERT with this tutorial: https://bit.ly/2Ij6tGa 0:00 Introduction of NLP 0:39 Text tokenizati
naggg 2022/02/15
AI

自然言語処理

大規模言語モデル

Transformer
リンク
ymicky on Twitter: "Transformerを理解するのにこの動画がかなりわかりやすかった。 3Dアニメーションで説明してくれる https://t.co/VUnkCFMDVB https://t.co/4f3zOxsDbv"
Transf ormerを理解するのにこの動画がかなりわかりやすかった。 3Dアニメーションで説明してくれる https://t.co/VUnkCFMDVB https://t.co/4f3zOxsDbv
naggg 2022/02/15
AI

自然言語処理

大規模言語モデル

Transformer
リンク
GiNZA v5のTransformerモデルによる固有表現抽出 | 株式会社AI Shift
こんにちは AIチームの戸田です今回は日本語NLPライブラリであるGiNZAのv5から実装されたTransf ormerモデルによる固有表現抽出を試します。固有表現抽出とは、入力となる自然文から地名や製品名などの固有名詞を抽出するタスクです。今回固有表現抽出に使用するデータセットとして、ストックマーク株式会社が作成したWikipediaを用いた日本語の固有表現抽出データセットを使用します。また、Transf ormerモデルは処理に時間がかかるので、環境はGoogle ColaboratoryのGPU環境を利用しました。事前準備 wgetを使ってデータセットをダウンロードします。 wget https://raw.githubusercontent.com/stockmarkteam/ner-wikipedia-dataset/main/ner.json 必要なpythonライブラリをダ
naggg 2022/01/23
AI

Transformer

自然言語処理
リンク
ヤフーにおける自然言語処理モデルBERTの利用
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo! JAPAN研究所で自然言語処理の研究開発をしている柴田です。私は自然言語処理の研究と、最新の自然言語処理技術を社内のサービスに適用できるようにする開発の両方を行っています。今日は後者の話をします。この記事ではBERTというモデルに焦点をあて、BERTの概要と、社内でのBERTの利用、最後に具体例として検索クエリのカテゴリ分類について紹介します。 ※この記事で取り扱っているデータは、プライバシーポリシーの範囲内で取得したデータを個人が特定できない状態に加工しています。 1. BERTとは 2018年にGoogleからBERT (Bidirectional Encoder Representations
naggg 2021/12/20
BERT

Transformer

自然言語処理
リンク
megagonlabs/t5-base-japanese-web · Hugging Face
","unk_token":"","pad_token":""}},"discussionsDisabled":false,"downloads":375,"downloadsAllTime":46612,"id":"megagonlabs/t5-base-japanese-web","isLikedByUser":false,"isWatchedByUser":false,"inference":"Yes","lastModified":"2021-09-06T10:32:21.000Z","likes":18,"pipeline_tag":"text2text-generation","library_name":"transf ormers","librariesOther":[],"model-index":null,"private":false,"repoType":"model
naggg 2021/08/26
AI

Transformer

自然言語処理
リンク
1 2 次のページ