本文「自然言語処理」を検索 - はてなブックマーク

41 - 80 件 / 3682件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

自然言語処理の検索結果41 - 80 件 / 3682件

ChatGPTに自社データを組み込んで新しい検索体験を模索してみました｜masa_kazama
- 521 users
- note.com/masa_kazama
- テクノロジー
- 2023/03/03
イントロChatGPTやBing、NotionAIなどの大規模自然言語モデル(LLM)を活用したサービスが注目を集めています。対話、要約、翻訳、アイデア生成などの多様なタスクにおいて、とても性能が高いです。ただ、ChatGPTでは、ときどき嘘が混じっていたり、文献が捏造されたりすることがあります。 ChatGPTとの対話画面（結果の書籍は存在しない）それを防ぐために、BingやPerplexityでは、文献を引用した上で、なるべく嘘が紛れ込まない形で回答してくれます。 Perplexityでは引用もつけてくれるしかし、これらのAIは、Web上の公開されている一部のデータを元に学習しているので、公開されてないデータに対しては当然ながら、正しく回答できません。そこで、この記事では、自社が保有しているデータをChatGPTに組み込んで、自社オリジナルのPerplexityのようなシステムを作る
- ChatGPT
- AI
- あとで読む
- gpt
- データ
- search
- 文章
- 検索
- プログラミング
- 自然言語処理
GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
- 506 users
- nowokay.hatenablog.com
- テクノロジー
- 2023/04/25
やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。まず理論的な概要。機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思います。最初は数式が多いのだけど、Σをfor文だと思いつつ、定義が説明文中に埋まってるPerlよりたちが悪い記号主体言語だと思えば読めるけどめんどくさいので飛ばしても問題ないと思います。深層学習からマルチモーダル情報処理へ (AI/データサイエンスライブラリ“基礎から応用へ” 3) 作者:中山英樹,二反田篤史,田村晃裕,井上中順,牛久祥孝サイエンス社Amazon で、もういきなり作る。トークナイザーから全部つくっていきます。TensorFlowでBERTをつくってGPT2をつくる
- GPT
- あとで読む
- ChatGPT
- AI
- 本
- 学習
- 人工知能
- 文章生成AI
- ライブラリ
- Transformer
もし「リーダブルコード」を弁護士が読んだら？ - MNTSQ Techブログ
- 506 users
- tech.mntsq.co.jp
- テクノロジー
- 2022/12/27
こんにちは。「リーダブルコード」を先月読破して、感銘を受けた弁護士の人です。なにに感銘を受けたかというと、「エンジニアが高級言語を効率的にコーディングするための工夫」は、契約という言語をコーディングするために援用できることがとても多いということです。例えば、リーダブルコードは「関数には空虚な名前（tmpとかretvalとか）でなく、エンティティの実体に即した名前をつけよう！」と提案しています。これめっちゃわかります！！！なぜなら、契約言語では当事者というクラスの表現のために「甲」「乙」という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも「一定のインプットを入れると、必ず一定のアウトプット
- 技術
- あとで読む
- 法律
- 社会
- law
- 契約
- language
- 言語
- プログラミング
- コード
人気コメント算出アルゴリズムの一部にYahoo! JAPANの「建設的コメント順位付けモデルAPI」を導入しました - はてなブックマーク開発ブログ
- 503 users
- bookmark.hatenastaff.com
- テクノロジー
- 2021/07/19
コメント表示改善の一環として、Yahoo! JAPANの「建設的コメント順位付けモデルAPI」を導入し、攻撃的であったり不謹慎であるなど穏当でないコメントが人気コメントに掲載される問題を抑制する取り組みを開始しました。今回の施策の意図と今後の方針はてなブックマークでは「より豊かで多様な価値観が集まるプラットフォーム」を目指し、これまで一貫してユーザーの皆様の自由な表現やコミュニケーションを尊重する方針を基盤としてサービスを運営してきました。このポリシーは、これからも変わらない普遍的な価値観として掲げていくことは変わりありません。ただし、どのような表現であっても許容するものではなく、ヘイトスピーチに類する表現、継続的に行われる過度な攻撃表現については基準を設け、表示を停止する対応を取っております。その一方、扇情的な表現、極端な意見、不謹慎な表現などは個人の価値観に基づく表現として一定範
国会議員のTweet40万件分析して支持すべき政治家を探してみた - エルの楽園
- 486 users
- lllagoon.hatenablog.com
- 政治と経済
- 2020/12/18
新型コロナ禍が我が国の政治の深刻な問題をあぶり出しています。一市民としては支持する政治家を本腰入れて検討しなければいけません。個人的な問題意識は主に「労働」と「財政」にありますので、これらの問題に積極的に取り組んでくれる方がいいです。今回のコロナ禍でこの2つは本当に切実な問題になりました。反対に「脱原発」とか「改憲」はやめてほしいかな……「財政再建」とかも当然ムリ！あ、もちろん国政の話です。そんな訳でデータの力で問題意識の合う現職国会議員を探してみました。使うのはみんな大好きPython3 on Google colab(Jupyter notebook)です。技術的な話を飛ばして結論だけ見たい方はこちらからどうぞ。やったことまずはTwitterをやっているすべての現職国会議員のTweetを一人当たり最新1000件ほど取得します。現職国会議員のアカウント一覧は国会議員いちらんリスト
- SNS
- 政治
- あとで読む
- twitter
- プログラミング
- データ
- 社会
- 国会
- 考察
- Python
Self-Attentionを全面的に使った新時代の画像認識モデルを解説！ - Qiita
- 485 users
- qiita.com/omiita
- テクノロジー
- 2020/08/31
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします！(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
- 451 users
- euske.github.io
- テクノロジー
- 2023/02/26
(数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transformer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transformer を参照のこと。日本語ではこの解説がわかり
サイバーエージェント、最大68億パラメータの日本語LLM（大規模言語モデル）を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―
- 451 users
- www.cyberagent.co.jp
- テクノロジー
- 2023/05/17
株式会社サイバーエージェント（本社：東京都渋谷区、代表取締役：藤田晋、東証プライム市場：証券コード4751）は、最大68億パラメータの日本語LLM（Large Language Model、大規模言語モデル）を一般公開したことをお知らせいたします。近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および日本文化に強いLLMは少ない状況です。 ■最大68億パラメータの日本語LLM（大規模言語モデル）の公開についてこうした背景のもと、当社は日本語LLMの開発に取り組んでおり、このたび一部モデルをHugging Face Hubにて公開いたしました。公開されたモデルはオープンな日本語データ※2で学習したもので
- AI
- あとで読む
- LLM
- 日本語
- ChatGPT
- 学習
- 開発
- 人工知能
- 機械学習
- サイバーエージェント
【2021年】話題になった無料お勉強コンテンツ - まなめはうす
- 438 users
- maname.hatenablog.com
- テクノロジー
- 2021/12/30
社会人になってからの勉強って高尚な趣味になりがちで、次の仕事のイメージをもって勉強できる人ってなかなかいないと思っている。それでも、ただ楽しそうとか、やってみたいという好奇心持っている人は純粋に凄いなって思うので、そういう人に届くよう今年の人気コンテンツとなったリンクを整理しておく。無料コンテンツ勉強マニアの方が、この中からおすすめランキングなんて作ってくれたらさらに素晴らしいのになって思いながら。また、世界を広げるためにも裾野を広げるために無料公開に踏み切ったコンテンツ制作者の方々への想いには頭が下がるばかり。それはもう何か月もかけて作ったコンテンツが多くの人に読まれ、その中からさらにその世界を強くするだけの人が誕生してくれること良いですね。私個人としては、自分の世代にはまだ存在していなかった分野の基礎講座にはとても興味が引かれる部分で、知識の地盤というか、単語を正しく理解できるのが
- 勉強
- あとで読む
- 学習
- プログラミング
- 統計
- 無料
- まとめ
- コンテンツ
- データ
- AI
JP Contents Hub
- 432 users
- aws-samples.github.io
- テクノロジー
- 2022/09/18
AWS 日本語ハンズオン Amazon Web Services(AWS) の日本語ハンズオンやワークショップを、カテゴリごとにまとめています。右側の目次や、ヘッダー部分の検索ボックスから、各コンテンツにたどり着けます。また、Ctrl + F や command + F を使ったページ内検索もご活用いただけます。料金についてハンズオンで作成した AWS リソースは通常の料金が発生します。作成したリソースの削除を忘れずにお願いします。もし忘れてしまうと、想定外の料金が発生する可能性があります。画面の差異についてハンズオンで紹介されている手順と、実際の操作方法に差異がある場合があります。 AWS は随時アップデートされており、タイミングによってはハンズオンコンテンツが追いついていない事もあります。差異がある場合、AWS Document などを活用しながら進めて頂けますと幸い
- aws
- 学習
- あとで読む
- ハンズオン
- amazon
- study
- tutorial
- dynamodb
- ecs
- 教材
LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発　新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に | ニュース | LINE株式会社
- 430 users
- linecorp.com
- テクノロジー
- 2020/11/25
LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発　新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に従来の特化型言語モデルとは異なる、汎用型言語モデルを実現予定。処理インフラには世界でも有数の、700ペタフロップス以上の高性能スーパーコンピュータを活用 LINE株式会社（所在地：東京都新宿区、代表取締役社長：出澤剛）はNAVERと共同で、世界でも初めての、日本語に特化した超巨大言語モデル開発と、その処理に必要なインフラ構築についての取り組みを発表いたします。超巨大言語モデル（膨大なデータから生成された汎用言語モデル）は、AIによる、より自然な言語処理・言語表現を可能にするものです。日本語に特化した超巨大言語モデル開発は、世界でも初めての試みとなります。従来の言語モデルは、各ユースケース（Q&A、対話、等）に対して、自然言語処理エンジニアが個
- AI
- あとで読む
- LINE
- 機械学習
- 言語
- NLP
- 開発
- 日本語
- 自然言語処理
- データ
AI・Python活用レシピ100選 - Qiita
- 430 users
- qiita.com/Axross_SBiv
- テクノロジー
- 2021/09/01
※ 一部ガイドラインに反する内容がありましたので、該当箇所を修正のうえ再投稿しております。はじめに Axross は、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。現役エンジニアによる実践ノウハウが"レシピ"として教材化されており、実際に動くものを作りながら、具体的な目的・テーマをもってプログラミングを学ぶことができます。今回は、Axross運営が厳選した『AI・Python活用レシピを100選』をご紹介します。是非、みなさまのAIやPython学習の参考にしてみてください。 Axross：https://axross-recipe.com 公式Twitter：https://twitter.com/Axross_SBiv 基礎スクレイピング 01 . JUMPの掲載順をスク
- python
- あとで読む
- AI
- 学習
- レシピ
- 機械学習
- qiita
- プログラミング
- 分析
- データ
Udemyで夏の大キャンペーン開催！はてなブロガーも受講した、Python・機械学習・人工知能など最先端スキルを学べる講座を5つピックアップ - はてなニュース
- 426 users
- hatenanews.com
- テクノロジー
- 2019/08/21
お盆休みが明けてもう8月下旬。秋に向けて自分が学んでみたいことや身に付けておきたい技術などを見つけ始めるにはよいタイミングです。そこで、オンライン学習プラットフォーム・Udemy（ユーデミー）のオンライン講座をチェックしてみてはいかがでしょうか。 Udemy(ユーデミー)公式サイト Udemyの講座は一度購入すれば受講に期限はなく、PCでもスマートフォンでもデバイスを問わず見られるので、ちょっとした隙間の時間を有効に活用可能。必要な時に必要な講座を選べます。はてなブログを使って、受講内容のまとめや振り返り、学んだことのメモを書いている方も多くいらっしゃいます。今回はUdemyの数ある講座の中から、はてなブログユーザーさんの声も交え、おすすめの講座を5つピックアップしました。 Udemyでは8月30日（金）午後3時59分まで、対象の講座が1,200円から受講できる大セールが実施されています！
- Udemy
- あとで読む
- 学習
- python
- はてな
- 開発
- キャンペーン
- アプリ
- 機械学習
- ニュース
機械学習による株価予想の十八手 - Qiita
- 417 users
- qiita.com/heegle
- テクノロジー
- 2021/06/20
1. 株価はサプライズによって動く株式相場には常にプロの投資家がうごめいており、各銘柄の各種業績数値を常に予想して投資活動をしている。そんな状況下において、仮に「売上が前年比2倍」という決算が発表されても、株価が2倍になるわけではない。むしろ3倍が予想されていたのに、2倍だったら失望売りとなる。つまり事前予想と比較してこそ意味があり、staticな値や過去実績との比較を特徴量にすることはあまり意味がない。事前予想と決算の乖離、または前回予想と今回予想の乖離こそが意味のある特徴量であると言える。 2. 業績数値の単純な変化率では株価インパクトは測れない営業利益の事前予想100億円に対し、決算が200億円の場合、変化率 = （実績 - 予想 ) / 予想の計算式を使うと、変化率は100%となる。この変化率を特徴量にするのは一見もっともらしいが、株においてはこれは使いづらい。営業利
- 機械学習
- あとで読む
- 投資
- AI
- 株
- アルゴリズム
- qiita
- 株価
- ML
- python
2019年末版形態素解析器の比較 - Qiita
- 416 users
- qiita.com/hi-asano
- テクノロジー
- 2019/12/17
形態素解析は日本語処理の初歩であり、文を単語に分割したり、品詞や活用形、基本形を分析するために行います。本記事では形態素解析のツールをいくつかの出力例を交えて比較していきます。（SentencePieceでいいじゃん、という人はお呼びでないですが、そういう方には、Twitterのトレンドが変な分割になってたら嫌では？と申し上げておきたいです） MeCab 言わずと知れた形態素解析器。とりあえずMeCabを使うという人は今なお多いことでしょう。とにかく高速であるということと、システムと辞書が分離されているのが特徴です。またPythonから使うのも簡単になりました（Janomeというものがありましたがmecab-python3の方が高速です）。Javaから使いたい人はKuromojiを使えばmecab(+ipadic)相当の結果が得られるはずです。辞書はIPA辞書が推奨されていますが、Un
エンジニアに読んで欲しい技術書90選 - Qiita
- 416 users
- qiita.com/S4nTo
- テクノロジー
- 2023/10/30
はじめにタイトル通り、読んで欲しい（圧）技術書をたくさん集めてみました。自身の担当から外れる領域に関しては、会社の人に協力を仰ぎ、編集しました。「何を読めばいいかわからない」、「次の読む本を探したい」などのように考えている方の参考になればと思います。また、大きく、・新米エンジニア・脱新米エンジニアと分けてまとめたので、参考にしてみてください。技術書のススメ技術書の紹介の前に、技術書で得られるものについて説明したいと思います。全然読み飛ばしてもらって大丈夫です。この章から本の紹介を行なっていきます。技術書は体系的な構成となっているため、技術書を読むことで、・論理的な思考力が身に付く・技術の歴史・背景を知れる・技術の知識、手法を学べるこれらを学ぶことができます。論理的な思考力、知識はわかるけど、技術の歴史・背景を知ってどうするんだと思う方もいるかもしれません。しかし、歴
- エンジニア
- あとで読む
- 本
- 学習
- 技術
- プログラミング
- 書籍
- 技術書
- おすすめ
- qiita
東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講松尾豊氏が講師を務める講座も | Ledge.ai
- 414 users
- ledge.ai
- テクノロジー
- 2021/02/01
TOP > Article Theme > AI（人工知能）ニュース > 東大松尾研究室、無料でディープラーニングや自然言語処理を学べる講座開講松尾豊氏が講師を務める講座も東京大学松尾研究室は1月29日から、無料でディープラーニング（深層学習）や自然言語処理について学べる、短期間のオンライン講座の受講者を募集している。対象は学生（大学院、大学、高専、専門学校生、高校、中学など）。募集は2月8日（月）の10時00分まで。選考結果は2月15日（月）までに受講決定者にメールで連絡する。今回、募集しているオンライン講座は「スプリングセミナー2021：深層強化学習」「プリングセミナー2021：深層生成モデル」「プリングセミナー2021：Deep Learning for NLP講座」の3つ。なお、人工知能（AI）研究の第一人者で、東京大学松尾研究室を率いる松尾豊氏は企画・監修だけではなく、
- AI
- あとで読む
- 学習
- ディープラーニング
- 機械学習
- 研究
- 勉強
- 松尾豊
- 大学
- 東京
我偽中国語翻訳機作成了 - Qiita
- 413 users
- qiita.com/shoichiro-k
- テクノロジー
- 2019/06/25
のように、日本語の文章から偽中国語を自動生成したい。偽中国語とは中国語のようでいて日本人でも意味を理解できてしまう漢字の羅列のこと。通常「私はご飯が食べたい」を中国語では我想吃饭と書きます。一方で偽中国語は我飯食希望と「私はご飯を食べることを希望する」と読めなくもない表記で記します。これが偽中国語です。以前からTwitterやLINEなど各種SNSで使われてきたユーモアあふれる記法です。そこで、日本語の文字列を与えることで偽中国語に変換してくれる翻訳機を作りました。サンプル実行環境 macOS High Sierra 10.13.6 Python 3.5.1 方針実装方法偽中国語の慣例上 1 、 - 動詞「○○する」は「○○実行」と変換することが多い - 「明日お酒飲みに行かない？」のような提案する文章の場合、文末に「如何?」を付ける - 「私は◯◯したい」のよう
- python
- あとで読む
- ネタ
- 中国語
- Qiita
- 言語
- 中国
- 翻訳
- 日本語
世界で74万人以上が受講した海外講座を“日本語で”学ぼう！ Udemyで初夏のビッグセール開催＆大人気講座をチェック - はてなニュース
- 410 users
- hatenanews.com
- テクノロジー
- 2022/05/17
多くの企業から「人手不足だ」という話が聞こえてきます。なんでも、新しいビジネスを始めようとしたり、新規サービスを立ち上げようとしたり、はたまた事業規模を拡大したり、ということで人材を募集しても、なかなか集まらないんだとか。それも、大企業からスタートアップまで、会社の規模の大小や領域に限らず、ありとあらゆる分野の企業が当てはまっています。特にIT業界は、ただでさえ業界全体が成長しているうえに、技術の進歩と陳腐化が激しいため、基礎的な技術や知識を持ちながら、新たな情報やトレンドもフォローしているようなエンジニアは、引く手あまた。さらに最近では、エンジニアでなくてもビジネス分野で活躍するためには、データを扱うことができる高度な知識と経験が求められるケースが増えてきていることもあって、人手不足に拍車が掛かっているのだそうです。そんな社会の中で、自分を成長させ、新たな分野に踏み出していくためには
- 学習
- あとで読む
- Udemy
- 勉強
- アルゴリズム
- エンジニア
- web
- amazon
実務の専門家として機械学習や統計分析を手掛けたい人にオススメの書籍初級5冊＆中級8冊＋テーマ別11冊（2020年2月版） - 渋谷駅前で働くデータサイエンティストのブログ
- 407 users
- tjo.hatenablog.com
- テクノロジー
- 2020/02/03
(Image by Pixabay) この記事は以下のオススメ書籍リスト記事のアップデートです。毎回の断り書きで恐縮ですが、この記事では「データサイエンティストや機械学習エンジニアなどデータ分析の実務の専門家として」*1機械学習や統計分析を手掛けていきたいという、主に初級ないし中級ぐらいのスキルレベルの人たちにお薦めしたい書籍を、初級向け5冊・中級向け8冊及び細かいテーマ別に11冊、それぞれ挙げていきます。スタンスとしては相変わらず「当座の最終到達点を『中級』に置いた時に最初に読んで内容をマスターしておくべき書籍」を初級に置いているので、世の中のこの手のお薦め書籍リストに比べると若干ハードな内容のものが初級向けに多いかもしれません。後はちょっと気が早いかもしれませんが、機械学習パートに関しては「AutoML時代にあっても実務の専門家であれば知っておくべき知識」を収めた書籍を選んでおきま
- 機械学習
- 統計
- あとで読む
- 本
- 学習
- 書籍
- データ
- book
- 統計学
- ML
【2021年】AWS全サービスまとめ | DevelopersIO
- 407 users
- dev.classmethod.jp
- テクノロジー
- 2021/01/06
こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2021年版です。こんにちは。サービスグループの武田です。このエントリは、2018年から毎年公開している AWS全サービスまとめの2021年版です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの？」という疑問を自分なりに理解するためにまとめました。今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2020年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 205個です。まとめるにあ
- aws
- あとで読む
- サービス
- まとめ
- amazon
- webサービス
- EC
- データ
LLM chatbotが人類にもたらすのは、絶望なのか希望なのか - 渋谷駅前で働くデータサイエンティストのブログ
- 400 users
- tjo.hatenablog.com
- テクノロジー
- 2023/03/24
ちょっと前に以下のようなことを放言したら、思いの外反響が多くてちょっとびっくりしたのでした。それだけ、現代のLLM chatbot / generative AIの台頭に期待と不安を抱いている人が多いということの裏返しなのでしょう。既に色々コメントが出ているけど、我々人類が「知的労働」だと思っていることの大半が実は「過去実績をなぞって適当にその場に合わせて組み立てているだけ」なんじゃないかと訝っているので、そういう「自称知的労働」は多分LLMで代替されると思う。新奇なものを生み出す仕事は相変わらず残る https://t.co/GGK41vSDcn— TJO (@TJO_datasci) 2023年3月15日昨年の年末振り返り記事でも話題にしたChatGPT（そして後続の各種LLM chatbot）ですが、今年に入ってからの話題の広がり方には想像を超えるものがあり、ついに朝の情報番組な
- AI
- ChatGPT
- あとで読む
- GPT
- 機械学習
- 人工知能
- LLM
- 自然言語処理
- nlp
- 仕事
【2021年】技術書好きプロエンジニア達が紹介する40選 - RAKUS Developers Blog | ラクスエンジニアブログ
- 396 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2021/09/10
こんにちは、技術広報のyayawowoです。皆様、お気に入りの技術書はありますか？今回は、弊社主催で開催している「おすすめの技術書LT会」にて、エンジニア/デザイナーの皆さんに紹介いただいた技術書を一挙公開します！おすすめの技術書 LT会 - vol.1 おすすめの技術書 LT会 - vol.2 積読が増える可能性がある、エンジニア/デザイナーが厳選した技術書が盛り沢山…お読みになる際は覚悟ください！ラクス開発メンバーが選んだ技術書は以下をご確認ください。・開発メンバーが選ぶ、おすすめの技術書【2020年度】 - RAKUS Developers Blog | ラクスエンジニアブログ入門シリーズ『C++プログラミング入門（湯田幸八）』『ドメイン駆動設計入門』『実践SQL教科書』『ソフトウェアデザイン 2021年3月号』『独習C 新版』『PHPの絵本第2版 Web
- エンジニア
- あとで読む
- 本
- 技術書
- 学習
- 技術
- おすすめ本
- book
- 書籍
- プログラミング
TypeScriptではじめるChatGPT API：入門から一歩進んだテクニックまで - Uzabase for Engineers
- 395 users
- tech.uzabase.com
- テクノロジー
- 2023/03/15
NewsPicks エンジニアの中村です。普段はデータ基盤や機械学習システムの開発、運用をやっています。さて皆さん、すでにChatGPTは使っていらっしゃるでしょうか。エンジニア、非エンジニアを問わず世の中を席巻している感のある ChatGPT ですが、今月初めにいよいよ API も公開されて、アプリケーションやサービスに組み込みたいと考えている方も多いのではないでしょうか1。というわけで、弊社でもこの新しい技術をより多くのエンジニアに使いこなせるようになってもらいたいと考え、ChatGPT API に関する社内勉強会を先日開催しました。本記事ではこの勉強会の内容を再構成してお届けします。とりあえず使うだけなら簡単な ChatGPT ですが、本記事では、長文を扱ったり、ChatGPT と外部のシステムを連携させたりするテクニックなど、知っている人はすでに知っているが、まだそれほど広く
- ChatGPT
- TypeScript
- AI
- あとで読む
- api
- OpenAI
- GPT
- プログラミング
- 機械学習
- 入門
ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送
- 391 users
- speakerdeck.com/eumesy
- テクノロジー
- 2023/03/18
「Workshop OT 2023 最適輸送とその周辺 – 機械学習から熱力学的最適化まで」で用いたスライドです
- ChatGPT
- あとで読む
- AI
- 自然言語処理
- nlp
- 人工知能
- 機械学習
- GPT
- 言語
ChatGPTのコア技術「GPT」をざっくり理解する - Qiita
- 388 users
- qiita.com/ksonoda
- テクノロジー
- 2023/06/01
※本記事はOracleの下記Meetup「Oracle Big Data Jam Session」で実施予定の内容です。 ※セミナー実施済の動画に関しては以下をご参照ください。本記事の対象者これから機械学習を利用した開発をしていきたい方機械学習のトレンド技術を知りたい方なるべく初歩的な内容から学習したい方はじめに Transformerの登場以降、著しい技術革新が続くここ数年、特にOpenAI社のChatGPTのサービス開始以降、おびただしい数の技術ブログや記事がインターネット上に存在する中、本記事に目を留めていただいてありがとうございます。この勉強会では、専門用語や難解な公式を極力排除し、初学者の方々を対象に、「そもそも自然言語の機械学習ってどういうもの？」、「言語モデルって要するに何？」というところからGPTをざっくり理解することを目的としています。従って、本記事に記載のあ
- ChatGPT
- あとで読む
- アルゴリズム
- GPT
- AI
- 技術
- 機械学習
- 言語
- 学習
- 統計
あまりに高精度のテキストを作り出してしまうため「危険すぎる」と問題視された文章生成言語モデルの最新版「GPT-3」公開
- 387 users
- gigazine.net
- 学び
- 2020/06/01
人間が書いたものと見分けが付かないぐらいに精度の高い文章を生成できる言語モデル「GPT-2」の後継である「GPT-3」が、人工知能を研究する組織・OpenAIにより公開されました。 GitHub - openai/gpt-3: GPT-3: Language Models are Few-Shot Learners https://github.com/openai/gpt-3 [2005.14165] Language Models are Few-Shot Learners https://arxiv.org/abs/2005.14165 OpenAI debuts gigantic GPT-3 language model with 175 billion parameters https://venturebeat.com/2020/05/29/openai-debuts-giga
- 文章
- あとで読む
- AI
- 機械学習
- 言語
- GPT-3
- 自動文章生成
- NLP
- 人工知能
- language
GPT-4以降，英語が最強のプログラミング言語になりつつある状況をまじめに考えてみる．｜落合陽一
- 375 users
- note.com/ochyai
- テクノロジー
- 2023/04/01
落合陽一が下記のように述べていました．step-by-stepで文章の意味を解釈し，足りない言葉を文脈から保管し，わかりやすく具体的な言葉で説明した後，日本語の研究者にわかりやすいように，語順を入れ替えたり，単語を具体的なものや抽象的なもの，専門用語や非専門用語で置き換え，ブレインストーミングし，段落を並び替えて，わかりやすい文章を作成してください．文章は１０００字で出力してください．最終結果だけ出力してください．タイトル：GPT-4以降、英語が最強のプログラミング言語になりつつある状況を真剣に考えてみるこれからの時代、英語がプログラミング言語としての地位を確立し、最強のプログラミング言語となる可能性があるということを真剣に考えるべきだ。その理由として、以下の点から説明していく。 https://cdn.openai.com/papers/gpt-4.pdfまず、GPT-4の登場によって
- AI
- あとで読む
- プログラミング
- 英語
- ChatGPT
- 技術
- 言語
- english
- GPT
- programming
Excelで誰でも簡単言語処理 (感情推定, 固有表現抽出, キーワード抽出, 文類似度推定 etc...) - Qiita
- 375 users
- qiita.com/Harusugi
- テクノロジー
- 2019/08/05
Excelで誰でも簡単言語処理 (感情推定, 固有表現抽出, キーワード抽出, 文類似度推定 etc...)ExcelAPIVBA自然言語処理COTOHA 3行まとめ Excel関数一発で高度な言語処理を使えるようにしました感情推定、固有表現抽出など日本語を分析・整理するのにいろいろ使えます Windows + Officeユーザならマクロファイルで誰でも簡単に使えます ※Macだと多分動かないと思います。VBAのHTTPリクエストを有効にできないため。。。 9/1追記: コメント頂きましたが、64bit版OfficeだとjsonParseが動かないようなのでアップデートしてみました。動作確認できていないので自己責任でお願いします https://github.com/korinzuz2/excelcotoha/blob/master/COTOHA公開用64bitExcel対応版.xls
- excel
- あとで読む
- 形態素解析
- API
- Qiita
- 言語
- VBA
- 自然言語処理
- nlp
- tips
海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
- 368 users
- gigazine.net
- テクノロジー
- 2021/11/02
by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字
- 文字コード
- あとで読む
- 文字化け
- 技術
- 文字
- GIGAZINE
- 日本
ChatGPT 雑感 - murawaki の雑記
- 366 users
- rekken.hatenablog.com
- テクノロジー
- 2023/04/02
ChatGPT についてポエムを書き散らすのが流行っている。珍しく流行に乗ってみる。機会を逃すとまた状況が激変しそうだし。研究者の YouTuber 化 ChatGPT は研究者が想定していた成長曲線よりも上に外れたところに現れた。こんなに流暢にテキストを生成するモデルがこんなに早く出現するとは思わなかった。なぜ日本語まで流暢なのかはいまだに謎。 ChatGPT はテレビでも取り上げられるくらい一般に認知されているらしい。複数のテレビ取材に応じたという人がいたのでそうなのだろう。*1 私の観測範囲で起きているは、参入者が大勢いること。これまで自然言語処理をやってこなかったであろう人。従来の技術よりも圧倒的に敷居が低い。そもそもプログラムを書く必要がない。自然言語で指示を出すだけなら誰でもできる。 ChatGPT の上で踊りたいかというと気乗りしない。参入障壁が低いということは、競合が多い
- ChatGPT
- AI
- あとで読む
- 機械学習
- 研究
- NLP
- gpt
- 学習
- machinelearning
- 文章
ブログ再開？: 極東ブログ
- 362 users
- finalvent.cocolog-nifty.com
- 暮らし
- 2023/03/02
長い間ブログを休止していた。この間、大学院生であったという理由が大きい。25歳に最初の大学院を中退し、それから40年かけて大学院修士を終えたという感じだ。10年前の著書には、「もう諦めた」と書いたが、子供が4人成人したのをきっかけに修士に再挑戦した。というわけで2年間、放送大学で大学院生をやっていた。ようやく修論が終わり、取得単位もクリアしたので、今月末には卒業ということになる。この間、修論研究にけっこう専念していた。コロナ禍もあってか、朝から深夜まで研究ばっかりしていたこともある。加えて、大学院の単位取得もそう容易いということでもなかった。40年前の大学院の単位も復活できるかとも思ったけど、手続きミスがあり、諦めた。結果からいうと、それでよかった。認可待ちしていると、大学院の単位の計算が不確定になっただろう。取得単位という点では、結局、学院を2つ出たような感じだが、あれだなあ、学問の風
- finalvent
- ブログ
- あとで読む
- 人生
- 研究
- blog
- 歴史
- 文章
- 社会
- ネット
AIに人を裁けるか「ChatGPT」が裁判官の模擬裁判、東大五月祭で公開実演
- 360 users
- kai-you.net
- 学び
- 2023/03/16
米OpenAIが開発したチャットAIボット・ChatGPTが裁判官を務める模擬裁判が、5月13日（土）に公開実演される。東京大学の法学部と教養学部の学生有志などによる実演企画で、同大学の学園祭・五月祭に合わせて実施される。会場は東京大学本郷キャンパスの安田講堂。【重大告知】機械に人は裁けるか−−？ GPT4を”裁判官”にした、国内初の模擬裁判公開実演。５／１３（土）、五月祭1日目。東京大学本郷キャンパス安田講堂にて開廷。 pic.twitter.com/xzq9gqeIfN — AI法廷の模擬裁判/東大五月祭 (@AI_Judge_May) March 15, 2023 専門テストでも人間レベルの能力を発揮するChatGPT ChatGPTは米OpenAI社が開発するチャットAIボット。質問などをテキストで入力すると、AIによって回答が自然な文章で出力される、対話に最適化された
- AI
- あとで読む
- ChatGPT
- 人工知能
- 裁判
- 司法
- 法律
- law
- 機械学習
松尾豊氏が監修した人工知能基礎 2万5000円が3000円に引き下げ | Ledge.ai
- 354 users
- ledge.ai
- テクノロジー
- 2021/02/04
画像は教材のイメージ株式会社zero to oneは2月1日、東京大学大学院工学系研究科教授の松尾豊氏が監修したオンライン教材「人工知能基礎（学習期間60日間）」の定価を従来の2万5000円から3000円に改定した。また、行政職員向けに「人工知能基礎」の無償提供プログラムを開始する。同プログラムの対象は国家公務員法あるいは地方公務員法上の一般職の人。「人工知能基礎」は、AIの歴史も含めた基本知識から、知識表現、自然言語処理といった概念、さらには機械学習やディープラーニング（深層学習）の基本知識まで、AIに関する基礎を幅広く網羅したとうたう教材。ビデオ教材、監修インタビュー、確認テスト（すべてオンラインで完結）で構成されている。教材のイメージさらに、「人工知能基礎」を通して学習した内容をもとに、一般社団法人日本ディープラーニング協会（JDLA）による「G検定（Deep Learni
- 機械学習
- あとで読む
- AI
- 学習
- ディープラーニング
- 松尾豊
- 教材
- 人工知能
- 勉強
- study
【決定版】GPTs開発の教科書｜ChatGPT研究所
- 342 users
- chatgpt-lab.com
- テクノロジー
- 2023/12/24
この記事は、一度使われて終わるような、ChatGPT にちょっとした機能を追加しただけの GPTではなく、本当に使われる素晴らしく便利な GPTs を作成、開発するための教科書として、書きました。今までの GPTs 開発関連の情報を全てまとめた内容になっています。この note 一冊を読めば、GPTs 制作の基礎から応用まで全部わかります。記事の内容は必要に応じて適宜アップデートしていきます。目次は以下です：第1章 GPTsの概要とその可能性そもそも GPTs とはなんでしょうか？一言で言うと、ChatGPTを自分独自に大幅にカスタマイズできる機能とそのカスタマイズされたAIのことです。ただし、GPTsを単なるChatGPT のいち機能の一つとして考えるのは非常にもったいないです。 OpenAI は、GPT Store という、他の人が作ったGPTsを使えるようになるストアの
- ChatGPT
- AI
- あとで読む
- 開発
- プログラミング
- gpt
- OpenAI
- テクニック
- 情報
「バイクに乗るピカチュウ」「アボカドの椅子」など言葉から自動でイラストや写真を生成するAI「DALL・E」
- 338 users
- gigazine.net
- テクノロジー
- 2021/01/06
人工知能(AI)を研究する非営利団体のOpenAIが、自然言語処理と画像生成を組み合わせたAI「DALL・E」を発表しました。DALL・Eは人間と見分けが付かないほど高精度な文章を生成するAI「GPT-3」のパラメータを使用し、文章からイラストや写真を作り出すことができます。 DALL·E: Creating Images from Text https://openai.com/blog/dall-e/ OpenAI debuts DALL-E for generating images from text | VentureBeat https://venturebeat.com/2021/01/05/openai-debuts-dall-e-for-generating-images-from-text/ OpenAIの公式ブログでは、実際に「DALL・Eに入力したテキスト」と「DA
- AI
- イラスト
- あとで読む
- 画像
- 写真
- IT
- GIGAZINE
- 人工知能
- 機械学習
- image
LLMを理解する一歩として「ゼロから作るDeep Learning」をやった - $shibayu36->blog;
- 337 users
- blog.shibayu36.org
- テクノロジー
- 2023/05/23
LLM、GPT界隈を追いかけていて、GPTの仕組みと限界についての考察（2.1） - conceptualizationという記事を見かけた。これを見たとき、「どういうことか全然理解できない」という気持ちになった。また、その他LLMの解説記事を理解できないことが多く、自分の機械学習知識不足が明確になった。理解できなかったことは悔しいし、LLMやChatGPTをうまく使いこなすには最低限どのような原理で動いているか理解したいと感じた。そこで一歩目として「ゼロから作るDeep Learning」を完走した。ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者:斎藤康毅オライリージャパンAmazon 知識なしからはじめたので時間はかかったが、次のように進めていった。自分もコードを写経しながら読むレポジトリは https://github.co
ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた - Qiita
- 331 users
- qiita.com/aokikenichi
- テクノロジー
- 2024/04/09
ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた機械学習データ分析キャリアデータサイエンスデータサイエンティスト Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。言語、基盤、アプリ、かなり網羅されています。その中のAI and Data Scientist Roadmapについての推薦図書まとめです。雑感これだけ学んでいれば「こいつ知ってるな」感がありますね。ただ気になる点としてはビジネス、ドメイン知識や分析目的定義などのスキルについて言及がないのは残念。いきなり数学から入るコースになってますが、一旦は飛ばしてコード写経してから戻ってきても良いと思います。ここで挫折すると勿体無いので。計量経済学重視の観点はいいですね
- 学習
- あとで読む
- 本
- AI
- IT
- 機械学習
- エンジニア
- スキル
- Qiita
- data
【Day 3】東大松尾研のLLM講座資料が公開されたから、詳しく読んでいくよ【備忘録】 - Qiita
- 322 users
- qiita.com/mohki7
- テクノロジー
- 2024/02/17
Transformer 深層学習モデル以前の言語モデルの課題言語モデルでやりたいことは、「今まで生成した単語列を元に、次の単語を予測する」ことで、その単語は今まで生成した単語列を条件とし、次にある単語がくる条件付き確率を求め、その確率が最大のものを選ぶということだった。（LLM資料p.8参照）ただ、これだと単語列が長くなったときや、類義語の処理に課題が生じてしまっていた。ニューラル言語モデルしかし、計算したい条件付き確率をNNで推定することにより、対処できた。 Encoder-Decoder型のRNN（Recurrent Neural Network)が最も基本的なモデルにはなるが、これでは長文に対応できなかった。（勾配消失＆単語間の長距離依存性の把握が困難） RNNが勾配消失するのは、活性化関数のtanhが1未満の値を取るため、BPTT時に掛け算されるとだんだん値が小さくなってし
- LLM
- あとで読む
- AI
- 学習
- ChatGPT
- 資料
Pythonで始めるドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python
- 320 users
- speakerdeck.com/yag_ays
- テクノロジー
- 2021/10/15
ビジネス文書をデータ化し構造や内容を理解するアプリケーションはドキュメント・インテリジェンスと呼ばれ、画像処理や自然言語処理といった複数の要素技術を組み合わせて開発する必要があります。何が必要でどう実現すれば良いのかといった第一歩を、Pythonでの具体的な構築事例とともに紹介します。 https://2021.pycon.jp/time-table/?id=273795