並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 3682件

新着順 人気順

自然言語処理の検索結果81 - 120 件 / 3682件

  • Kaggle Expertになるまで勉強したことを全て書く - Qiita

    はじめに こんにちは。Yuki | Kagglerです! 先日、Shopeeコンペの順位が確定して銀メダルをいただき、晴れてCompetition Expertになることができました。区切りがいいのでここまで取り組んできたことをまとめてみました。 ※ 6/28追記:Amazonのリンクが切れていたので貼り直しました! プログラミング&機械学習を始めて一年、ようやく Kaggle Expertになることができました!! 行列も正規分布も知らず、ターミナルなんて触ったこともない状態からのスタートでしたが、ようやくここまで来ました。 ここまで来れたのは偏にこれまで関わってきた皆様のお陰です。これからも頑張ります!! pic.twitter.com/kMkaFhqhU9 — ユウキ | Kaggler (@Yuki_Kaggler) May 12, 2021 この記事の対象者 Kaggleをやって

      Kaggle Expertになるまで勉強したことを全て書く - Qiita
    • 【言語処理100本ノック 2020】Pythonによる解答例まとめ - Qiita

      はじめに 自然言語処理の問題集として有名な言語処理100本ノックの2020年版が公開されました。 この記事では全100問のPythonによる解答例を紹介します。間違いやより良い方法など、お気づきの点があればぜひお気軽にコメントください。 本編は以下のリンク先に移転しました。 https://amaru-ai.hatenablog.com/entry/2022/10/15/204035

        【言語処理100本ノック 2020】Pythonによる解答例まとめ - Qiita
      • NVIDIAが高精度な画像生成AI「eDiffi」を発表、従来の「Stable diffusion」や「DALL・E2」よりテキストに忠実な画像生成が可能

        大手半導体メーカーでありAI研究にも力を入れているNVIDIAが、新たな画像生成AIである「eDiffi」を発表しました。NVIDIAはeDiffiについて、世界中で話題となっている「Stable Diffusion」やOpenAIの「DALL・E2」といった従来の画像生成AIより入力テキストに忠実な画像を生成できると主張しています。 [2211.01324] eDiffi: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers https://arxiv.org/abs/2211.01324 eDiff-I: Text-to-Image Diffusion Models with Ensemble of Expert Denoisers https://deepimagination.cc/eDiffi/

          NVIDIAが高精度な画像生成AI「eDiffi」を発表、従来の「Stable diffusion」や「DALL・E2」よりテキストに忠実な画像生成が可能
        • Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく

          Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく ChatGPT Code Interpreterをとにかく触ってみる 「Code Interpreterが凄い!」と、みんなが騒いでいるのでとりあえずネットで目についた活用方法を片っ端から試していきたいと思います。 試したら追記していきます。 Code Interpreterのセットアップ 以下3ステップです。簡単ですね。よく分からなかったら別のサイトみてください。 ChatGPT Plusに課金 Setting Beta featuresでCode interpreterのトグルをオン ChatGPTのGPT4でCode Interpreterを選択 以下参考のスクリーンショットです。 Code Interpreterの活用例 ここから活用例を載せていきます

            Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく
          • GPT-4の性能をBingと比較してみた|IT navi

            日本時間で3月15日未明、OpenAIが大規模言語モデルのGPTシリーズ最新バージョンであるGPT-4を発表しました。 GPT-4は、人間向けの試験問題やベンチマークテストで従来のモデルよりも高い成績を収め、日本語でもGPT-3.5の英語性能を超えているそうです。 また、GPT-4は、ChatGPTの有料版(月20ドル)に加入していれば、すぐに使用できます。 今回、MicrosoftがBingのチャットモードもGPT-4を利用していることを明らかにしました。そこで、実際にGPT-4の性能とBingの性能を比較してみることにしました。 ※表紙の画像は、プロンプトに「GPT-4」と入力して生成した画像です。 1.GPT-4についてChatGPTに聞いてみた ChatGPT(Model:GPT-4)に、GPT-4について聞いてみたところ、回答は以下のとおりでした。 問 GPT-4について教えてく

              GPT-4の性能をBingと比較してみた|IT navi
            • 1年半のソフトウェアエンジニア長期インターンで出会ったオススメ本をたくさん紹介します - Qiita

              イントロ ABEJAアドベントカレンダーの4日目に一昨日飛び込みました、長期インターン生の佐藤(Twitter: @TodayInsane)です。 去年は機械学習を通して、TWICEというK-POPグループへの愛を語りました。 ABEJAには昨年4月、「本当に何も出来ないけど、休学してプログラミングとかエンジニアの経験を積みたいんです」という何とも不安な主張をするぼくを受け入れていただきました。 この1年半のエンジニア / リサーチ両インターンの過程で出会った良い本をどしどし紹介します。 ちなみにインターン開始時は プログラミング、Pythonだけならちょびっと書けます!(ABCのB問題とか機械学習ライブラリの写経) HTMLってどんな風になってるんですか?(?) サーバ...??リクエスト...?? JavaScript、名前は聞いたことあります 英語の論文しんどい、2時間ぐらいかけてI

                1年半のソフトウェアエンジニア長期インターンで出会ったオススメ本をたくさん紹介します - Qiita
              • 2023 年に読んでよかった本

                2023 年に読んでよかった本 2023.12.30 年末なので 2023 年のまとめっぽい記事を書きたくなりました。今年は 1 年間でおおよそ 300 冊の本をよんだようです(そのうち 3 割ほどはラノベなのですが...)。その中でも特に印象に残った本を紹介します。 年末なので 2023 年のまとめっぽい記事を書きたくなりました。 今年は 1 年間でおおよそ 300 冊の本をよんだようです(そのうち 3 割ほどはラノベなのですが...)。その中でも特に印象に残った本を紹介します。 忘れる読書 この本では「本は忘れるために読んでいます」と語られています。というわけでこの本の内容もあまり覚えておりません(?)。 本を読むときには一字一句正確に覚えるような読み方をしていると、「覚えなきゃ」という気持ちが芽生えてしまい、本を読むことが苦痛になってしまうことがあります。そうではなくて、パラパラとペ

                  2023 年に読んでよかった本
                • ヤフー、“ヤフコメ”の表示順位付け技術を無償公開 ネット上のコメント健全化目指す

                  APIの連携によって事業者は、AIの開発に必要な学習データや計算コストなどの初期投資をかけずに、自社サービスへのコメントの健全化に役立てることができるという。 今後もヤフーは誹謗中傷など悪質コメントに対する取り組みを進め、インターネット空間の健全化を目指すとしている。 関連記事 ヤフー、“ヤフコメ”のパトロールAIを外部提供へ 1日に2万件の誹謗中傷を削除可能 ヤフーが、「Yahoo!ニュース」コメント欄の健全化のため使用しているAIを、外部の事業者にも提供すると発表した。1日に平均約2万件の悪質な投稿を削除できる自然言語処理モデルを横展開し、投稿型サービスの健全化を図る。6月中をめどに、悪質なコメントへの対策強化に向けた検討会も開催する。 “繋がりすぎる”ネット時代の誹謗中傷問題、解決策はあるのか リアリティーショー番組でのSNS中傷を発端として、インターネット上の悪質な投稿に関する議論

                    ヤフー、“ヤフコメ”の表示順位付け技術を無償公開 ネット上のコメント健全化目指す
                  • 英語学習は AI と行う時代がついに到来!? ChatGPT と LINE Bot でオンライン英会話アプリ「Small GPTalk」を作ってみた | DevelopersIO

                    こんにちは。CX 事業本部 Delivery 部のきんじょーです。 ChatGPT の API がついに提供されたということで、チャット AI 界隈が盛り上がっていますね。 このビッグウェーブに乗り遅れてはいけないと思い、ChatGPT の優れた自然言語処理能力を活かして LINE で英会話の練習をする「Small GPTalk」というサービスを作ってみました! アプリの紹介と、アプリ作成を通して感じた ChatGPT の可能性についてブログ化していきます。 Small GPTalk とは Small GPTalk は、ChatGPT から派遣された AI 英語講師と LINE 上で SmallTalk(世間話) を楽しむためのアプリです。 レッスンが始まると、講師はトピックを提示してくれます。好きなトピックを選んで講師と会話を楽しみましょう。 レッスンを終わるときは「終わります」と伝えて

                      英語学習は AI と行う時代がついに到来!? ChatGPT と LINE Bot でオンライン英会話アプリ「Small GPTalk」を作ってみた | DevelopersIO
                    • NVIDIAが日本語対応の対話型AI「Jarvis」を提供開始 基調講演でリアルタイム日本語翻訳のデモも公開「反応は瞬きするより速い」 - ロボスタ ロボスタ - ロボット情報WEBマガジン

                      NVIDIAが開発している対話型AIシステムが「Jarvis」(ジャービス)だ。以前から開発についてはアナウンスされていたが、ついに正式にリリースされた。しかも日本語対応で。 「GTC 2021」のオンライン基調講演でNVIDIAのCEO、ジェンスン フアン氏(Jensen Huang)がこのニュースを紹介するとともに、聞き取り、発話、翻訳などのデモを行った。「Jarvis」はHuang氏が話した言葉を瞬時にテキスト化し、更にはHuang氏が話した英語を日本語にリアルタイム翻訳して見せた。 対話型AIフレームワーク「NVIDIA Jarvis」 NVIDIAは現地時間の4月12日、「NVIDIA Jarvis フレームワーク」の提供を開始したことを発表した。これは最先端のAIトレーニング済みディープラーニング モデルとソフトウェア ツールを活用して、さまざまな業界と分野向けに、対話型AIサ

                        NVIDIAが日本語対応の対話型AI「Jarvis」を提供開始 基調講演でリアルタイム日本語翻訳のデモも公開「反応は瞬きするより速い」 - ロボスタ ロボスタ - ロボット情報WEBマガジン
                      • 「一番厨二臭いホトトギス詠んだ奴優勝」の中で元ネタと類似度が高い奴優勝 - Qiita

                        概要 だいぶ前に「一番厨二臭いホトトギス詠んだ奴優勝1」というネタがありまして。 哭かぬなら 虚無に誘え(いざなえ) 時鳥(ホトトギス) とか 哭け 我が漆黒の刄 炎斗闘斬(ホトトギス) みたいなやつです。 どの作品も好きなんですが、この手のって元ネタとあまりかけ離れすぎていてもダメで、元ネタと似た形や意味を保ちつつも厨二感を漂わせるくらいが一番味があるんじゃないかなと思ってます。 そこで今回は、「厨二臭いホトトギス」と本家ホトトギス三句2を自然言語処理によって比較し、最も類似度が高いものを優勝とする決定戦を開催することにしました。 (図. コンテストイメージ) 「厨二臭いホトトギス」作品リスト クリックで展開 鳴かぬなら そこで朽ちてけ ほととぎす 鳴かぬなら 深淵に呑まれろ! ダークインフィニティ!! 鳴けぬなら、 邪鳴で叫べ、 ホトトギス 啼かぬなら 啼くまで悠久の時を待とう なあ

                          「一番厨二臭いホトトギス詠んだ奴優勝」の中で元ネタと類似度が高い奴優勝 - Qiita
                        • 『わけがわかる機械学習』中谷秀洋(著)の書評 - StatModeling Memorandum

                          僕が中谷さんと初めて会ったのはみどりぼんの読書会で、初めて話したのは岩波DSの打ち合わせだったと思います。今でもそんなに親しくはないと思います。しかし、中谷さんのブログは10年ぐらい前から読んでいました。自然言語処理を中心とする機械学習に関連する理論(の解釈)・論文レビュー・数値実験の記事が多く、他のブログでは見られない独特かつ理解の深い内容で、毎日勉強させてもらっていました。今でも何度も読むべきブログです。その中谷さんが機械学習についてまるごと一冊書いたものが本書になります。もともと買うつもりでしたが、献本いただいたので簡単にご紹介いたします。 わけがわかる機械学習 ── 現実の問題を解くために、しくみを理解する 作者: 中谷秀洋出版社/メーカー: 技術評論社発売日: 2019/08/28メディア: 単行本(ソフトカバー)この商品を含むブログを見る 目次は以下になります。 0章: はじめ

                            『わけがわかる機械学習』中谷秀洋(著)の書評 - StatModeling Memorandum
                          • AWS Japanの最終面接で落ちてきました

                            受けた会社 AWS Japan 経緯 2019年09月18日に採用担当の方から 弊社の社員より評判をお聞きし、ぜひ弊社のエンジニア職にてご興味をお持ちいただきたくご連絡いたしました。ご紹介したいポジションはこちらとなります。 というメールが来ました. クラウドサポートエンジニア/Cloud Support Engineer に応募してみませんかということのようでした. どうせ落ちるだろうけど, とりあえず面接受けてみるかと思って応募しました. カジュアルミーティング 職務内容や職場環境について聞いて, 後から職務経歴書を提出しました. 職務経歴書初めて書いたのでそれが割と面倒でした… 提出した職務経歴書ここに書こうかと思いましたが完全パブリックにして良いか(多分良いけど)わからない情報があるのでやめておきます. オンラインテスト テクニカルテストと英語テストがありました. テクニカルは W

                              AWS Japanの最終面接で落ちてきました
                            • 歴史・年表でみるAWS全サービス一覧 -アナウンス日、General Availability(GA)、AWSサービス概要のまとめ- - NRIネットコムBlog

                              小西秀和です。 Amazon Web Services(AWS)に関する情報や魅力を様々な観点から記事にしてみていますが、技術史が好きなこともあって今回はAWSサービスの発表の歴史を年表でまとめました。 AWSからもWhat's Newとして公式アナウンスは発表されていますが、アナウンス日、GA日(一般提供開始日)、サービス名、サービス概要といった情報に圧縮して時系列でAWSサービス一覧を一枚もので確認できる記事が今まで欲しかったので自分で作成してみることにしました。 AWS全サービスの歴史年表の作成方法 AWS全サービスの歴史年表の対象となるAWSサービスは次の手順で選定しました。 AWSサービス・製品一覧「Cloud Products(英語版)」にあるサービスのうち「~ on AWS」といったサードパーティー製品がメインとなるサービスを除いたリストを作成 AWSサービス・製品一覧に記載

                                歴史・年表でみるAWS全サービス一覧 -アナウンス日、General Availability(GA)、AWSサービス概要のまとめ- - NRIネットコムBlog
                              • 技術blogのリンクを投げたらChatGPTが要約して、いい感じに整形してチャンネル投稿してくれるbotを社内Slackに生やしたら捗った話

                                こんにちは、株式会社シグマアイのエンジニアの@k_muroです。 今回の記事は最近導入した「技術blogを良い感じに共有してくれるSlack bot」のご紹介を。 はじめに 技術の進化は止まらない。(真面目な話、AI系の進捗がマジですごいて全然追えない) 毎日のように新しい技術、フレームワーク、ライブラリ、ツールが生まれています。そんな中でエンジニアとして働いていると、この情報の波に疲れを感じること、ありませんか? ありますよね?(脅迫) 実際私もその一人で、この小さな疲れが積み重なって大きなストレスとなることに気づきました。 「新しい技術情報、追いつけるかな?」 「あのブログ記事、後で読もうと思ってたのに、どこいったっけ?」 「チーム全員が同じ情報を持ってるか心配だな。」 そんな日常の疑問や不安から逃れるための一歩として、私はあるSlack botを開発しました。このbotは、送られた技

                                  技術blogのリンクを投げたらChatGPTが要約して、いい感じに整形してチャンネル投稿してくれるbotを社内Slackに生やしたら捗った話
                                • RAGの性能を改善するための8つの戦略 | Fintan

                                  近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル(Large Language Model:LLM)の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。 大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ

                                    RAGの性能を改善するための8つの戦略 | Fintan
                                  • スクエニのAI実験版『ポートピア連続殺人事件』を約5分で“解決”するRTA走者現る。雑すぎる命令と察しの良すぎるヤス - AUTOMATON

                                    スクウェア・エニックスよりPC(Steam)向けに無料配信されている“AIポートピア”こと『SQUARE ENIX AI Tech Preview: THE PORTOPIA SERIAL MURDER CASE』のRTAに挑戦したユーザーが現れた。動画内ではゲーム中での相棒となるヤスに対して「聞け」や「帰れ」といったような、ほんのり高圧的な指示をおこないながらも鮮やかに事件を解決へと導く姿が確認できる。 『SQUARE ENIX AI Tech Preview: THE PORTOPIA SERIAL MURDER CASE』は、『ポートピア連続殺人事件』をもとにした自然言語処理を学習・体験するソフトウェアだ。本作には入力されたテキストの処理に自然言語処理(Natural Language Processing)が用いられている。大量のテキストデータを使ったディープラーニング技術により、

                                      スクエニのAI実験版『ポートピア連続殺人事件』を約5分で“解決”するRTA走者現る。雑すぎる命令と察しの良すぎるヤス - AUTOMATON
                                    • ChatGPTを使って論文の英文校正をする

                                      Chat GPT は、自然言語処理 (NLP) 技術を使用して、特定の入力に基づいてテキストを生成する言語モデルです。 今回はChat GPT を使用して英語の文章の修正をして、文章の質と明瞭さを向上させる方法を紹介します。 https://chat.openai.com/chat それでは、Chat GPT を使用して英語の編集と校正を行うための手順について説明しましょう。 まず下記のprompt(AIに出す指示のこと)をチャットボックスに入れ””内に校正したい文章を入れます。日本語を直接入れても英語が出てきますが、Google翻訳で英訳した文章を入れた方が洗練された英語になります。(ChatGPTは日本語の入力も受け付けますが英語での入力の方が圧倒的に正確な回答が得られるため) 下記のprompt(一部改変)の出典はこちらのAwesome ChatGPT Promptsです。他にも”a

                                        ChatGPTを使って論文の英文校正をする
                                      • Appleが殺そうとしているもの2020年版リスト

                                        AndroidアプリでおなじみのUIImage: AppleiOS 14で話題のウィジェットとAppライブラリは、Android古参のUIです。ウィジェットは大きさも見た目も好みで変更が可能。たとえば気になるお天気とメッセージ系アプリをHOME画面に表示したり、レイアウトの自由度が格段にアップします。一方、Appライブラリはアプリをカテゴリ別に分けておける機能ですね。アプリを隠せるところなんかは、Androidのドロワーに怪しいまでに似ていますよ。 Video: Jon Rettinger/YouTubeインスト抜きでアプリの一部機能を限定的に使える「App Clips」も、スマホに強い米Gizmodo編集部のSam Rutherfordに言わせると「AndroidのInstant Appsだよね」。Androidの友だちに見せたら、こんなの昔からあるわいって言われるかも。 Google翻

                                          Appleが殺そうとしているもの2020年版リスト
                                        • ChatGPTの面白い使い方「テンプレート・固有表現抽出・感情分析・エッセイを書かせる」 - シロッコの青空ぶろぐ

                                          ランキング参加中GPT 目次 ChatGPTの面白い使い方 この書き出しはChatGPTに書いてもらった。 テンプレートで出力フォーマットが指定できる アメリカ合衆国の大統領リスト 大統領リストの出力 固有表現を抽出させる 固有表現とは 固有表現抽出 ChatGPTの回答 ChatGPTは感情分析が出来る 次の分析対象文を感情分析して 分析対象文の感情分析結果 アメリカ国家の歌詞を感情分析して 日本の国歌「君が代」の歌詞を感情分析して ChatGPTにエッセイを書いて貰う ペットにするのに最適な蛇を教えて 「ボールパイソンはペットに最適」というエッセイを書いて ChatGPTが書いた「ボールパイソンはペットに最適」 まとめ ChatGPTの面白い使い方 こんにちは、私はブロガーのシロッコです。最近、人工知能の言語モデルChatGPTが大きな話題となっています。ChatGPTは、自然言語処理

                                            ChatGPTの面白い使い方「テンプレート・固有表現抽出・感情分析・エッセイを書かせる」 - シロッコの青空ぶろぐ
                                          • 高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉

                                            こんにちは、あんどう(@t_andou)です。 最近、自然言語処理のAIの一種であるBERTをよく触っています。 今回はBERTのソースを読まなくてもサクッと試せる環境を用意しましたので、メモとして残しておきます。 BERTとはどういうものか 画像引用:https://arxiv.org/pdf/1810.04805.pdf 凄くざっくりと説明すると、BERTとは2018年末にGoogleの人たちが開発した自然言語処理において汎用的に使えて精度の良いAIです。 自然言語処理において精度を測るためにいくつかのタスクがあるのですが、発表された時点ではダントツの成績でした。 仕組みなどの詳細については論文を読むか解説記事をググってください。 2019/09/22時点で既により精度の良い手法がどんどん発表されていますが、BERTの情報量と比べるとまだ少ないため、入門としてはBERTを触ってみるのが

                                              高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉
                                            • 雑文:放送大学(情報コース)をなんとか4年で卒業確定できたという話 - φ(・・*)ゞ ウーン カーネルとか弄ったりのメモ

                                              tl;tr 2023/02/17に放送大学の2023年2学期の成績発表もされ、卒業要件の124単位も一通り取りきったのでなんとか4年で卒業できる感じになりました😊 放送大学に入ったときのblogエントリはこちら。 kernhack.hatenablog.com 学位の情報も登録されているし、4年間の区切りがついたなあと🌝 まあ、学位の情報は成績発表の3日位前にシステム上で登録されてるのを確認できてたので正式な成績発表前に履修した科目の単位を取れてたことは知ってたんですけどね🥲 履修した科目 取得した単位は124単位で、そのうち放送授業が104単位、面接・オンライン授業が20単位でした。 以下が自分が履修した科目です。所属コースは情報コースなので当然情報コースからの履修が多く、社会と産業からは仕事で役に立つこともあるだろう経営学系、経済関係の知識も欲しいよねというところで経済系などを取

                                                雑文:放送大学(情報コース)をなんとか4年で卒業確定できたという話 - φ(・・*)ゞ ウーン カーネルとか弄ったりのメモ
                                              • Webエンジニア(30歳)だけど4年かけて工学学士を取った - Qiita

                                                0. はじめに Bizer株式会社でフルスタックエンジニアとして働きながら、国立大学法人電気通信大学の先端工学基礎課程(通称 K課程)という社会人向けの学士課程に在籍しています。 この春(2021年3月)に卒業予定のため、いちソフトウェアエンジニアから見た大学教育や学歴に対する考えをまとめておきます。 1. 対象読者 理系大学のカリキュラムがソフトウェアエンジニアという仕事にどう活きるか分からない方 就業しながら学士を取ろうとしている方 ソフトウェアエンジニアと学歴の関係性を不透明に感じている方 2. 現職エンジニアが工学学士を取る理由 18歳で最初の大学を中退しエンジニアとして働き始めたため、途中の放浪期間などを差し引き、ソフトウェアエンジニアとしてのキャリアは現在10年程です。つまり大学入学時点では6年程のキャリアがあり、それなりに幸せなエンジニアライフを送っていました。 ではなぜ既に

                                                  Webエンジニア(30歳)だけど4年かけて工学学士を取った - Qiita
                                                • 2022年 Python/データ分析関連の人気Qiita記事150選 - Qiita

                                                  はじめに どうもこんにちは。データアナリストをしているkunishouです。2022年も残すところ今日、明日のみ。皆さん年の瀬をいかがお過ごしでしょうか? 私は先日無事に仕事を納めることができましたが、仕事も勉強も何もしなくていい日が数日続きすでにソワソワしてきました。この禁断症状を抑えるべく、2022年の技術動向の振り返りもかねて、 2022年のPython/データ分析関連の人気記事をまとめてみることにしました(完全に思い付きです)。 本記事では、2022年にQiitaに投稿された Python/データ分析関連の記事の中から いいね数の多かった150記事をピックアップし表にまとめました。 年末年始の暇つぶしがてらにでも読んでもらえたら幸いです。 モチベーション 実はQiita公式からも毎年1月にQiitaの人気記事のランキングが公開されています。ただ、Qiita全カテゴリでのランキングで

                                                    2022年 Python/データ分析関連の人気Qiita記事150選 - Qiita
                                                  • AWS、PythonでMeCabを使う際の語彙データを無料公開 | Ledge.ai

                                                    アマゾン ウェブ サービス ジャパン株式会社(Amazon Web Services、AWS)は、同社のオープンデータセットに、日本語自然言語処理で定番の形態素解析器である「MeCab」を、ラッパーライブラリであるfugashi経由でPythonで使用する際の語彙(ごい)データに加えた、と公式ブログで明らかにした。 多くの機械学習デベロッパーが、AWS上でさまざまなアルゴリズムの開発やモデルを構築している。なかでも、自然言語処理をする際には、対象言語の特性に即した形で前処理をする必要がある。日本語の自然言語処理を実施する際には、一般的に「形態素解析」と呼ばれる文章の分解処理を前位処理として実施する。 日本語形態素解析をするためには、日本語の語彙データが必要になる。語彙データは大きなサイズになるだけではなく、これらを用いた計算の際にも大量のGPUおよびCPUが求められる。そのため、従来このよ

                                                      AWS、PythonでMeCabを使う際の語彙データを無料公開 | Ledge.ai
                                                    • Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ

                                                      たくさんの文字列(や離散的な符号列)をメモリに載せないといけないんだけど、いろんな制約があって通常のList[str]では載らない…ということありませんか?(まぁあんまりなさそうですね) たまたまそういうことがあったので、その際に検討した内容をまとめておきます TL;DR メモリをもっと増やしましょう 富豪的に解決できるならいつでもそれが最高です しかし、世の中それでなんとかならんこともたくさんあります 用途があうのであれば専用のデータ構造を採用する 例えばもし共通のprefixやsuffixが存在し、順序に興味がなければtrie treeなどが使えます 例えば、弊社であれば、法人名をメモリに持ちたいなんてときもあります。そういうときに法人名の辞書をtrieで持ったりすることがあります 「株式会社」「一般財団法人」や「銀行」といった共通語がたくさんでてくるのでtrie treeでごりごり削

                                                        Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ
                                                      • OpenAI API ドキュメント 日本語訳|#1 GET STARTED 前編|ゑぐみかるちゃあ

                                                        OpenAI API ドキュメントの日本語訳をこちらでまとめます。文字量の多いドキュメントなので、セクションごとに記事を分割しています。 今回は「GET STARTED 」のセクションからIntroduction と Quickstart を抜粋した前編です。 基本 DeepLで翻訳して、気になるところだけ書き換えています(ほぼ気になるところがないのが、DeepLのすごいところ)。原文との突き合わせができるようにはじめに原文を入れてますので、間違いなど見つけられましたら、ぜひご指摘ください。ご指摘箇所は随時反映させていただきます。 原文のリンクが有効になってますので、それぞれ必要な場合は原文リンクの方を参照ください。 Introduction|はじめに Overview|概要The OpenAI API can be applied to virtually any task that i

                                                          OpenAI API ドキュメント 日本語訳|#1 GET STARTED 前編|ゑぐみかるちゃあ
                                                        • ChatGPTにブログ全エントリを学習させて「おしえてきしださん」を作る - きしだのHatena

                                                          最近「100万件の文章をChatGPTに学習させて応答チャットを作りました」みたいなニュースがあって、違和感があります。 ということで「ChatGPTにブログ全エントリを学習させて「おしえてきしださん」を作る」としたときに、どんな仕組みになっていて、なぜ「ChatGPTに文章を学習させて」ということに違和感があるか見てみます。 とりあえずこんな感じで、質問に対して答えれてるっぽいチャットができました。 まず、Embedding APIを使って、全エントリのベクトルを得てMongoDBに突っ込んでおきます。 このエントリでやってるので、そのまま使います。 GPTのEmbeddingを利用してブログの投稿に対する近いものを探し出す - きしだのHatena 質問が入力されたら、質問文も同じようにEmbeddingでベクトルをとってきます。 var req = EmbeddingRequest.

                                                            ChatGPTにブログ全エントリを学習させて「おしえてきしださん」を作る - きしだのHatena
                                                          • 【図解】誰でもわかるTransformer入門!凄さ・仕組みをわかりやすく解説 - すえつぐのNLP&LLM

                                                            始めに こんにちは!自然言語処理(NLP)・自然言語生成(NLG)の解説記事を書いている、すえつぐです! 突然ですが、BERT、GPT-3、PaLMを使ったことはありますか?Transformerはこれらの最先端のモデルに使用されている、現代のNLPモデルには欠かせないモデルです。おそらくBERTやGPT-3でTransformerを知った、このページに来たという人も多いのではないでしょうか。機械学習、特にNLPの勉強をしている方々は、Transformerの概要は知っておいた方が良いと思います。 ただ多くのサイトは、いきなり細かい仕組みの解説をする中級者以上向けの記事が多いですよね。 そこで、このページでは、Transformerの入門〜中級までの解説をしていきます!まず入門として、「Transformerの使い道」「Transformerの何が凄いのか?」を先に解説します。その上で「T

                                                              【図解】誰でもわかるTransformer入門!凄さ・仕組みをわかりやすく解説 - すえつぐのNLP&LLM
                                                            • AI初心者向けの独学本「からあげ先生のとにかく楽しいAI自作教室」を執筆しました - karaage. [からあげ]

                                                              AI初心者向けの書籍を出します AI初心者向けの書籍「からあげ先生のとにかく楽しいAI自作教室」が2021/1/8に発売となります。既にAmazonページも作成されております。Kindleを中心とした電子書籍は、ネットでの反応に応える形で先行配信となり、すでに購入可能です。本記事末尾に追記しています。 人気ブロガーからあげ先生のとにかく楽しいAI自作教室 作者:からあげ発売日: 2021/01/08メディア: 単行本 商業誌への寄稿をしたり、共著で「Jetson Nano超入門」を執筆したことはありましたが、単書の本は初めてとなります。気合いを入れて書き上げました。なにとぞよろしくお願いいたします。 ちなみに、最初に断っておきますが。表紙とタイトルは出版社さんが決定しております。もちろん私も確認の上でGoを出していますが、自分から人気ブロガーを名乗っているわけではありませんので何卒ご理解を

                                                                AI初心者向けの独学本「からあげ先生のとにかく楽しいAI自作教室」を執筆しました - karaage. [からあげ]
                                                              • 2023年の話題&ベストセラーをまとめて紹介! Udemyで今年最大級のセール開催、生成AIなど対象講座が1,200円より - はてなニュース

                                                                世界中を席巻した生成AIは、ブームに終わることなく着実に社会のさまざまな場面で利用が進んでいます。特にChatGPTを始めとするテキスト生成はビジネスシーンですぐに適用可能なケースも多く、使いこなす人とそうでない人には大きな差が生じつつあります。 使いこなすノウハウにも一定の知見が貯まっており、定番となるセオリーが整理されています。正しく学ぶことができれば一気にキャッチアップできるでしょう。Udemyの講座でも、ChatGPTを使いこなすプロンプトの作法や、アプリケーションにLLM(大規模言語モデル)を組み込むノウハウ、AIをより深く知る数学知識などに人気があります。 この記事では、2023年11月17日(金)に始まるブラックフライデーセール(24日まで)、そして26日(日)から2日間のサイバーセールの対象になる人気講座から、エンジニアリングやビジネスシーンにおいて読者の成長を助けてくれる

                                                                  2023年の話題&ベストセラーをまとめて紹介! Udemyで今年最大級のセール開催、生成AIなど対象講座が1,200円より - はてなニュース
                                                                • Windows 10で秋の大型アップデートが始まったのに、春のアップデートも落ちてこないマシンがあるのはなぜ? (1/2)

                                                                  Windows 10 Ver.20H2の一般向け配信が開始されたのに いまだにVer.2004が落ちてこないマシンがある 仕事柄、筆者宅には、Windows 10が動作しているPCが複数ある。Windows Insider Previewをインストールしているマシンもあるが、何台かは最新のWindows 10を入れている。その中には、Windows 10 Ver.2004がいまだに“落ちてこない”機種がある。すでに「October 2020 Update」ことWindows 10 Ver.20H2の一般向け配布が開始されているのに、Windows 10 Ver.1909のままなのだ。 機種によって配布が遅れている原因は「Safeguard Holds」と呼ばれる措置が原因だ。これは機能アップデートを実行した結果、障害が発生することをMicrosoft側で検出した場合に、同じ条件を持つマシン

                                                                    Windows 10で秋の大型アップデートが始まったのに、春のアップデートも落ちてこないマシンがあるのはなぜ? (1/2)
                                                                  • ChatGPTを探す旅に出させていただきます | DevelopersIO

                                                                    文書の数が多い場合、単語の種類(ボキャブラリ)も多くなり単語の次元が大幅に増えていきます。 一方、一つの文書に含まれる単語の数には限りがあるため、これは全体として疎行列になります。 また、単語が各次元として扱われますが、文書ごとの出現順序など、単語間での関連性を示す情報は抜け落ちたものとなります。 それに対して低次元(通常数百次元程度)の密な行列で単語の意味を定義する方法があります。 これは、「分散表現」や「埋め込み表現」と言われるものになっております。 この表現を獲得するため手法は様々なものがありますが、ここではWord2Vecを紹介します。 元論文 : Efficient Estimation of Word Representations in Vector Space 具体的な実装についての解説 : word2vec Parameter Learning Explained Wor

                                                                      ChatGPTを探す旅に出させていただきます | DevelopersIO
                                                                    • GPT-4を利用した長文原稿自動生成プログラムの紹介|IT navi

                                                                      以下の記事は、アウトライン及び原稿の自動生成プログラムによって作成したものです。 通常、GPT-4で長い文章を作成する場合は、最初に全体のアウトラインを作成し、部分ごとに分割して文章を生成して、最後に全体を統合する必要がありますが、このプログラムは、その手順を一括でできるようにしたものです。プログラムは記事の後に紹介します。 第1章: AIの浸透と今後のビジネスへの影響1. はじめにa. AIの重要性と現代ビジネスへの適応 近年、人工知能(AI)の急速な発展とその浸透がビジネス界に大きな影響を与えています。今や、AI技術は製造業からサービス業、さらには情報産業まで幅広く利用されており、企業が生き残るためには、この新技術に適応し実用化しなければならない時代となっています。そこで、本章ではこれまでのAI技術の進化とその局面を明らかにし、今後のビジネスに与える影響について検証します。 b. AI

                                                                        GPT-4を利用した長文原稿自動生成プログラムの紹介|IT navi
                                                                      • 【2022年】AWS全サービスまとめ | DevelopersIO

                                                                        こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2022年版です。 こんにちは。サービスグループの武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2022年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2021年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 223個 です。 まとめるにあ

                                                                          【2022年】AWS全サービスまとめ | DevelopersIO
                                                                        • Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜 / PyCon JP 2019

                                                                          PyCon JP 2019 での発表スライドです。 GitHub: https://github.com/taishi-i/nagisa-tutorial-pycon2019

                                                                            Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜 / PyCon JP 2019
                                                                          • 「GPT-4」が無料で使える?--「新しいBing」と「Poe」の賢い使い方

                                                                            先週の話はもう過去の話。AI技術の進化は日進月歩で、GPT-4の圧倒的なアウトプットの質の向上をはじめ、私たちが感じる未来への期待感は高まるばかりです。 GPT-4は、文脈理解や複雑なタスクへの対応力がGPT-3に比べて向上しており、ますます多くのことができるようになっています。 プロンプトだけでHTMLファイルのコーディングを依頼したところ、そこそこ面倒くさい要求なのに、ちゃんと動いて私自身も驚きました。 また、GPT-4のデモでは、手書きのスケッチからコーディングを行うことができるなど、これからの進化はまさに「今、試してみる価値あり」といえるでしょう。 しかし「有料だしなぁ・・・」とまだGPT-4を体験したことがない方も多いのではないでしょうか? そこで今回は、実際にGPT-4を使いながら、その魅力と「無料」で体験できる2サービスを使いこなすコツをお伝えしたいと思います。 記事作成の相

                                                                            • 驚くべき完成度!AWSでサーバレスAPIの作成をChatGPTに頼んだ結果〜AWSエンジニアの役割が変化する?!〜 - Qiita

                                                                              驚くべき完成度!AWSでサーバレスAPIの作成をChatGPTに頼んだ結果〜AWSエンジニアの役割が変化する?!〜AWSCDKChatGPT記事投稿キャンペーン_ChatGPTGPT-4 はじめに ChatGPTがリリースされて日々、会話しては衝撃を受けています。 現在AWSエンジニアとして働いていますが、自分たちの働き方も大きく変わるのでは?!と感じて色々ChatGPTの使い方、自分達の働き方を模索しています。 AWSでのサーバレスAPIの作成をChatGPTに依頼たらどうなるのか? という事を現時点(2023/3/19のGPT-4)のChatGPTで試しながら、結果を元に自分たちの働き方がどう変わるのか考えてみたいと思います。 ChatGPTとは ChatGPTとは、OpenAIが開発した大規模な言語モデルです。 自然言語処理の能力が非常に高く、チャットベースで依頼・質問する事で質問応

                                                                                驚くべき完成度!AWSでサーバレスAPIの作成をChatGPTに頼んだ結果〜AWSエンジニアの役割が変化する?!〜 - Qiita
                                                                              • 自然言語系AIサービスと著作権侵害|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

                                                                                第1 はじめに 自然言語処理技術の発展に伴い、自然言語AIを利用したサービスが大変盛り上がっています。 たとえば、検索、要約、翻訳、チャットボット、文章の自動生成、入力補完などのサービスで、近いところで有名なのは、2020年にOpenAIが発表した「GPT-3」ですかね。これは約45TBにおよぶ大規模なテキストデータを学習し、あたかも人間が書いたような文章を自動で生成することが可能な自然言語モデルです。 【参考リンク】 自然言語処理モデル「GPT-3」の紹介 進化が止まらない自然言語処理技術ですが、事業者が自然言語AIを利用したサービス(*ここでは、データの処理がクラウド上で自動的に行われるサービスを前提とします)を提供する際に検討しなければならないことは、大きく分けると、学習済みモデルの構築フェーズの問題と、モデルを利用したサービス提供フェーズに関する問題に分かれます。 このうち、モデル

                                                                                  自然言語系AIサービスと著作権侵害|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
                                                                                • 深層学習 DS-GA 1008 · 2020年度春学期 · ニューヨーク大学データ・サイエンス・センター

                                                                                  概要 この講義では、深層学習や表現学習の最新技術について、主に教師あり・教師なし深層学習、埋め込み手法、距離学習、畳み込み・再帰型ニューラルネットワークや、それらを用いたコンピュータビジョン、自然言語処理、音声認識などの応用技術を取り扱います。 この講義は「DS-GA 1001 Intro to Data Science」あるいは大学院レベルの機械学習科目をすでに履修していることを前提とします。 講義 凡例: 🖥 スライド, 📓 Jupyter notebook, 🎥 YouTubeビデオ. 週 形式 タイトル 資料