並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 9408件

新着順 人気順

OpenAIの検索結果281 - 320 件 / 9408件

  • 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan

    Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。 Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。 StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、St

      音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan
    • ChatGPT Impact - その社会的/ビジネス価値を考える -

      ChatGPT は既にエンジニア以外の方も含めて知られ始めています。2023年4月現在の ChatGPT が何なのかを整理するとともに。その社会やビジネスへの実装の価値を考えます。 入門編としてご参照ください。 - ChatGPT 概要 - Prompt の例 - 気の利いたPrompt

        ChatGPT Impact - その社会的/ビジネス価値を考える -
      • ChatGPT有料プランは「従量課金」がおすすめ!驚きの安さで得られるメリット | ライフハッカー・ジャパン

        楽天ゴールドカードはメリットない?プレミアムカード・年会費無料楽天カードとの違いや元を取る損益分岐点はいくら?

          ChatGPT有料プランは「従量課金」がおすすめ!驚きの安さで得られるメリット | ライフハッカー・ジャパン
        • 文章から画像を生成するAI「DALL・E2」を使ってみた|柞刈湯葉

          文章から画像を自動生成する DALL・E2 が先日一般公開された。画像の商用利用も可能とのことなので、うまくすれば note 記事のアイキャッチ作成に使えるかもしれない。 使用は基本無料だが申請制である。かなり待ち行列が長いらしく、僕は7月6日に申請したら7月30日に通った。住所や職業や使用目的などの面倒な入力欄はなかった。SMS 認証があるので電話番号を取られる点だけ注意されたし。 テキスト(英文)を入力すると、15秒ほどで1024×1024の画像を4枚生成してくれる。初月は無料で50回、それ以後は毎月15回分のクレジットが発行される。もっと使うには課金が必要で、15ドル115回なので1回17円。OpenAI とか名乗っていながらずいぶん商業的なフリーミアム形態だが、ちょっと遊んでみる分にはちょうどいい。 とりあえず触ってみるてっきり Python 等から API を叩くのだと思っていた

            文章から画像を生成するAI「DALL・E2」を使ってみた|柞刈湯葉
          • 「便利すぎる」──GitHubから直接「Visual Studio Code」を起動できる新機能が話題に

            米GitHubは8月11日(現地時間、以下同)、ソースコード共有サイト「GitHub」上でコードエディタ「Visual Studio Code」のWebブラウザ版を起動できる機能「Codespaces」のβ版を公開した。Twitterでは「便利すぎる」などと、ITエンジニアを中心に話題になっている。 ユーザーはGitHubのリポジトリ画面で「.」(ドットキー)を押すとVisual Studio Codeが起動する。個人ユーザーは当面無料で利用でき、チーム向けや企業向けのプランを利用している法人ユーザーも9月10日までは無料で試用できる。 法人向け料金は従量制で、計算に使用するCPUの性能と利用時間で変動する。最も安い2コアのCPUを使う場合は1時間で0.18ドル(約20円)。使用したデータの容量1GB当たり0.07ドル(約7円)も月額で別途請求する。 Visual Studio Codeは

              「便利すぎる」──GitHubから直接「Visual Studio Code」を起動できる新機能が話題に
            • 簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics

              こんにちは、安部です。 11月なのに暑かったり寒かったしますが、皆様いかがお過ごしでしょうか。 さて、先日のOpenAI DevDay、大変な盛り上がりでしたね。 様々な新機能が公開され、GPT関連がさらなるパワーアップを遂げました。 DevDayは基本的に開発者向けのイベントですが、一般ユーザ向けの新機能も公開されました。 それがGPTsです。 今回は、GPTsが使えるようになったので試してみたいと思います。 GPTsとは GPTsとは、GPT Builderを使ってノーコードで簡単にChatGPTをカスタマイズできるサービスで、今のところ有料ユーザのみが使用できます。 ChatGPTは特定タスク向けのサービスではありませんが、精度の良い回答をもらおうと思ったらプロンプトを工夫したり事前情報をたくさん与えないといけなかったりしますよね? GPTsは、あらかじめ特定の目的を持たせたChat

                簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics
              • GPTが出した回答の確からしさを見えるようにしてみる - Taste of Tech Topics

                皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 この記事はGPTでチャットボットを作ってみるシリーズ第3弾です。 第1弾と第2弾もぜひご覧ください。 acro-engineer.hatenablog.com acro-engineer.hatenablog.com 第1弾では、GPTになるべく正確な回答をさせるために、回答の情報を持つ文書を検索し、それをもとに回答を生成するという内容を試しました。 文書をもとに回答を生成することで比較的正確な回答を取得することができました。 ただし、この回答も必ずしも正確な回答とは限らないので、どれくらい信頼していいのかを自動で判定する仕組みが欲しくなります。 今回は第1弾のシ

                  GPTが出した回答の確からしさを見えるようにしてみる - Taste of Tech Topics
                • Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita

                  GPT-4o凄すぎる!! 出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。 先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました! あらためて記事を出してくださったことに感謝いたします! まずは初弾!ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法 を書いていきます! まずは見た目(Power Apps)から! まずはPower Appsでサクっと画面を作ります! PowerPoint感覚で作れることが強みですからね! 最低限のもので構成しています。 画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo

                    Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita
                  • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                    昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                      GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                    • 【令和最新版】何もわからない人向けのローカル LLM 入門

                      こんにちは、Saldraです。普段はPictoriaという会社でAIの美少女の錬成に励んでいるエンジニアです。この記事はローカルLLMの概要をつかむことを目的とします。対象読者は以下です。 なんとなく ChatGPT は使ったことある人 ローカル LLM を聞いたことあるけどやったことない人 ローカル LLM とは OpenAIがAPIを公開してから、大規模言語モデル(以降LLMとします)は大きく進化していきました。この進化はOpenAIのAPIだけでなく、ローカルLLMも進化をしています。 ローカルLLMとは「一般向けにファイルとして公開されたモデル」で推論させる遊びです。APIは便利ですが、インターネットの接続が必要であったり、API提供側に依存する問題があります。ローカルLLMは自前で運用ができるため、APIにはないメリットや魅力があります。一方で、環境構築やマシンスペック等、少し始

                        【令和最新版】何もわからない人向けのローカル LLM 入門
                      • 有能な秘書か、大ぼら吹きか 「ChatGPT」をスプレッドシートで使えるアドオンを試してみた

                        有能な秘書か、大ぼら吹きか 「ChatGPT」をスプレッドシートで使えるアドオンを試してみた(1/3 ページ) 話題のAIチャットボット「ChatGPT」だが、普通の人にはまだちょっと身近にはなっていない。またAIとやりとりしても「AIと会話できるのは分かった。すごいけど、だから何?」と感じる人もいる。しかし、ビジネスツールであるスプレッドシートからChatGPTが呼び出せると、景色はちょっと変わる。 新人に「このリストを調べて埋めておいて!」と依頼するような感じで、AIにちょっとした調べ物や、データづくり、問題づくりなどをさせられるようになる。UIは慣れ親しんだスプレッドシートで、依頼の文字を変更すれば自動的に内容が書き換わる。

                          有能な秘書か、大ぼら吹きか 「ChatGPT」をスプレッドシートで使えるアドオンを試してみた
                        • ChatGPTプロンプトエンジニアリングのコツ8箇条~OpenAI公式のベストプラクティスから学ぶ~ - Qiita

                          はじめに OpenAI API (ChatGPT含む) のプロンプトエンジニアリングのベストプラクティスが公式から出ているのを知り、和訳しながら読んでいきたいと思います! プロンプトエンジニアリング8箇条 (忙しい人向け) 最新のモデルを使用する 指示をプロンプトの最初に配置し、###または"""で指示と文脈を分ける 望む文脈、結果、長さ、形式、スタイルなどについて具体的で詳細に記述する 例を使って望む出力形式を明示する ゼロショットから始め、効果がなければファインチューニングを行う 曖昧で不正確な表現を減らす やってほしくないことだけでなく、代わりにやってほしいことも記述する コード生成には、特定のパターンに誘導する「leading words」を使用する How prompt engineering works (プロンプトエンジニアリングの仕組み) インストラクション・フォロー・モデ

                            ChatGPTプロンプトエンジニアリングのコツ8箇条~OpenAI公式のベストプラクティスから学ぶ~ - Qiita
                          • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                              Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                            • TechCrunch | Startup and Technology News

                              Welcome back to TechCrunch’s Week in Review. This week had two major events from OpenAI and Google. OpenAI’s spring update event saw the reveal of its new model, GPT-4o, which…

                                TechCrunch | Startup and Technology News
                              • ChatGPTを使った社内ドキュメントを読み込んで回答できるアシスタントBotを作りました!|howdy39

                                ※2023.04.25 予想以上に見られているので追記 ChatGPTはAPIでの利用なので学習はされません。また入れてる情報は社内のだれでも見れてよい情報に留めており、顧客情報を始めとした個人情報などは一切含めていません。STORES サービスに関わる情報も含んでおりません。 入れているのは社内業務における経費精算などの各種申請の手順、オフィスの利用ルール、福利厚生の解説などに限定されています。 この記事は STORES PX Advent Calendar 2023 Spring 16日目の記事です こんにちは!STORES のPX部門IT本部でマネージャーをしている@howdy39です。 先日、社内向けにChatGPTを使ったアシスタントBot(Slack Bot)を開発しリリースしたのでそのご紹介記事になります。 リリースアナウンスのSlackメッセージどんなBOT?STORES

                                  ChatGPTを使った社内ドキュメントを読み込んで回答できるアシスタントBotを作りました!|howdy39
                                • 無料GPT-4アプリの公開とクリーンデータセットの作成について|kun1emon

                                  どうもこんにちは。最近、大規模言語モデル(LLM)の個人開発に取り組んでいる@kun1em0nと申します。この度、最近話題のChatGPTの最新モデルGPT-4を無料で使用できるアプリを作成したので公開いたします。今回アプリを無料で公開する意図についてこの記事で説明したいと思います。 Japanese-Alpaca-LoRAの作成前回の記事ではスタンフォード大学が作成したStanford Alpacaの日本語対応モデル Japanese-Alpaca-LoRAを作成し公開した話を紹介しました。 このモデルの作成に使ったデータの大元(Alpacaデータ)はText-davinci-003というOpenAIサービスで出力した結果になりますが、OpenAIの利用規約ではコンテンツ生成者はOpenAIサービスで出力した結果を競合モデルの開発用途に使用してはならないと記載されています。ただ、コンテン

                                    無料GPT-4アプリの公開とクリーンデータセットの作成について|kun1emon
                                  • GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita

                                    GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみたPythonAWSAzureOpenAIGoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行しています。 各モデルの詳細は以下のとおりです。 G

                                      GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita
                                    • ChatGPT によって真っ先に奪われるのは僕らの仕事ではなく、老害・お局・必要悪といった謎の立場 ♯フミコフミオ ♯さくマガ - さくマガ

                                      「ターミネーター」史観に毒されると AI は人類の敵に見えてしまう 対話型AI のひとつである ChatGPT が大ブームだ。ChatGPT によって「社会や働き方がどう変わるのか」「人間の仕事が奪われるのではないか」という議論が出てきている。過激な意見として人間が AI によって滅ぼされるというものもある。 AI への警戒心は映画「ターミネーター」シリーズの影響が大きいのではないか。ターミネーターは「1997年の未来(!)に、スカイネットという AI が人類に対して核ミサイル攻撃を仕掛けてから、人類との生存をかけて戦争が勃発する」という設定の SF映画だ。シリーズ第2作目『ターミネーター2』は名作で、大ブームを起こした。僕のように、ボンクラな少年期にターミネーターの洗礼を受けた者は、入浴する前に未来からやってきたシュワルツェネッガーのように、全裸で片膝をつくポーズを取る癖が治らず(僕がそ

                                        ChatGPT によって真っ先に奪われるのは僕らの仕事ではなく、老害・お局・必要悪といった謎の立場 ♯フミコフミオ ♯さくマガ - さくマガ
                                      • 英語学習は AI と行う時代がついに到来!? ChatGPT と LINE Bot でオンライン英会話アプリ「Small GPTalk」を作ってみた | DevelopersIO

                                        こんにちは。CX 事業本部 Delivery 部のきんじょーです。 ChatGPT の API がついに提供されたということで、チャット AI 界隈が盛り上がっていますね。 このビッグウェーブに乗り遅れてはいけないと思い、ChatGPT の優れた自然言語処理能力を活かして LINE で英会話の練習をする「Small GPTalk」というサービスを作ってみました! アプリの紹介と、アプリ作成を通して感じた ChatGPT の可能性についてブログ化していきます。 Small GPTalk とは Small GPTalk は、ChatGPT から派遣された AI 英語講師と LINE 上で SmallTalk(世間話) を楽しむためのアプリです。 レッスンが始まると、講師はトピックを提示してくれます。好きなトピックを選んで講師と会話を楽しみましょう。 レッスンを終わるときは「終わります」と伝えて

                                          英語学習は AI と行う時代がついに到来!? ChatGPT と LINE Bot でオンライン英会話アプリ「Small GPTalk」を作ってみた | DevelopersIO
                                        • デザイナーがChatGPTに指示されながらECサイトデザインをしてみる実験 | Design Journal vol.25|Sakino Tomiura

                                          これはなに?昨年末にOpenAIがリリースしたチャット型AIの「ChatGPT」と一緒にデザインしていくプロセスで、実際にどんなことができるか?を実験してみたnoteです。 前提と注意点 🚨まずこのnoteの趣旨は「これらが実用的にデザイン制作に使える!」といったものではありません。 どちらかというと遊びに近く、実験的に行ったもので、結論から言うと現時点では実用的に使える要素はまだ少ないかなと思います。 また、前提として私はまだまだAIやChatGPTについて詳しいわけでは全くなく、これからちゃんと勉強してみようと思ってるぐらいのレベル、という前提で読んでいただけると幸いです。 (AIについて本を読んだり座学的な勉強から入るより「とにかく何かしら触ったりつくったりしてみる」方が楽しめると思い、せっかくなのでその実験の過程をまとめてみました。) 「こういうこともできるよ」「このやり方の方が

                                            デザイナーがChatGPTに指示されながらECサイトデザインをしてみる実験 | Design Journal vol.25|Sakino Tomiura
                                          • 「GPT-4より強力なAIの開発を直ちに停止せよ」──公開書簡にマスク氏やウォズニアック氏が署名

                                            AIの安全性について研究する非営利の研究組織Future of Life Institute(FLI)は3月28日、GPT-4よりも強力なAIシステムの開発と運用を少なくとも6カ月間停止するように呼びかける書簡を公開し、本稿執筆現在1000人以上が署名している。イーロン・マスク氏や、米Appleの共同創業者、スティーブ・ウォズニアック氏の名前もある。 人類にとって深刻なリスクをもたらす可能性のある一般的なタスクにおいて、人間と競合するようになったAIシステムに対する懸念から提示された。現在のAI技術が安全性や倫理性の問題を引き起こす可能性があるため、研究者や開発者に対して、これらのリスクを十分に評価し、必要な対策を講じるよう呼びかけている。 また、AIがもたらす利益とリスクの均衡を保つために、国際的な協力と競争の制限が重要だと主張する。信頼性、アライメント、忠誠心などを確保するために必要な

                                              「GPT-4より強力なAIの開発を直ちに停止せよ」──公開書簡にマスク氏やウォズニアック氏が署名
                                            • 無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携

                                              米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。 ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。 モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習(ファインチューニング)したモデルを用意する。いずれも4096トークン(おおよそ単語数の意)まで文脈を読める。 性能は、Llama-2-70b-chat(700億のチャット

                                                無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携
                                              • GPT-4搭載の「新しいBing」、誰でも利用可能に 新機能も多数追加

                                                米Microsoftは5月4日(現地時間)、2月に限定プレビューした「新しいBing」を「オープンプレビュー」に移行し、ウェイティングリストに登録せずに誰でも利用できるようにした。また、多数の新機能も発表した。新機能の詳細は、23日から開催の年次開発者会議「Build 2023」で発表する計画だ。 MicrosoftアカウントでBingにサインインするだけで、誰でも新しいBingとEdgeを使えるようになった。 主な新機能を以下に紹介する。本稿執筆現在、筆者の環境ではまだ使えないものもあり、それがロールアウト中だからなのか、米国限定なのかは不明だ。Buildでより具体的な説明があると期待したい。 回答がよりビジュアルに これまでBingチャットの回答はテキストのみだったが、質問内容によっては画像や動画も盛り込まれるようになる。 また、質問に画像や動画のURLを含めると、それらに関して説明す

                                                  GPT-4搭載の「新しいBing」、誰でも利用可能に 新機能も多数追加
                                                • GPT-3を使って根拠付きで正確に質問応答してくれるシステムを作ってみる - Taste of Tech Topics

                                                  こんにちは。社内データサイエンスチームYAMALEXの@Ssk1029Takashiです。 最近はChatGPTが出て注目を浴びたり、BingにもChatGPTのように質問応答してくれるAIが搭載されるなど、OpenAIのGPTモデルが世の中を騒がせています。 私もChatGPT使ってみましたが、受け答え自体は人が書いていた文章と遜色なく、文章の自動生成もここまで来たか。。という感じでした。 そんなChatGPTの特徴の一つとして、回答には時々嘘が含まれるというものがあります。 ChatGPT自体は知識を持っているわけではないので、学習データにないことなどはそれっぽいけどでたらめな回答を返してしまいます。 ただし、最近追加されたBingのGPTでは、ChatGPTよりもはるかに正確な回答が返ってくるように感じます。 画面を見ると回答の根拠となっている詳細情報が出ています。 ここから推測する

                                                    GPT-3を使って根拠付きで正確に質問応答してくれるシステムを作ってみる - Taste of Tech Topics
                                                  • 文章からマインドマップを自動生成「マインドマップAI」 ChatGPTで構築

                                                    テーマや文章を入力するだけで、マインドマップを自動生成できるサービス「マインドマップAI」を、個人開発者の矢野さとるさんが4月11日に公開した。ChatGPTを活用したサービスだ。 マインドマップは、情報やアイデアを視覚的にまとめる手法。中心になるキーワードから枝分かれさせながら、キーワードを整理していく。 「マインドマップAI」にテーマと文章を入力すると、AIが内容を要約し、キーワードをピックアップしてマインドマップ化する。また、テーマだけ入力してマインドマップを自動生成することも可能。 生成したマインドマップは、画像(PNG)またはfreemind形式(.mm)でダウンロードできる。 関連記事 指定したテーマで、ChatGPTが自動作文「AI作文くん」 学生から社会人に対応 テーマや文字数を指定するだけで、それに合った作文をChatGPTで自動生成できるサービス「AI作文くん」が登場。

                                                      文章からマインドマップを自動生成「マインドマップAI」 ChatGPTで構築
                                                    • 自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告

                                                      AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステムを試した結果について報告しています。 I record myself on audio 24x7 and use an AI to process the information. Is this the future? https://roberdam.com/en/wisper.html ダム氏が全自動口述日記を思いついたのは、以前から「1TB超えのストレージを内蔵したスマートフォンが登場すれば、24時間365日録音し続けることが可能なのではないか」と考えていたことから

                                                        自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告
                                                      • 【超入門】GPT Builderの使い方!【GPTs / ChatGPT】

                                                        はじめまして、ますみです! 先日のOpenAI社の初めてのカンファレンスである「OpenAI Dev Day 2023」で発表されたGPT Builderがついに利用可能になりました! 上記の発表会にて、「自分で作ったGPTを公開して、たくさん他の人に利用されると、その利用量に応じて、収益がもらえる」という話は非常に話題を呼びました。 そこで、おそらく多くの方が「自分のGPTを作って、収益化したい!」「どうやって自分のGPTを作るのか知りたい!」と気になっている方が多いと思います! そこで、この記事では、自分のGPTを作るためのツールである「GPT Builderの使い方(始め方)」を徹底解説します! もしも自社のGPT開発の外注や相談をしたい方は、記事末尾のGoogleフォームよりお問い合わせいただければ、お力になります! また、「ChatGPT」や「OpenAI Dev Day」につい

                                                          【超入門】GPT Builderの使い方!【GPTs / ChatGPT】
                                                        • 自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常

                                                          こんにちは。nino_piraです。 先日、強化学習の資料の引用ツイートをしましたら、それなりに伸びたので、「もしかして、みんな強化学習に興味ある!?」と思い自分が読んだ&好きな資料をまとめてます。 また、ブログを書いているうちに「何を持って基礎とするか」などカテゴライズも自分の中でも行方不明になっていましたので、色々思うところはあると思いますが、暖かい目で読んで頂ければ幸いです。。。。 あくまでも私の経験 強化学習基礎系 [Qiita] DQN(Deep Q Network)を理解したので、Gopherくんの図を使って説明 [書籍]これからの強化学習 [pdf] (小南さん作成) 強化学習入門 [pdf] (通称) Sutton本第2版 [書籍] 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [ブログ]強化学習 もう少し強化学習を詳しく知りたい系の人へ [書籍]速習 強化学

                                                            自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常
                                                          • GPT-4oをOCRとして使う - Re:ゼロから始めるML生活

                                                            OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ

                                                              GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
                                                            • マイクロソフト、GPT-4に任意のドキュメントなどを読み込ませて回答してもらえる「Azure OpenAI Service On Your Data」が正式サービスに

                                                              マイクロソフトは、GPT-35-TurboもしくはGPT-4に任意のデータソースを指定することでそのデータの内容を読み込み、質問に対して内容を基に回答できるようになる新機能「Azure OpenAI On Your Data」が正式サービスとなったことを発表しました。 例えば、社内規約や社内マニュアルなどを読み込ませると、「PCの修理を申し込むための社内手続きは?」といった、汎用の知識だけしか持たない従来のGPTでは答えられない質問にも回答できるようになります。 任意のドキュメントを読み込ませるための支援ツール「Azure AI Studio」には、Azure OpenAI On Your DataでカスタマイズしたAIを、チャットボットとして公開する機能も備わっています。 カスタマイズしたチャットAIのサービスを、社内や社外に簡単に公開できるようになります。 Azure OpenAI S

                                                                マイクロソフト、GPT-4に任意のドキュメントなどを読み込ませて回答してもらえる「Azure OpenAI Service On Your Data」が正式サービスに
                                                              • GitHub Copilot導入後、初めて使う時。(豊富な使用例付き) - Qiita

                                                                ※GitHub Copilotが長いコードを提案してきた時、ショートカットキーの「単語単位で受け入れる」を使用すると便利です。 ※ インライン候補をトリガーするとは提案が表示される場所ならばどこでも GitHub Copilot が動きます。 例えば、提案が表示される場所からカーソルが動かしてしまっても、カーソルを元の場所に戻してトリガーコマンドを使うと提案が表示されます。 ※ インライン候補をトリガーするはデフォルトのキー設定では動きません。:Windows で確認 自分でキーボードショートカットキーを設定する必要があります。(これは自分の環境だけかもしれません。) 導入後(課金後) 導入後に何をしていいのか?何が出来るのかがよくわからなかったので調べてみた。 環境 Windows10 GitHub Copilot (導入 1年契約 or 1月契約) VSCode VSCode Insi

                                                                  GitHub Copilot導入後、初めて使う時。(豊富な使用例付き) - Qiita
                                                                • いちばんやさしいローカル LLM|ぬこぬこ

                                                                  概要ローカル LLM 初めましての方でも動かせるチュートリアル 最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル(LLM)の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。 現状、様々な評価指標により LLM の性能が測定されていますが、

                                                                    いちばんやさしいローカル LLM|ぬこぬこ
                                                                  • ChatGPTによる回答をStack Overflowが一時的に禁止 大量のもっともらしいが不正確な回答に対処しきれず

                                                                    プログラミング関連Q&Aサイトの米Stack Overflowは12月5日(現地時間)、AIチャットボット「ChatGPT」によって生成した回答の投稿を一時的に禁止した。ChatGPTによる回答に間違っているものが多く、「ユーザーにとって実質的に有害」だとしている。 ChatGPTは、OpenAIが開発した実験的なチャットボットで、コンプリートテキストジェネレーター「GPT-3.5」に基づいている。そのデモ版が1日に無料で公開されて以来、人気が高まっている。 Stack Overflowによると、ChatGPTが生成する回答が間違っている可能性が高いにもかかわらず、一見もっともらしく見え、かつ、回答が非常に簡単に生成できることから、投稿前に回答の正しさを確認せずに投稿している人が多数いるという。 数千件にも上るこうした回答の正誤を判断するために「専門知識を持つ誰かが確認しなければならないと

                                                                      ChatGPTによる回答をStack Overflowが一時的に禁止 大量のもっともらしいが不正確な回答に対処しきれず
                                                                    • https://twitter.com/buffett_code/status/1605488460659392514

                                                                        https://twitter.com/buffett_code/status/1605488460659392514
                                                                      • ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics

                                                                        こんにちは、最近スマホのChatGPTアプリで、音声入出力機能を使って会話を楽しんでいる安部です。 皆さんWebアプリ開発などで、画面モックを作成しなければいけない場面は多いですよね? 適当なHTMLを作ったり、ツールで図示したりしますが、正直面倒です。 そこで今回は、ChatGPTに最初から画面モックを作ってもらいます。 最近はChatGPTに画像を添付できるようになったので手書き画像からHTMLを出力することもできますが、 この記事では画面要素を言葉で指定し、HTMLを出力してもらいます(配置などのデザインは、ひとまずChatGPTにお任せしてみます)。 では早速始めましょう。使用モデルはGPT-4です。 簡単な入力フォームを出力させる まずは、よく使いそうな簡単な入力フォームを出力してもらいます。 ここでは、「書籍を登録する画面」という設定で指示を出します。 次の画面構成の案を、HT

                                                                          ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics
                                                                        • ChatGPTを神の道具にするChrome拡張機能4選

                                                                          いろいろと便利に使えると話題のChatGPTですが、基本OpenAIのウェブサイトから使う仕様なのに機能が少なくて使いやすいとは言えなかったりします。 この記事ではそんなChatGPTの弱点を改善するChrome拡張を紹介します。 Glarity-Summary for Google/YouTube (ChatGPT)Glarity-Summary for Google/YouTube (ChatGPT)は、ChatGPTを用いてさまざまなサイト上で要約をしてくれるChrome拡張です。 右側に検索ワードに対する要約を出してくれるGoogle検索ではこのように右側に要約欄が現れ、検索ワードに対する要約を出力してくれます。 YouTubeでも右側に要約欄が出現、その下には書き起こし欄もYouTubeにも対応しており、動画の要約と音声の書き起こしを行なってくれます。 「とりあえずChatGPT

                                                                            ChatGPTを神の道具にするChrome拡張機能4選
                                                                          • 神絵を描くAI「 #Midjourney 」はどうやって生まれたか…その可能性と限界、そして課題

                                                                            筆者が絵描きAI「Midjourney」に描かせた風景。「Sustainable Development Goals」をテーマに指定した。 作成:清水亮 ここのところ、Twitterなどで“神絵を描くAI”こと「Midjourney」が、話題になっている。一瞬で神のように上手な絵が描けると話題になり、またたく間にネットのミームになった。 「絵を描くAI」というと、イーロン・マスクらが出資したことでも知られるAI研究企業、米OpenAIの画像生成AI「DALL-E2」が有名だが、グーグルは今年に入ってからDALL-E2の性能を上回る「Imagen」を発表し、さらに大規模な作画AI「Parti」も矢継ぎ早に発表している。 Midjourneyはこれら画像生成AI開発ブームの一端として生まれたとも言える。 この記事では、全3回の短期集中連載として、AI研究者目線で見た「Midjourney」の課

                                                                              神絵を描くAI「 #Midjourney 」はどうやって生まれたか…その可能性と限界、そして課題
                                                                            • AI搭載の新「Bing」を使って実感--大勢が「ググる」から「ビグる」に乗り換える可能性

                                                                              マイクロソフトの進化した検索サービス「Bing」を試してみた。昨年末から、OpenAIが提供する「ChatGPT」が話題だ。一方のBingはCharGPTをベースにマイクロソフトが持つ技術と融合することで、使いやすい「検索サービス」に生まれ変わっている。 ひょっとすると、検索王者であるグーグルの立場を脅かすのではないか、という期待感に満ちている。最近、IT関連で熱狂するニュースがなくて飽き飽きしていたが、新しいBingはIT業界の構造がひっくり返るのではないかとワクワクが止まらない。 新しいBingはチャット形式の検索サービスだ。 これまでの検索と言えば、思いつく単語をいくつか入力し、検索で出てきた複数のサイトから、自分が知りたい情報が載っていそうなタイトルをクリックして、本文を読んで答えを導き出していくというものであった。 新しいBingでもそうした検索は可能だ。さらに「チャット」という

                                                                                AI搭載の新「Bing」を使って実感--大勢が「ググる」から「ビグる」に乗り換える可能性
                                                                              • AIが「心の理論」テストで人間超え、この結果は何を意味するか

                                                                                人工知能(AI)モデルが、人間の感情理解力を測るテストで人間並み、時に上回る成績を収めたことが分かった。ただ、訓練データにそうしたタスクが含まれていた可能性も否定できず、大規模言語モデルが「人のように」考えているわけではない。 by Rhiannon Williams2024.05.22 275 21 人間は複雑な存在だ。私たちのコミュニケーションの方法は多層的であり、心理学者たちは対話から意味や理解を推測する能力を測るためのテストを数多く考案してきた。 人工知能(AI)モデルは、こうしたテストでますます優れた結果を出している。ネイチャー・ヒューマン・ビヘイビア(Nature Human Behavior)に5月20日に掲載された新たな研究によると、一部の大規模言語モデル(LLM)は人の心理状態を追跡する能力(いわゆる「心の理論」と呼ばれる)を測るために設計されたタスクを与えられた場合、人

                                                                                  AIが「心の理論」テストで人間超え、この結果は何を意味するか
                                                                                • OpenAIの共同設立者が「私たちは間違っていた」と語る、AIの危険性からデータをオープンにしない方針へと大転換

                                                                                  言語モデルのChatGPTや画像生成AIのDALL·Eを手がけるAI研究所のOpenAIは、AI技術の悪用を防ぎ社会に友好的な形で発展させることを目的に、サム・アルトマン氏やイーロン・マスク氏らが2015年に発足させた非営利組織です。そんなOpenAIの創始メンバーに名を連ねるイルヤ・サツキヴァー氏が、AIをオープンにするという設立当初の理念は誤りだったと、IT系ニュースサイト・The Vergeのインタビューの中で語りました。 OpenAI co-founder on company’s past approach to openly sharing research: ‘We were wrong’ - The Verge https://www.theverge.com/2023/3/15/23640180/openai-gpt-4-launch-closed-research-il

                                                                                    OpenAIの共同設立者が「私たちは間違っていた」と語る、AIの危険性からデータをオープンにしない方針へと大転換