並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 1649件

新着順 人気順

機械学習の検索結果241 - 280 件 / 1649件

  • MidjourneyとChatGPTで漫画を描いてみた #techtekt Advent Calendar 2023 - techtekt

    パーソルキャリアでUIUXデザイナーをしている比企(ひき)です。 今回は、Midjourney(個人的に課金して使ってます)とChatGPTで漫画を描いてみます。 作画担当:Midjourney 昨年、画像生成AIが次々と公開されているツールを試してみるものの、 生成される画像のクオリティが低い印象でした。 ところが「Midjourney」を使ってみたところとても感動しました。 ひとことでいうと「デッサン狂ってない」。 何を描いてもそれらしく仕上げてきます。 作画前の準備として 画像生成AIの仕組みとMidjourneyのプロンプトについて 理解していきたいと思います。 画像生成AIの仕組み いろいろな画像生成AIを試すと、「これはイケてない」、「これはイケてる」という違いが出てくるのはなぜなのでしょうか。そもそもどのような仕組みで画像が生成されるか調べてみました。 www.busines

      MidjourneyとChatGPTで漫画を描いてみた #techtekt Advent Calendar 2023 - techtekt
    • 画像生成AI「Midjourney」で同じキャラをコスプレさせて遊ぶ方法 (1/2)

      画像生成AI「Midjourney」を使ったAIイラスト制作TIPSをお届けしています本連載、今回は、Midjourneyを使って、同一キャラのコスプレ、要するに衣装替えを実現する方法をご紹介したいと思います。 Midjourneyは現在V5.2が公開されていますが、このバージョンから新たに追加された機能に「ズームアウト」と「パン」があります。 ズームアウトは、ひとつの画面からその外側にある風景を追加描写する、画像生成AI界隈では、いわゆる「アウトペイント」と呼ばれる機能。もう一方のパンは、アウトペイントを上下左右の指定方向にだけ行い、カメラを振った(パンした)かのように描写する機能です。 Midjourneyのアウトペイントは少し特徴的です。他の画像生成AIのアウトペイントが描画領域を追加してそこを描画していくのに対し、Midjourneyのそれは、元の絵を極力改変せずに縮小させて周囲に

        画像生成AI「Midjourney」で同じキャラをコスプレさせて遊ぶ方法 (1/2)
      • Kaggleのハードルを下げたい! - Qiita

        Image generated by OpenAI's DALL·E-3. はじめに こんにちは! 突然ですが、Kaggleのハードルって高くないですか?特に初見だと、複雑なルールや大量のデータなどに圧倒されてしまう人も多いかもしれませんね。また、全て英語なので非英語話者にとってはそこもハードルを上げる原因になっていると考えられます。実際は慣れれば簡単なことも多いのですが、Kaggle慣れするまでにやや時間がかかるのも事実です。そこで、少しでもKaggleのハードルを下げたいと考えて本記事を執筆しました。 対象読者様 この記事は、以下のような方をメインに想定して執筆しました。 AI・データ分析・機械学習に興味があって、Kaggleに参加しようと思ったけどハードルが高くて躊躇している方 Kaggleに参加したはいいものの、ドロップアウトしてしまった方 Kaggleのハードルを乗り越えたい方

          Kaggleのハードルを下げたい! - Qiita
        • 自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで | テクノエッジ TechnoEdge

          ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面(右上)、コードエディタ(右下)、Webブラウザ(左下)を持っています(左上は人間とチャットでやり取りする領域)。 人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。 今回、Dev

            自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで | テクノエッジ TechnoEdge
          • 米ニューヨーク・タイムズ、OpenAIを提訴 記事流用で数千億円損害 - 日本経済新聞

            【ニューヨーク=清水石珠実】米紙ニューヨーク・タイムズ(NYT)は27日、生成AI(人工知能)を手がける米オープンAIと同社に出資する米マイクロソフトを提訴した。2社がNYTの記事をAIの学習用に許可なく使用し、著作権を侵害していると指摘した。NYTによると、AI学習を巡って大手の報道機関が開発企業を訴えるのは今回が初めての例となる。ほかの報道機関やAI開発企業にも訴訟の動きが広がる可能性があ

              米ニューヨーク・タイムズ、OpenAIを提訴 記事流用で数千億円損害 - 日本経済新聞
            • データ職種の課題図書リストを作りたい - 下町柚子黄昏記 by @yuzutas0

              この記事は datatech-jp Advent Calendar 2023 3日目の記事です。 背景・趣旨 筆者(@yuzutas0)は風音屋(@Kazaneya_PR)という会社を経営しており、データ職種の採用・育成に関心を持っています。 複数企業で少ない専門家を奪い合って疲弊するような採用活動ではなく、マーケット全体がより豊かになるような動き方はできないだろうかと模索しています。 1つの実験として、MENTAで「第2新卒が3ヶ月でデータ職種への転職を目指す講座」というトレーニングを提供し、ありがたいことに30名以上の方々に受講いただきました。 ちなみにこの講座は今では風音屋の社内研修になっています。 MENTAの受講者が30名を突破しました🎉 卒業生が風音屋に入社したり、スキルアップして「社内で提案が通るようになった」「現職で活躍できるようになった」という感想もいただいています。

                データ職種の課題図書リストを作りたい - 下町柚子黄昏記 by @yuzutas0
              • 今後のスキルセットには必ず「AIを使いこなす」が組み込まれる GitHub CopilotとChatGPTの登場から考え直す、AIとの関わり方

                AIに仕事を奪われないために、自分の発想を強化していかないといけない 服部佑樹氏(以下、服部):次に行きたいと思います。「エンジニアとAIの関わり方」ですね。AIが登場したことによって、どういうかたちでエンジニアが変わっていくのか。概念としてはものすごく広いですが、みなさんもいろいろな観点の捉え方があると思っています。 組織としてどうするのかはその次の質問になりますが、あとはキャリアとしてとか、次のポジションをどうしようかなみたいなところも含めて、個人の観点なども含めて答えてもらえるといいんじゃないかなと思います。では黒崎さんからいいですか? (スライドを示して)3番目の質問「エンジニアがAIと協力して新たなアイデアを生み出すための効果的なアプローチ」ですね。あとは2番も合わせていいかもしれませんが、アプローチと潜在的な力を引き出すためのスキルをどうやって学んでいったらいいと思いますか?

                  今後のスキルセットには必ず「AIを使いこなす」が組み込まれる GitHub CopilotとChatGPTの登場から考え直す、AIとの関わり方
                • ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(野口 悠紀雄) @gendai_biz

                  ChatGPTの事前学習データの使用料をめぐって、ニューヨーク・タイムズがOpenAIを訴えました。これは、情報の価値がどのようにして生じるかという問題の基本に関わるものであり、生成AIの将来に大きな影響を与えます。しかし、簡単に答えが出るものではありません。 裁判の結果次第ではChatGPTが成り立たない 米紙ニューヨーク・タイムズは、ChatGPTの開発者であるOpenAIに対して、事前学習のデータの利用に関して支払いを求める訴訟を起こしました。 この問題は、「情報や知識に関する社会的制度をどう構築するか?」という問題の本質に関わっており、大変重要です。 最初にこれまでの経緯を見ると、ニューヨーク・タイムズはその記事を無断でAIの訓練に用いることを禁止しています。したがって、OpenAIが事前学習でニューヨーク・タイムスの記事を使っていないと証明できない限り、罰金を言い渡されることにな

                    ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(野口 悠紀雄) @gendai_biz
                  • AI時代に起業するということ|shi3z

                    生成AI以前と以後で、会社のあり方は決定的に変化していくのだと思う。 たとえば、昨日はとある会議で、「この(AI)サービスの原価はいくらか」という議論が沸き起こった。 AIサービスなのだから、AIの利用料くらいしかかからないかというとそうでもない。実際、AIを動かすためにはAIそのものにかかるお金以外の人件費がかかる。誰かに売る人の人件費や、システム開発のための人件費や、サポートのための人件費だ。ただ、AIサービスの場合、人件費を極限まで最小化することができる、という点が決定的に違う。 また「AIの利用料」も、「APIの利用料」なのか、ベアメタルサーバーの月額利用料なのか、それとも自社に持っているGPUマシンの電気代なのか、という議論のポイントがある。 あまり多くの人は語らないことだが、実は起業には再現性がある。 つまり、一度でも事業をうまく立ち上げたことがある経験を持つ人は、次も事業をう

                      AI時代に起業するということ|shi3z
                    • 「面倒なことはChatGPTにやらせよう」 - あなたの日常を変える一冊! - karaage. [からあげ]

                      「面倒なことはChatGPTにやらせよう」はどんな本か? 「ChatGPTに面倒なことをやらせてしまおう」というタイトル通りの内容の本です。AIの小難しい理論的な話は最低限にして、実用・エンジニアリングに最大限に振っています。 特にChatGPT Plusの有料版に特化しています。GPT-4と様々な拡張機能と呼ばれる機能、具体的にはBrowsing、Advanced Data Analysis、DALL・E、GPT-4V等の機能をフル活用します。 2023年11月のOpenAIの大規模アップデートにも完全対応しています。実は、その関係で全体の半分近くをかなりの急ピッチで書き直したのですが、そのかいもあり、商業誌でアップデートに対応したChatGPTの実用本としては、最速のタイミングでの販売になるのではないかと思います。 書籍の詳細は以下です。 面倒なことはChatGPTにやらせよう (KS

                        「面倒なことはChatGPTにやらせよう」 - あなたの日常を変える一冊! - karaage. [からあげ]
                      • NEC、「標準的GPU 1基で動く」世界トップクラスの日本語LLM

                          NEC、「標準的GPU 1基で動く」世界トップクラスの日本語LLM
                        • Azure OpenAIをもちいたLLMアプリの企画から本番構築までの道のり/Microsoft Build Japan

                          2023.6.27 Microsoft Build Japan で話した資料です。

                            Azure OpenAIをもちいたLLMアプリの企画から本番構築までの道のり/Microsoft Build Japan
                          • 数学の入門書を選ぶ3つのコツ - webエンジニアの日常

                            微分方程式をしっかりと学んだことが無く、何か手ごろな入門書はないかと本屋さんに出向いたあなたは、きっと驚くはずだ。 微分方程式の入門書はとても多いからだ。さらに、ぱらぱらとめくってみたり、目次を見てみても、中身はほとんど同じだったりする。 これは例え話ではなく、本当に驚くほど同じような書籍が連立している。 線形代数ともなると、さらに多い。 そこで、この記事では、似たような専門書・入門書の中からあなたが欲しいと思う一冊を見つけ出すための3つのコツを紹介する。 これは勉強マニアの私が常に実践しているコツで、この方法を使い始めてからほとんど本の購入に失敗したことが無い。(多くの失敗を重ねてできたノウハウだともいえる) もちろん、数学でなくても物理学の専門書・入門書を選ぶときでも使える。 【目次】 「はじめに」に注目 あなたが得たい知識は「練習問題」にある 最初の1割を理解できるか 最後に 「はじ

                              数学の入門書を選ぶ3つのコツ - webエンジニアの日常
                            • Photoshopの画像生成AIがすごい ついに商用利用もスタートへ (1/3)

                              Adobeが5月23日、生成AIモデル「Adobe Firefly」に、テキストを使って画像を追加・拡張・削除できる「ジェネレーティブ塗りつぶし」機能を追加。Photoshop(Beta)にベータ版の機能として搭載しました。実際に使ってみると、「以前から研究していたとはいえ、やっぱりAdobeが本気を出してくるとすごいな」という感想でした。 「消したり、足したり」30秒程度で まず試してみたのは、画像生成AI「Nijijjourney」で作ったいかにも生成が面倒くさそうなサイバーパンクの都市を題材にしたAI画像。画像サイズを横幅を1500ドットくらい広げた後に、生まれた空白を範囲選択して「ジェネレーティブ塗りつぶし」。すると適当に周囲の情報を読み、それっぽい形にイラストを広げてくれます。何もないものからよく作れるものです。 左がオリジナル画像のサイバーパンクの都市。右が左右のサイズを広げて

                                Photoshopの画像生成AIがすごい ついに商用利用もスタートへ (1/3)
                              • ChatGPTに渡す文章の適切な区切り線について検証した記事|Clirea

                                はじめに大規模言語モデルであるChatGPTに文章を渡す際、適切な区切り線の使用は、情報の正確な伝達や解釈に大いに役立ちます。 この記事では、区切り線に適切なものを検証します。 区切り線とは?使い方区切り線は文章を区切る時に使用する文字列のことです。 例えば下記のようなものです。 また、使い方をまとめた記事もあるので参考にしてください。 def test() a = "a" b = "b" c = a + b print(c) ================================ ←これが区切り線 上記のコードについて教えてください 結論先に結論を言うと、4個~16個連続した「-」か「=」 もしくは8の倍数の「-」か「=」が区切り線としてはベストでした。 ---- ---------------- -------------------------------- ==== ==

                                  ChatGPTに渡す文章の適切な区切り線について検証した記事|Clirea
                                • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第七回:自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久) | テクノエッジ TechnoEdge

                                  半年ほど前までであればGoogle Colabと言うクラウドGPU環境が使え、無料でサクッと動かせたのだが、それが災いし、多くの人が生成AI画像目的で利用したため、リソースが足らなくなり、後述するAUTOMATIC1111は無料枠で使用禁止になってしまった。 AUTOMATIC1111をインストールして使ってみる画像生成AIは各社が提供しており、扱うためのサービスやアプリもいろいろあるが、デファクトスタンダードはStable Diffusionを利用するためのフロントエンドにあたる AUTOMATIC1111だろう。現在は、次世代Stable Diffusion (SDXL)に対応したv1.6.0が公開されている。 ここではOSがWindows 11で、先に提示したNVIDIAのGPUが装着済の前提で解説する。少し前まではPythonやGitを入れたり、いろいろ面倒だったが、現在はbatフ

                                    生成AIグラビアをグラビアカメラマンが作るとどうなる?第七回:自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久) | テクノエッジ TechnoEdge
                                  • 爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに (1/5)

                                    このところ画像生成AI界隈で話題になっているのが、「Latent Consistency Models(レイテント・コンシステンシー・モデル」(以下「LCM」)。10月6日に中国精華大学のシミアン・ルオさんが中心となって発表された論文で、日本語にすると「拡散的一貫性モデル」。新しいタイプの効率性の高い生成モデルを使い、Stable Diffusion=安定拡散モデルより高速に画像を生成。結果としてビデオメモリーの少ないローレベルのPCでも画像生成AIを動かせるようにしようというものです。 0.5秒で4枚出力。Stable Diffusionの5倍 Stable Diffusionの拡散モデルは、ランダムなノイズ情報から、学習済みの特徴点データを利用することで、段々と画像を生み出していくサンプリングプロセスを繰り返します。それによって画像を生成する仕組みです。通常、1枚の画像を生み出すのに必

                                      爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに (1/5)
                                    • 機械学習による株価予測 - Qiita

                                      こんにちは。私がAidemyでデータ分析講座コースを受講いたしました。今回は学んだスキルを活用して、上場企業を株価予測をしてみました。 ※私の環境: Python3 Chrome Google Colaboratory Windows 10 目次 1.目的 2. データセット 3. 機械学習モデル 4. 予測モデルの構築と検証 5. 結果 6. 反省 1.目的 上場会社の株価データセットを用いて、株価予測するLSTMの機械学習モデルを構築すること。 2.データセット Yahoo Financeである上場企業Lasertec(6920.T)の時列データ 3.機械学習モデル LSTM(Long Short-Term Memory: ニューラルネットワークの一種で、長期的な依存関係を学習することができる特徴ある。 4.予測モデルの構築と検証 4-1. ライブラリのインポート import ker

                                        機械学習による株価予測 - Qiita
                                      • 構想半日、実装一日、全社活用される ChatGPTのSlackbotを作りました! - MonotaRO Tech Blog

                                        はじめに こんにちは、新卒2年目の佐藤です。 MonotaROでは先日、ChatGPTを簡単に利用できるSlackbot「MonoChat (β)」を全社員を対象にリリースし、大勢の方に利用されるようになりました。 私は、ChatGPTが社内全体で活用されることで一人一人の身の回りの業務がもっと楽になったり、生産性を上げられる良い機会に必ずなると思いMonoChat (β) を開発しました。 本記事では社内の大勢の方に利用してもらうために考えたこと、設計/開発/運用してみて得た結果や知見、またMonotaROでのChatGPT利用についても紹介します。 特に、開発部分だけでなく設計部分や結果も紹介しているのでChatGPTを社内に普及させたい方にとって何か気づきになれば幸いです! はじめに MonotaROでは全社員がChatGPTを利用可能です 社内でのChatGPT利用 MonoCha

                                          構想半日、実装一日、全社活用される ChatGPTのSlackbotを作りました! - MonotaRO Tech Blog
                                        • 【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境

                                          はじめに WSL2(Windows Subsystem for Linux 2)は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。 この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。 構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。 今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU:NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化 デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。 「コントロール

                                            【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境
                                          • LLM時代のX情報収集術|べいえりあ

                                            AI for Everyoneについては日本語版もあるのと、どちらのコースも日本語字幕付きで見られる(多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない)ので、英語分からなくてある程度何とかなるんじゃないかと思います。 あと、余力のある人、最新のNLP研究を理解したい人はこちらの本を読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話(task-oriented dialogue)」と「雑談(chit-chat dialogue)」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ

                                              LLM時代のX情報収集術|べいえりあ
                                            • Microsoft発のオープンソース版「UFO」登場! Windowsを自動操縦するAIエージェントを試す【イニシャルB】

                                                Microsoft発のオープンソース版「UFO」登場! Windowsを自動操縦するAIエージェントを試す【イニシャルB】
                                              • もし「GitHub Copilot」を現役弁護士が使ったら? - MNTSQ Techブログ

                                                こんにちは。GitHub Copilotを先日初めて触って、感銘を受けたMNTSQ代表の板谷です。MNTSQの代表をしておりますが、現役の弁護士でもあります。 なぜ私が、GitHub Copilotに感銘を受けたかというと、「プログラミングの LLM による進化」は、契約という言語をコーディングするためにもドンピシャで使えそうだと感じたからです。 例えば、GitHub Copilot では、自分の過去のコードを参照して、最適なコードをサジェストしてくれます。 これは、契約に関わるすべてのビジネスパーソンが求めていたものです!契約の 99.9%が過去のコードの使い回しであるにもかかわらず、毎回ゼロからコーディングするのが本当に苦痛だからです。ちなみに、前回契約と理由なく diff があると取引先に怒られます。笑 しかし、GitHub Copilot 的なものがプログラミング言語だけでなく契約

                                                  もし「GitHub Copilot」を現役弁護士が使ったら? - MNTSQ Techブログ
                                                • データセットの本質的な性質を踏まえないデータ分析には、大抵何の意味もない - 渋谷駅前で働くデータサイエンティストのブログ

                                                  前回のブログ記事は、論文紹介という地味なテーマだったにしてはだいぶ話題を呼んだ*1ようで、個人的にはちょっと意外な感があったのでした。確かに、今をときめくTransformerにも苦手なものがあるという指摘は、NN一強の現代にあってはセンセーショナルなものと受け止められても不思議はなかったかと思います。 しかし、それは同時に「データセットが持つ本質的な性質」と「データ分析手法の性質」とのミスマッチと、それが引き起こす問題とについてこれまであまり関心を持ってこなかった人が多いということなのかもしれません。そして、そのミスマッチは冗談でなく古来からある程度定まった類型があり、データ分析業界の古参なら「そんなの常識だよ」というものばかりだったりします。 ところが、最近僕の周囲でもそういうミスマッチが深刻な実問題を招いているケースが散見され、思ったよりもそれは常識ではないのかな?と思わされることが

                                                    データセットの本質的な性質を踏まえないデータ分析には、大抵何の意味もない - 渋谷駅前で働くデータサイエンティストのブログ
                                                  • GitHub Copilotは開発者の生産性をどれだけ上げるのか?ZOZOでの全社導入とその効果 / How Much Does GitHub Copilot Improve Developer Productivity? The Company-wide Implementation and Its Effects at ZOZO

                                                    2024/2/16 Developers Summit 2024 登壇資料 https://event.shoeisha.jp/devsumi/20240215 ■ ZOZOエンジニア向け会社説明資料 https://speakerdeck.com/zozodevelopers/company-deck ■ GitHub Universe 2023 https://githubuniverse.com/ ■ Universe 2023: CopilotがGitHubをAIを駆使した開発者プラットフォームへと変貌させる https://github.blog/jp/2023-11-09-universe-2023-copilot-transforms-github-into-the-ai-powered-developer-platform/ ■ GitHub Universe 2023 o

                                                      GitHub Copilotは開発者の生産性をどれだけ上げるのか?ZOZOでの全社導入とその効果 / How Much Does GitHub Copilot Improve Developer Productivity? The Company-wide Implementation and Its Effects at ZOZO
                                                    • AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox) | テクノエッジ TechnoEdge

                                                      このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。 バージョン3.5のEarly Access版(有料プランユーザーのみに提供)を利用すると、これまでの2分間制限が最長4分まで拡大。延長時間も従来の1分を2分に伸ばしています。これだけの長さがあれば大抵のポピュラー曲はエンディングまでいけます。 4分の曲をUdioで生成しようとすると、8回の命令が必要になります。さらに、生成に要する時間はUdioの方がはるかに長くかかるので、全体としての作業時間には大きな差が生じます。それがSuno 3.5ならば数秒でできてしまうのです。 また、Style of Musicのキーワードがサジェストされるようになっていて便利です。文字数制限は相変わらずきついですけど。 さらにうれしいのは、日本語歌詞の読み方が、従来は間違いが多かったのが、ほぼ問題な

                                                        AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox) | テクノエッジ TechnoEdge
                                                      • GPT-4V: 驚きを隠せない進化!凄すぎて"ズキズキワクワク"が止まりません!!! - Qiita

                                                        この記事で行なっていること 凄すぎて”ズキズキワクワク"が止まりません はじめに ついこの間、ChatGPTは2022年1月までの情報を学習した、というい発表がありましたが、さらに今回のアップデートで 画像解析機能(GPT-4V) が追加され、アップロードした画像を使った新たなタスクの実行が可能になってます。そして、それが凄すぎます 衝撃的な投稿 まずはこちらの衝撃的な投稿をご覧ください。 動画は自転車の画像と共に「サドルを下げる手助けをしてください」で始まります。 ChatGPTからレコメンドが返ってきますが、それに対して、質問者は追加で ポイントになりそうな部分を拡大してアップロード マニュアルと自分の持っているツールの写真もアップロード します。 その結果、その質問者は、サドルを下げることに成功!そんな内容です。 自分の環境で、画像解析機能(GPT-4V)を使えるのか? さて、画像解

                                                          GPT-4V: 驚きを隠せない進化!凄すぎて"ズキズキワクワク"が止まりません!!! - Qiita
                                                        • How to use GitHub Copilot: Prompts, tips, and use cases

                                                          EngineeringProductHow to use GitHub Copilot: Prompts, tips, and use casesIn this prompt guide for GitHub Copilot, two GitHub developer advocates, Rizel and Michelle, will share examples and best practices for communicating your desired results to the AI pair programmer. Leia este artigo em português As ferramentas de programação de IA generativa estão transformando a maneira como as pessoas desenv

                                                            How to use GitHub Copilot: Prompts, tips, and use cases
                                                          • ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?

                                                            Stable DiffusionやChatGPTなどのジェネレーティブAIが登場したことによって、誰でも簡単に文章や画像を作成できるようになりました。IT系ニュースサイト・Digital Scienceのダニエル・フックCEOが、画像生成AIを使用した時に遭遇した「1本のバナナ問題」から、ジェネレーティブAIが抱える問題に言及しています。 The Lone Banana Problem. Or, the new programming: “speaking” AI - TL;DR - Digital Science https://www.digital-science.com/tldr/article/the-lone-banana-problem-or-the-new-programming-speaking-ai/ バナナが好物だというフック氏は、以前から友人と「バナナのブランディン

                                                              ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?
                                                            • 自分がどれくらいニューラルネットワークを理解しているかを確かめられるゲーム「Graph Game」

                                                              「Graph Game」はニューラルネットワークの構造をグラフで作成するゲームです。AI技術の発展と共に頻繁に目にするようになった「ニューラルネットワーク」をどの程度理解しているか試せるゲームとのことなので、実際にプレイしてみました。 Graph Game - By Sabrina Ramonov https://graphgame.sabrina.dev/ サイトにアクセスするとこんな感じ。「RNN」「LSTM Cell」「GRU Cell」「ResNet Block」「Deep RNN」という5つのステージが用意されています。まずは「RNN」をクリックしてみます。 「x_t」「h_t」「y_t」という3つの箱が出現しました。それぞれの箱はデータを表しており、上が出力で下が入力となっています。「x_t」の上の○をクリックし、ドラッグして「h_t」の下に接続します。 緑の線で接続が表示され

                                                                自分がどれくらいニューラルネットワークを理解しているかを確かめられるゲーム「Graph Game」
                                                              • 生成AIによるプロダクトと生産性向上の舞台裏@2024.04.16

                                                                2024.04.16「先達エンジニアに学ぶ 思考の現在地 Online Conference」での登壇スライドです event link: https://findy.connpass.com/event/313119/ 生成AIを使ってプロダクト作りをしていたり、社内の生産性向上をチャレンジしてる方に少しでも参考になれば幸いです。

                                                                  生成AIによるプロダクトと生産性向上の舞台裏@2024.04.16
                                                                • 「自分でLLMを動かすことでイメージがつきやすくなる」 ローカルで使うメリットと、日本語特化LLMを動かすために必要なスペック

                                                                  システムから言語モデルがどのように使えるか、その時どういうことに気をつける必要があるかを考える「『ChatGPTなどの言語モデルはどのようにシステムで使えるか』きしだなおき氏」。ここで、LINE Fukuoka株式会社のきしだなおき氏が登壇。続いて、システムがChatGPTをどのように使うかと、日本語特化のLLMについて話します。 システムはChatGPTをどのように使うか きしだなおき氏:今、人間がどう使うかという話を中心に話しました。(次に)じゃあシステムからどう使うかとなると、APIを使った利用になりますね。 今日(2023年6月14日時点)朝起きたら「関数定義が可能になったよ」みたいなものが出ていて。今回の(セッションで話した)概要(の内容)とか…。(この概要は)昨日になってやっと(運営に)送ることができたんですけど、「どういう話をしようか」と思って朝起きたら、毎日状況が変わってい

                                                                    「自分でLLMを動かすことでイメージがつきやすくなる」 ローカルで使うメリットと、日本語特化LLMを動かすために必要なスペック
                                                                  • ワークフローオーケストレーション入門

                                                                    「Data Engineering Study #23 Data orchestration 特集」の発表資料です イベントページ: https://forkwell.connpass.com/event/310011/

                                                                      ワークフローオーケストレーション入門
                                                                    • 開発生産性が上がるって分かったので GitHub Copilot Business を積極活用しています - Money Forward Developers Blog

                                                                      エンジニアリング戦略室の高井といいます。 みなさん、GitHub Copilot は利用されていますか? GitHub Copilot は GitHub と OpenAI が共同で開発した生成 AI を活用した開発支援ツールです。コードの自動補完、コード生成、ドキュメントの提案など、多岐にわたる機能を提供し、開発者の生産性を向上させることを目的としています。 マネーフォワードでは、昨年度にトライアルとして Copilot の利用を開始しました。本記事では、Copilot を利用して半年以上経過して、その利用がどのような効果をもたらしたかをレポートします。なお、ここで GitHub Copilot として言及されている Copilot のプランは GitHub Copilot Business です。 Copilot 利用状況・分析対象 なお、分析にはエンジニアリング組織のパフォーマンスを可

                                                                        開発生産性が上がるって分かったので GitHub Copilot Business を積極活用しています - Money Forward Developers Blog
                                                                      • AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】

                                                                        TOPコラム海外最新IT事情AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 2024年1月23日 米Metaと米ニューヨーク大学に所属する研究者らが発表した論文「Self-Rewarding Language Models」は、大規模言語モデル(LLM)が自分自身に報酬を与えることで繰り返し学習する「自己報酬型言語モデル」を提案した研究報告である。このモデルは、自身が生成した問題に対する応答に報酬を割り当て、その結果をトレーニングデータとして使用。自己を反復して訓練することで、精度を向上させられる。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容

                                                                          AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】
                                                                        • YouTubeで言葉のカベが消えそう。アドビの「多言語化」技術には夢がある

                                                                          YouTubeで言葉のカベが消えそう。アドビの「多言語化」技術には夢がある2023.10.13 12:0012,096 山本勇磨 現在LAで開かれているAdobe(アドビ)のカンファレンス「Adobe MAX」を取材中なのですが、現地でとても面白い技術が発表されました。 その技術の名は「Project Dub Dub Dub」。dubは「吹き替える」という意味なのですが、AIを使って動画クリップを本人の声で、多言語に吹き替える技術なんです。 現地で行なわれたデモでは、Adobe MAXの会場にいる数千人がその凄さに歓喜。ぜひデモのようすをご覧ください。 これは半端ない…全YouTuberが海外対応できてしまう🤯 日本語の動画クリップから多言語化する「Project Dub Dub Dub」#AdobeMAX#MAXSneakspic.twitter.com/Rd6HisOHS3 — ギズ

                                                                            YouTubeで言葉のカベが消えそう。アドビの「多言語化」技術には夢がある
                                                                          • 3D生成AIサービスの現在地|nakashun

                                                                            GenerativeAIをゲーム開発に活用する方法Tipsのマガジンゲーム開発AI Lab. Witchpotに含まれる記事です ゲームづくりを前提に書かれています このnoteでは観測範囲で試すことのできるサービスを実際に使用した結果などを比較していきます 追記1「見た目以外のモデル詳細も知りたい」とのコメントを頂いたので、詳細をこちら↓にまとめました!興味がありましたら合わせてご覧ください! 追記2日本時間8/22にCSMが有料サブスクリプションプランが追加されました CSMでは使用可能な学習モデルが選択可能でこの記事でCSMの項目で紹介している3Dモデルは現在の有料プランに相当する学習モデルを使用して生成されています 要約純粋な3D生成ではCSMが最もクオリティが高そう ただしメッシュはぼこぼこになることが多く後処理が必用 「Swordのみ」など生成可能なオブジェクトタイプを限定した

                                                                              3D生成AIサービスの現在地|nakashun
                                                                            • 人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発

                                                                              このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Metaや米HuggingFaceなどに所属する研究者らが発表した論文「GAIA: a benchmark for General AI Assistants」は、難しいタスクではなく、人間にとって簡単なタスクを達成する大規模言語モデル(LLM)を評価するためのベンチマークを提案している。この研究は、人間が日常で当たり前に実行してほしいタスクを正確にこなすLLM構築を目指すためのテスト集である。 現在のベンチマークは、人間にとってより困難なタスクを求めており、LLMには数学や法律などの複雑なタスクや、一貫性のある本を書くなどの複雑な課題が

                                                                                人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発
                                                                              • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第九回:Fooocus-MREでimage-2-imageやControlNetを試す (西川和久) | テクノエッジ TechnoEdge

                                                                                今回はそれだけでは面白く無いので、元画像を絵柄そのまま高精細なフルHDにアップスケールしたい、もしくはそのまま使って絵を変えたい、構図やポーズをある程度固定したい、Photoshopのジェネレーティブ塗りつぶし的な機能は?…と言った、もう少しStable Diffusionっぽい使い方を順に説明する。 image-2-image / UpscalePromptから画像を得る方法を一般的にText-2-Imageと呼んでいる(txt2imgやt2iとも)。文字通りテキストから画像を…と言う意味だ。 Stable Diffusionでは、加えて画像から画像を得る方法があり、これをImage-2-Imageと呼んでいる(img2imgやi2iとも)。言葉よりも画像の方がより多くの情報を持っているので、それを使おうと言う意図だ。 これまで生成した画像の解像度は、832✕1,216や1,024✕1,

                                                                                  生成AIグラビアをグラビアカメラマンが作るとどうなる?第九回:Fooocus-MREでimage-2-imageやControlNetを試す (西川和久) | テクノエッジ TechnoEdge
                                                                                • 【必見】画像生成AI「Stable Diffusion」驚きの機能を一挙紹介!こんなことまでできる「NVIDIA 生成AI Day 2023 Summer」講演レポート - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                                                                  「NVIDIA 生成 AI Day 2023 Summer」で、Stability AI Japan株式会社のJerry Chi氏が登壇し、「Stable Diffusionの活用法と事例」の講演を行った。主に画像生成AI「Stable Diffusion」の機能紹介やビジネス活用の解説や動画デモだったが、その内容は「画像生成AIはこんなことまでできるようになったのか」と、全編が驚きの連続だった。 「Stable Diffusion」は画像生成AIブームを巻き起こすきっかけになったアプリケーション(ソリューション)で、最大の特徴は、絵やイラストを描いたり描画すること。写真のようなフォトリアリスティックやアニメ風に生成することもできる。 Stability AI Japan株式会社は日本支社として、研究開発やコミュニティ活動、ビジネス活動に注力している。ただし、海外のモデルを日本でそのまま使

                                                                                    【必見】画像生成AI「Stable Diffusion」驚きの機能を一挙紹介!こんなことまでできる「NVIDIA 生成AI Day 2023 Summer」講演レポート - ロボスタ ロボスタ - ロボット情報WEBマガジン