2023.09.28 ChatGPT(チャットGPT)を用いて画像入力・画像認識・画像読み込みを行う方法!
ローカルでLLMを動かそうとなったら transformers ライブラリ、llama.cpp、text generation webuiなどいくつかの選択肢があると思いますが、どれもめちゃくちゃハードルが高いというほどではないですが、動かすまでの手続が若干いかつい印象があります。 そんな中で Ollama というツールを試してみたところインターフェイスがシンプル、ついでにキャラクターのラマが可愛いのでご紹介していこうと思います。 ちなみにですが、日本語での言及はあまり見かけなかったですが、LangChain が出してるレポートでは OSS モデルを動かすのに使われているものとしては3番目に多く使われており、 出典: LangChain State of AI 2023 GitHub のスター数も現在約33700とかなり人気を集めていそうです。 Ollama で CLI から推論 では早速
こちらの記事では、Stable DiffusionでおなじみのStablity AIが送るLLM「Stable LM」について、概要や導入方法、実際に触ってみた感想をまとめています。 弊社のエンジニアによると、Stable LMはChatGPT等より規制が少ないとのこと。例えば、 エロ系の質問 悪用の可能性がある情報(例:ハッキング、爆弾の作り方、等) その他、アングラ系やグレーな質問 にも、答えてくれる可能性が高いそうです! ChatGPTやGemini等のLLMを使っていると、Google検索で知れるような少しグレーな内容でも「その質問には答えられません」ってなりますよね? どうやら、StableLMではそういったことが少ないらしいんです。 ということで当記事では、「エロい質問がいけるかもしれないLLM版Stable Diffusion」についてさまざまな検証を行います。噂の真相を確か
昨日DreamGaussianという3Dモデルを生成するモデルを試してみました。 こちらは先週、中国の北京大学が公開した、画像やテキストから3Dモデルを生成するモデルです。特徴は処理時間が速いです。 初めての3Dモデル作りなので、チューニング方法はよくわからなくて、論文+コードを参照してやりました。 まずはデフォルト設定で車のモデルを作ってみました、使用した画像は以下の写真です。 できた3Dモデルは、以下の通りです。 なんとなく車のようなモデルはできますね。処理時間は2-3分程度でした。(GPUはA100) 初めての試しなので、速いかどうかあまりわからないですが、DreamGaussianの開発者によると、他のモデルでは少なくても10分はかかるそうです。 もう少しチューニングしたいと思って、イテレーション回数とサイズを大きくしました。デフォルトの状態だと500回みたいなので1000回に上げ
はじめに Youri 7BをChatGPT互換API(openai chat completions api互換)サーバとして動かした時のメモ。 今回の記事は、以下の前回の記事の補足的扱い(細かな解説はこの記事では省略) 以下をChatVRMでYouri 7Bで動かせる状態がこの記事の目標。 youri-7b-chatをfastchatでChatGPT互換APIでホストしてChatVRMでサクッと遊ぼう。prompt engineeringが効くのでsystem prompt設定画面で語尾やキャラクター設定できます。fastchatでホストする方法は前回投稿記事どうぞ(宣伝?) #ずんだもん #rinna pic.twitter.com/yFxhmg15Rz — inada (@dev_inada) October 31, 2023 Youri 7Bとは rinnaはLlama 2の日本語
2024年3月13日追記 ・OpneAIのAPI課金システム変更に伴うエラーについて解説。 10月26日追記 ・メールが届かなくなった際に権限の再承認が必要な件。 5月11日追記 ・検索にかかった論文に抄録がない場合、AIが要約を創造(捏造)する件。 4月21日追記 ・作り方のサイトではなく公開されたLINE Botのリンクに切り替え。 ・エラ−429が出た場合4のスライドを追加。 4月10日追記 ・送信トリガーの変更方法のスライドを追加。 ・複数キーワードや雑誌を指定して検索する方法のスライドを追加。 デモコードは、 const PUBMED_QUERY = '(aaa) AND (bbb) AND (("ccc"[Journal]) OR ("ddd"[Journal]))' ・エラー原因をChatGPTに聞くコツについても追記。 4月6日追記 ・エラー429が出た場合の対処法スライド
ゲームやTRPGの立ち絵など、背景を透過した状態でキャラクターイラストを使いたいシーンはかなり多いかと思います。また、img2imgの「Inpaintアップロード」でもお役立ち。 外部での背景透過の手段はいくつかありますが、UI拡張機能として登場! AUTOMATIC1111/stable-diffusion-webui-rembg 「rembg」インストール方法 拡張機能リスト>読込>「rembg」を見つけて、右端にある「install」ボタンを押す。 ※下記画面はインストール後のもの 「rembg」の使い方 使う場所は「その他(Extras)」タブです。使い方はとてもシンプル。 まずは背景除去したいイラストを用意 くらつひわ モデルは自分で線画を描いてAI着彩したカメラおじさん! 背景はAIが素晴らしく仕上げてくれました うちのブログで可愛い美少女が登場する率は低いのですまない 使用モ
2023年1月現在Stable Diffusionで美少女イラスト生成に使えるモデルを紹介します。 基本的に学習モデルの収集はここから行っています。 Models - Hugging FaceWe’re on a journey to advance and democratize artificial intelligence through open source and open science.huggingface.co hugging face AI版Github。5gbくらいある学習モデルも数分でダウンロードできるサーバーに、一部モデルのDEMOサイト用のGPUを提供している。これがなぜ無料で使えるのかわからないが、噂によるとAI業界のGithubという触れ込みで各企業からお金を集めているらしい。 ソート欄からLikeが多い順に並べ替えてください。 ここで紹介しているものはS
こんにちは!金融ソリューション事業部の山下です。 本記事では、画像生成AIのStableDiffusionとデプスマップ推定AIのBoostingMonocularDepthを用いて、上記のように板を押し出し加工したような(擬似)3Dモデル生成方法を紹介します。 3DのモデリングおよびレンダリングはHoudiniを使用します。 実施環境/ツール 実施手順 1. Stable Diffusion web UIのインストール 2. tex2imgで画像生成 3. BoostingMonocularDepthでデプスマップ生成 4. 生成画像をデプスマップを用いて3D化 完成イメージ 所感 参考 実施環境/ツール OS:Windows 11 pro GPU:NVIDIA GeForce RTX 3070Ti Laptop DCC:Houdini Indie version 19.5.493 St
何この記事 タイトルの通り、inpaintingタスクを利用して既存のイラストの服装を別のものに入れ替える、という操作を試してみたので、その流れを記しておこうというものです。 inpaintingって何よ ある画像の指定した範囲を別のイメージに置き換える技術です。 上記の例にあるように、例えば椅子の上にいるワンちゃんを消したり[1]、何もない平原に木を追加描画するなど、自由な編集が可能となります。 主な対象読者 Stable Diffusionに触り始めたばかりで、inpaintingの使い方がイマイチ分からないので、どんな感じで使えるのかざっくり知りたい方 可愛い女の子のイラストを眺めたい方 暇つぶしに何か読みてーな、という方 具体的な使い方に関しては、もっと丁寧にまとまっている記事が沢山あるので、ぜひそちらをご参照ください。この記事では大したこと書いてないです。すまんな。 実行環境 グ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く