ふろむだ @fromdusktildawn 複数の企業を創業。そのうち一社は上場。分裂勘違い君劇場の中の人。 錯覚資産本Amazon1位(心理学)12万部 『最新研究からわかる 学習効率の高め方』Amazon総合1位(無料) bit.ly/3lQcdbJ BOOTH:furomuda.booth.pm 文章力クラブ主催 tinyurl.com/y4fbyoa7 furomuda.com
この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ
kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます.人生を楽しく生きよう(New!) kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41
GPT-4o凄すぎる!! 出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。 先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました! あらためて記事を出してくださったことに感謝いたします! まずは初弾!ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法 を書いていきます! まずは見た目(Power Apps)から! まずはPower Appsでサクっと画面を作ります! PowerPoint感覚で作れることが強みですからね! 最低限のもので構成しています。 画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo
カオナビ子会社で、3月に約15万人分のユーザー情報漏えいを発表したワークスタイルテック(東京都港区)は5月31日、漏えいした情報の中にクレジットカードやデビットカードの情報が含まれることを発表した。調査の結果詳細が分かったとして、当初発表した漏えい件数も変更した。 ワークスタイルテックは当初、労務管理クラウドサービス「WelcomeHR」について、サーバの設定ミスによりユーザーの氏名、性別、住所、電話番号、ユーザーがアップロードした身分証明書(マイナンバーカード、運転免許証、パスポートなど)や履歴書の画像など16万2830人分の情報が2020年1月5日から24年3月22日にかけて外部から一時閲覧可能で、うち15万4650人分の情報が実際に第三者にダウンロードされたと発表していたが、これを修正。 正しくは、顧客がWelcomeHRを通してクラウドストレージにアップロードしていた身分証のPDF
画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ
東洋経済の本【公式】 @toyokeizai_book 【本日発売📚】DSやWii、Switchを世界市場に送り出した、元アメリカ任天堂社長の著書がついに発売! 著者が35年のキャリアで学んだビジネス哲学が1冊に詰まっており、ビジネスパーソン必見です。 『崖っぷちだったアメリカ任天堂を復活させた男』 著者:レジー・フィサメィ amzn.to/4dK9kCh pic.twitter.com/ML9mPvBio7 2024-05-22 08:00:01 KAZTENDO/任天堂ファン @KAZTENDO2 本日発売の「崖っぷちだったアメリカ任天堂を復活させた男」を購入しました。P&Gから様々な会社を経て2003年にアメリカ任天堂に入社、2006年COOに就任、2019年に退社されるまで、氏の人生において、困難に立ち向かって得た教訓と哲学を書いた1冊です。レジー氏自ら執筆されているので、興味深
パナソニックは6月に発売する予定の新型カメラを紹介するサイトで、このカメラで撮影していない別の画像を使っていたことを明らかにしたうえで、誤解を与えたとして謝罪しました。 さらに過去に販売した機種のサイトでも外部の画像を使っていた事例があるとして、調査を進めています。 このカメラは、6月発売予定のフルサイズミラーレス一眼カメラの「LUMIXDC-S9」です。 会社は、この商品のWEBサイトで草むらを走る犬の画像とともに、カメラが持つオートフォーカス機能などを紹介していましたが、実際には外部の画像提供サイトのものを使っていたということです。 パナソニックが画像提供サイトから許諾を得たうえで使用し、ページには「画像・イラストは効果を説明するためのイメージです」という表記も添えられていましたが、文字が小さかったこともあり、会社は「誤解を与える画像だった」として、28日、このカメラで実際に撮影した画
WSTは3月29日、労務管理クラウドサービス「WelcomeHR」について、サーバの設定ミスによりユーザー情報が外部から閲覧可能な状態になっていたと発表。16万2830人分の情報が閲覧可能で、うち15万4650人分の情報が実際に第三者にダウンロードされたという。閲覧可能だった情報の中には、氏名や住所などの個人情報に加え、マイナンバーカードや運転免許証などの画像も含まれていた。 関連記事 「カオナビに漏えいの事実なし」 子会社のサービス「WelcomeHR」から個人情報15万人分漏えいでカオナビ社が説明 子会社のワークスタイルテックが手掛ける労務管理クラウド「WelcomeHR」で、ユーザー情報16万人分近くが外部から閲覧可能になっており、うち15万人分近くが実際に第三者にダウンロードされた件を巡り、親会社のカオナビは、自社のタレントマネジメントサービス「カオナビ」には影響がなかった旨を発表
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第49回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」 1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」 リアルタイムでストリーミング動画を変換するAIモデル「StreamV2V」 写真1枚から人物やキャラクターの話す動画を生成するモデル「V-Express」 人の手で塗った数枚の線画から、残りのアニメーションを自動彩色できるAIモデル アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」アニメーション制
にょほ🐏🪡羊毛卿 @nyofoolest 羊毛フェルトとコマ撮りアニメ ウールロイドという表情を変えられる羊毛人形を作ります🐏現在BOOTHにてアクリルスタンド等を出品中です🐏 青空→bsky.app/profile/kemami… nyofoolest.booth.pm リンク Wikipedia 呼び込み君 呼び込み君(よびこみくん)は、群馬電機が販売するメモリー式の音声POP(音声ポップ、録音再生器)で、同社の登録商標(第4423682号)である。スーパーマーケットの総菜売り場などの個別の販売コーナーで販売促進するための商品案内の自動再生に、それまで使用されてきたカセットテープ式が耐久性に劣るため、これに代わるものとして2000年に開発された。2018年時点で4万台が出荷されている。 事前に録音した商品説明などの音声や専用BGMの再生、およびそれらの同時再生ができ、内蔵された
Intel製CPU搭載を搭載したPCでGPUなしでもStable Diffusionを用いた画像生成を可能にするGIMP用プラグイン「OpenVINO AI Plugins for GIMP」がGitHubに公開されています。特徴的なのは、AIの演算処理に特化したプロセッサ「NPU」に対応しており、NPUを使った画像生成が可能だという点。ちょうどNPUを搭載したXPS 13とXPS 14をDellから借りていたので、導入から実際に使うところまでをまとめてみました。 GitHub - intel/openvino-ai-plugins-gimp: GIMP AI plugins with OpenVINO Backend https://github.com/intel/openvino-ai-plugins-gimp/tree/main ◆目次 1:導入方法 2:使い方 ◆1:導入方法 使
タイトル通り、入力線画を(基本的には)1pixelも変えずに画像生成AIに色塗りをさせる方法について解説していきます。 本題に入る前に そもそも画像生成AIによる色塗り(着彩)について知らない方向けに、既存技術でAIに色塗りをさせるとはどのような事を指すか?またどのような課題があるか?について一度整理します。 画像生成AIによる着彩 テキストから画像を生成できるという事で一躍有名になった画像生成AIですが、テキストだけでは生成したい画像を詳細に指示することが困難であるという課題を抱えていました。 そこで、テキストと比較してより具体的に生成したい画像を指示する方法として。ControlNetを用いた画像とテキストを入力して新たな画像を生成する手法が現れます。 この応用として、色塗りがされていない線画と指示テキストを入力することで、入力した線画に対し色を塗った状態の画像を生成するという方法が存
概要 食事のカロリー推定は非常に困難なタスクでした。 一般的なアプローチとしては、物体検知modelをfine-tuningし、料理画像から個々の料理の領域を判定することでカロリーを推定してきました。 GPT-4oを利用するとそのへんを飛ばして、いきなりカロリーが推定できます。精度の面では劣ると考えられますが、実装の容易さと未知のクラス (学習データセット内に含まれない料理) への対応を考えると、十分に利用価値があると思われます。 今回の記事では、実際のデモも紹介しているのですぐ利用することができます。 早速結果を見てみよう デモ 実装 カロリー推定 json-mode で処理をさせます。step-by-stepに推論を処理させるために、最初に雑な推論を記述させてから、各食品のカロリー量を推定させています。 # GPT-4にカロリーを推定させる (JSON-MODE) response =
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第47回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」 2D画像から3Dコンテンツを生成する「CAT3D」をGoogleが開発 大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査 画像とテキストを使った長文生成が得意なAIモデル「Chameleon」をMetaが開発 Transformerを超える「Mamba」は視覚認識タスクに必要か? 開発した「MambaOut」モデルで検証 GPU上でネイティブ動作する並列
「大手メディアは伝えない日本の黒人侍」という文言とともに侍姿の黒人と家族のような画像が拡散しましたが、誤りです。写真はAIによるもので本物ではありません。 検証対象2024年3月13日、「大手メディアは伝えない日本の黒人侍(原文は英語)」という文言と、日本の城を背景に3人が立っているモノクロの画像が拡散した。3月29日現在、このポストは855万回以上の閲覧回数と6200回以上のリポストを獲得している。 検証過程画像の出所はGoogle画像検索で探すと、ネット上で確認できる最も古い同様の画像は2024年2月26日のFacebookページの投稿だった。「Poetry&Talents(詩と才能)」というページで「詩人、歌手、コメディアン、アーティストがその芸術的才能を披露するためにシェアする場所」という説明があり、投稿には「We’re everywhere!!(私たちはどこにでもいる!!)」と書
ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。 GitHub - lllyasviel/IC-Light: More relighting! https://github.com/lllyasviel/IC-Light IC-Lightは画像の光源の種類や位置を指定しつつ背景を別物に置き換えられるAIツールです。IC-Lightはローカルにインストールして使用可能。さらに、インストール不要で使えるデモサイトも用意されていたので、実際にデモサイトでIC-Lightを使って画像を加工してみました。 IC-Lightのデモサイトには、以下のリンクをクリックするとアクセスできます。 IC Light - a Hugging Face Space by lllyasviel h
ANYCOLORは6月3日、同社に所属する人気VTuber「甲斐田晴」(かいだ・はる)などに対して、ライブ配信を妨害したり、“タグ荒らし”を行うなどした個人を特定し、民事・刑事で責任を追及していると発表した。 この個人は、甲斐田晴を中心とした同社VTuberのYouTubeライブ中に短時間で執拗にコメントを連投したり、X上でVTuberに関連するハッシュタグを付け、VTuberの画像・動画を無断で添付した上で、グロテスクな画像などを多数連投する“タグ荒らし”を行ったり、同社主催のライブイベントに参加したVTuberに殺害予告をしたりしていたという。 同社はこれらを投稿したアカウントの発信者情報開示請求訴訟を提起。開示された情報で、投稿者が同一人物だと分かったため、この人物に対して損害賠償請求訴訟を提起した他、業務妨害罪で管轄警察署に被害届を提出し、受理されたという。 同社はこれ以外にも、所
猫ひさし @nekohisashi919 ちょっと言葉足らずで誤解を招いてしまい申し訳ないです。 この混じりっけの多いちりめんが1枚目の名前を伏せてあるスーパーに置いてあり、何度も足を運んで買っていました。 他のスーパーにも同じレベルのちりめんが有れば良かったのですが、店頭で探した方はわかると思いますが 2024-05-15 07:11:05 猫ひさし @nekohisashi919 このレベルの混じりっけのあるちりめんはなかなか置いてありません。 実際、今でもゾエアやメガロパやタコやイカはシラスなどでは見つかります。 前のポストに書いた通り、このスーパーにちりめんだけは置かれなくなりシラス・メザシなどだけが置いてある状況だったのでこのポストをしました。 2024-05-15 07:15:03
山口県警防府警察署はSNS上で面識のある女性の名誉を傷つける文章や画像を投稿したとして山口市の女(34)を逮捕したと発表しました。 【写真を見る】SNSに面識のある女性(20代)の名誉を傷つける内容・画像を投稿か 30代の女を逮捕 名誉毀損の疑いで逮捕されたのは山口市の配送業の女(34)です。 警察によりますと女は5月11日、スマートフォンを使って、面識のある20代の女性を特定したうえで名誉を傷つける文章や画像をSNSに投稿した疑いが持たれています。 女は、このほかにも複数回にわたり同じ女性をひぼう中傷する文章などを投稿していたということです。 警察では、「投稿内容が悪質で逮捕の必要性があったため逮捕した」としています。 調べに対し女は、「私がやったことに間違いありません」と容疑を認めているということです。
自然言語でWebサイトを作れる「Create」 KEITO(以下、KEITO):はい。次は、今ものすごく話題になってる「Create」です。 池田朋弘氏(以下、池田):知らないです。 KEITO:ご存じないですか。この1週間でめちゃくちゃ話題のサービスになっていて、自然言語でWebサイトを作れるものなんですけど。ChatGPTでもコードを吐き出したりできるので、Webの形を作るのはなんとなくできそうだとは思うんですけど。Createだと、その作ったWebサイトに機能を入れることができるんですよね。 具体的に言うと、この右側が、僕が作ったやつです。「KEITOチャットAI」と言って、「こんにちは」と送れば、裏側でChatGPTが動作してしっかりと返してくれる。このチャットボットを、本当に30分ぐらいで作りましたね。しかも僕、プログラミングなんて一切できないので。本当に自然言語だけで「チャット
前回は画像生成AIサービス「Midjourney」のアカウント取得から画像生成までの一連の流れを解説した。 大元の仕組みは共通するものの、これまで説明してきた「Stable Diffusion」との違いに戸惑った人もいるのではないか。 とはいえ、どんなパソコンでも(頑張ればスマートフォンでも)画像が生成できるのはやはり魅力。今回はMidjourneyの表現を豊かにする「パラメーター」について説明していく。 パラメーターとは Midjourneyは「Discord」上で「/imagine」コマンドに続き、プロンプト(prompt)欄にテキストプロンプト(Text Prompt)を入力することで画像を生成する。
たなかふじもと🐈⬛にゃんフィクション @tanaka_fujimoto にゃんこクリエイター。小学館『ザ・にゃんフィクション』→ urasunday.com/title/2403 『図鑑NYAO ネコみっけ!』→ shogakukan.co.jp/books/09389129 連絡先→tanaka.fujimoto.nyan@gmail.com nekonavi.jp/archives/autho… リンク ねこナビ 猫の多頭飼いに訪れる年数回のボーナスチャンス|ねこナビ 猫は同じような思考回路をしているので、動きや体勢がシンクロしやすい生き物かと思います。2匹のシンクロだとそんなにレアじゃありません。 しかし3匹以上になると途端に難易度が上がります。 しかも座ってるとか立ってるとかの基本
キャラ画像を無断加工か 投稿の25歳女を書類送検―京都府警 時事通信 社会部2024年06月03日17時35分配信 京都府警本部=京都市上京区 スマートフォンのゲームのキャラクター画像を無断で加工し、X(旧ツイッター)に投稿したとして、京都府警下京署は3日、著作権法違反容疑で、会社員の女(25)=東京都葛飾区=を書類送検した。「キャラクターの扱いに不満があった」と容疑を認めているという。 ドラマ化条件の認識にずれ 「セクシー田中さん」で報告書―日テレ 加工されていたのは、アイドル育成ゲーム「あんさんぶるスターズ!!」。ゲーム開発会社によると、ダウンロード数は1700万件を超え、女性を中心に人気を集めている。 送検容疑は昨年1月2日ごろ、同ゲームのキャラクターの映像から切り出した画像を加工し、3回にわたりXに投稿。ゲーム開発会社の著作権を侵害した疑い。 同署によると、同年6月、ゲーム開発会社
こんにちは、機械学習チーム YAMALEX の駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 皆さんは、「前のプレゼン資料に使った、犬の画像はどこいったかな?あの画像が欲しいので、探してくれないかな?」と無茶振りされたことはありませんか? そんな時でも、「舌を出して喜んでいる」と検索すれば画像がヒットし、こんな無茶振りにも応えることができるシステムを Amazon Kendra (以下、 Kendra )で構築しました。 舌を出して喜んでいる犬 ちょっと待って Kendra は機械学習を利用した検索サービスで、ウェブサイトや S3 に保存したドキュメントなどをもとに、適切な検索結果を返します。 しかし、 Kendra で検索できるのはテキストだけで、画像を S
2023年11月にMicrosoftは、Windows 11の標準お絵描きアプリ「ペイント」に画像生成機能「Cocreator」を追加するアップデートを実施しました。さらにMicrosoftは2024年5月20日に、NPU搭載のPC「Copilot+ PC」向けに、Cocreatorでイラストを描きながらリアルタイムで画像を生成する機能を発表しました。 Introducing Copilot+ PCs - The Official Microsoft Blog https://blogs.microsoft.com/blog/2024/05/20/introducing-copilot-pcs/ Microsoft Paint's New AI Image Generator Builds On Your Brushstrokes | PetaPixel https://petapixel
EUでは、児童性的虐待防止を目的に通話やメール、メッセージなどのスキャンを企業に義務付ける「Chat Control(チャット規制法)」の議論が進んでいますが、この法律は専門家や有識者、活動家などからプライバシーを損ない児童福祉にも逆効果であるとして批判されています。法案反対派の牙城とされてきたフランス当局が、スキャンに同意しなければメッセージが送れなくなる「アップロード・モデレーション」を含む妥協案を採用する方針をまとめたことを受けて、プライバシーに特化したメッセージアプリのSignalが、法律が成立した場合はEU市場から撤退すると表明しました。 Interne Dokumente: Frankreich entscheidet über Zukunft der Chatkontrolle https://netzpolitik.org/2024/interne-dokumente-fr
OpenAIは5月30日、同社のチャット型AI「ChatGPT」の無料版ユーザーに向けて、これまで有料版サブスクライバーしか利用できなかったGPTs、ウェブブラウジング、データアナリシスといった機能を公開した。 これまで使えなかった機能を大盤振る舞い All ChatGPT Free users can now use browse, vision, data analysis, file uploads, and GPTs. https://t.co/NTXSalAV6q — OpenAI (@OpenAI) May 29, 2024 公開が始まった5月13日からGPT-4o自体は無料版ユーザーにも利用は可能(制限あり)だったが、今回の更新でそれ以外の多くの有料版専用機能が利用できるようになった形だ。 これまで無料版のChatGPTは外部インターネットにアクセスできなかったので、トレーニ
「Jam」はボタン一発でスクリーンショットや動画の撮影を行い、OSやブラウザのバージョンなどのメタデータと一緒にまとめて共有できる状態にしてくれるChrome・Edge・Arc・Brave・Operaなど各ブラウザ向けの拡張機能です。ユーザーからのバグ報告を受けるのに便利そうだったので実際に使い勝手を試してみました。 Jam | Build a bug-free product. https://jam.dev/ Jamの公式サイトにアクセスし、「Get Jam for Free」をクリック。 「Chromeに追加」をクリックします。 「拡張機能を追加」をクリック。 アカウントの作成を求められます。今回はGoogleアカウントを使用するので「Continue With Google」をクリック。 ログインに使用するアカウントをクリックします。 「次へ」をクリック。 Jamを開きやすいよう、
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く