本記事では Stable Diffusion の img2img で strength を変更したらどれだけ画風が変わるのか、また元絵の意匠を汲み取って残してくれるのかについて調査した。 元絵について 人物がひとりの場合 人物がふたりの場合 まとめ (2022/09/03追記) 複雑な元絵の場合 人力での修正もきちんと描けていないと引きづられてしまう (2022/09/04追記) strength に小数点2位の値を与えた場合の変化について 元絵について 元絵にはこれを使った。今回は、人物が1人の場合と2人の場合で調査することにした。 ローカル環境でのテストなので「ネットから拾ってきたモノ」を使ってもよいが、なんかのタイミングでそれが表に出てしまったら困るし、ブログに書きたいことが出てきてもそのまま使えない。基本的には img2img のテストでは自分で書いた絵を元絵にしている。 人物がひ
世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。 あと数日(から数週間)で「トップレベルの画像生成AI」が、世界中にフリーで配布される。 イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。 凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。 メルカリで悪魔の実が買える世界では、誰もが能力者(一流とは限らない)になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl
We used GPT-3 and DALL·E to generate a children's storybook about Ash and Pikachu vs. Team Rocket. Read the story and marvel at the AI-generated visuals! A whole new world of AI awaitsImagine being 5 years old, dreaming of new adventures for Pikachu and Aladdin, and turning those tales into a cartoon right in front of your eyes… (Perhaps even with you as the main character!) What kinds of new stor
月間10万人が読んでいるCoral Insightsのニュースレターにご登録いただくと、Coral Capitalメンバーによる国内外のスタートアップ業界の最新動向に関するブログや、特別イベントの情報等について、定期的にお送りさせていただきます。ぜひ、ご登録ください! Coral Capitalのポッドキャストでは、かなりAIに編集作業を頼っています。英語でインタビューしていることから、日本語では未実現の最新技術を使ったサービスに触れる機会があるのですが、ここ1、2年は、その進化には目を見張るものがあります。 収録した音声を文字(テキスト)に変換する「文字起こし」の精度が上がった結果、もはや人間に依頼する意味はなくなりましたし、音声編集についても画期的な機能が登場しています。それは音声から文字起こしされたテキストを編集することで、それに対応する元の音声データも同時に編集可能である、という機
以下では、この表データは \(X\) という行列にまとめられているとします。上記テーブルに含まれる user_id 数を \(N_U\) , item_id 数を \(N_I\) とするとき、 \(X\) は \( N_U \times N_I\) 行列であり、その第 \(i\) 行は user_id として \(\mathrm{user}[i]\) を持つユーザーに、第 \(j\) 列 は item_id として \(\mathrm{item}[j]\) を持つアイテムに対応するとします。このマッピングのもと、 \(X\) の \(i\) 行 \(j\) 列の要素は、以下の式で与えられます。 $$ X_{ij} = \begin{cases} 1 & (\text{if } \mathrm{user}[i] \text{ and } \mathrm{item}[j] \text{ had
それがこちら! 「AIのべりすと」というサービスです。 空欄にサンプルとなる文章を入れると、勝手に続きを生成してくれるというものらしいです。さっそくサンプルを入力してみましょう。 どうせAIが続きを書くなら適当でいいか……。 よしお伝説 俺の名前はライスボールよしお。 今日は待ちに待った「炊飯器ドッジボール」全国大会決勝の日だ。 炊飯器ドッジボールとは、ボールの代わりに炊飯器をぶつけあう危険きわまりないスポーツである。 俺はそのスポーツの関東代表エースなのだ。 「いよいよか……」 「よしお、お前も勝ち残っていたのか」 声をかけてきたのは、 ここまで書きました。無責任に書いたので炊飯器ドッジボールがなんなのかは私にもよくわかりません。 書けたら入力欄の下にある「続きの文を書く」を押します。しばらく待つと、続きが生成されます。 声をかけてきたのは、俺のライバルであり親友でもある男だった。 「お
2021年10月30日に行われた、第95回R勉強会@東京(#TokyoR)での発表資料です。 https://tokyor.connpass.com/event/225967/ コードはこちらになります。 https://github.com/dropout009/tokyor95
千葉大学は10月13日、同大の中島誠也助教(大学院薬学研究院)と根本哲宏教授(同)が、ヨウ素を含む化合物について、化合物内の原子同士が結び付く力である「結合エネルギー」の強さを高速に算出するAIを構築したと発表した。従来の手法に比べて約1.3億倍の速さで結合エネルギーを算出できる他、計算マシンは一般的なPCで十分という。学習データを増やせば他の物質への応用も期待できるとしている。 従来の結合エネルギー計算には、分子が最も安定する構造をコンピュータで算出した上で、その分子構造から数値を導き出す「DFT計算」という手法を使っていたという。しかしDFT計算では分子1つの結合エネルギーを算出するのに数時間から数日が必要になる他、高性能なコンピュータやソフトウェアと、計算に関する専門知識が必要だった。 そこで中島助教らは、結合力が弱く多彩な化学反応を起こす「超原子価ヨウ素」を含む化合物に注目してAI
せりふの“あのキャラ度”をAI診断、ゲームシナリオ作りに活用 「ライター多数の現場も楽に」(1/2 ページ) 「Fate/Grand Order」などのヒットを契機に増えた、ストーリーをメインに据えたスマートフォンゲーム。さまざまな企業が開発を進める一方、プロジェクトが巨大化すると複数のライターが必要になり、キャラクターの言動に細かいぶれが出るといった問題もある。バンダイナムコグループの研究開発機関、バンダイナムコ研究所(東京都江東区)は、この課題に自然言語処理AIを活用して立ち向かっている。 「現場からは『せりふを把握し続ける負担が減って楽になった』『この人に聞かないとキャラ特有の言い回しが分からない、ということがなくなった』などの声もある」──バンダイナムコ研究所の中野渡(なかのわたり)昌平さん(イノベーション戦略本部プロデュース部事業プロデューサー)は、自社開発したツール「AIセリフ
音ゲーの“譜面”作りをAIで高速化 KLabが「スクスタ」で活用、所要時間を半分に:CEDEC 2021(1/2 ページ) ゲームセンターの筐体としてだけでなく、スマートフォンゲームの一つとしても人気を集めるリズムゲーム。他のゲームと違うのは、ガチャだけでなく新しい曲やその“譜面”も、新規コンテンツとして開発する必要がある点だ。特に譜面、曲に合わせてタッチする位置などを示した時系列データは、1曲1曲に合わせて新規に作ることになる。この手間を、AIを活用して効率化している企業がある。 「低い難易度の譜面作りにAIを活用することで、1曲当たり40時間ほどかかっていた作業時間を約50%削減できた」──スマホ向けリズムゲーム「ラブライブ!スクールアイドルフェスティバル ALL STARS」(スクスタ)を開発するKLabの高田敦史さん(開発推進部機械学習グループ)は、自社開発した「譜面制作支援ツール
Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約 機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。 しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。 本書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。 解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。 その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo
著者のChris I.氏は、カナダ・トロントでデータサイエンティストとして活躍しています。同氏がMediumに投稿した記事『機械学習エンジニアが職を失いつつある。しかし、とにかく機械学習を学ぼう』では、北米のAI業界に関する雑感とAI業界で働き続けるための心得が書かれています。 Chris I.氏が北米のAI市場を見る限りでは、「第三次AIブーム」の熱は冷め、AI技術の研究職に関する求人は減り、AI技術者の供給が需要を上回る景気後退局面に入りました。しかし、こうした見方はAI業界の一側面を見ているに過ぎません。AI研究に対する熱は冷めたかも知れませんが、既存のAI技術を活用して解決すべき問題は、まだ無数にあるのです。このように現状を見たうえで、今後もAI業界で働くにあたっての心得を同氏は以下のように書き記しています。 問題を解決するのに、最先端のAI技術は必要ない。むしろ、既存のAI技術を
Unpaired Image Super-Resolution using Pseudo-Supervision written by Shunta Maeda (Submitted on 26 Feb 2020) Comments: Published by CVPR2020 Subjects: Image and Video Processing (eess.IV); Computer Vision and Pattern Recognition (cs.CV) 高解像度化をはじめとしたディープラーニングを用いた画像処理技術を研究開発するNavier(ナビエ)株式会社は、2020年6月14日から19日まで開催されたComputer vision系トップカンファレンスの国際学会であるCVPR 2020 (IEEE/CVF International Conference on Compu
ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開
日経 xTECH内に人工知能(AI)専門チャネル「ビジネスAI」を2019年10月に立ち上げたのを機に、知識共有サイト「Qiita」上でAI/機械学習の記事を同年12月に募集したところ、49本もの記事が集まった。投稿いただいた皆さん、ありがとうございました。 今回、ビジネスAIの編集担当として私が設定した「お題」は以下の3つ。各テーマについて日経 xTECHがQiitaアドベントカレンダーのスポンサーとなり、2019年12月1日~25日まで1日1本ずつ記事を募集した。 AI道場「Kaggle」への道 機械学習をどう学んだか 機械学習ツールを掘り下げる この結果、機械学習を独習するお薦めの書籍やサービス、Kaggleなどの機械学習コンペに入門する方法など、AIや機械学習に興味があるエンジニアにとって大いに参考になる記事が集まった。投稿者の属性についても「ゴリゴリの文系」や「おじさんSE」「中
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く