制作を依頼いただく際に、事前にLoose AIを利用いただき、その生成された素材をイラスト制作の参考として活用いただける場合には、制作料金から 最大20%割引 させていただきます。
Amazon Bedrockで発話での注文から、商品名と数量を抽出し、商品マスタの商品名と突合してみた[AIチャットボット] はじめに Amazon Connect、Amazon Bedrock、Whisper APIを組み合わせて、電話で発話された注文内容(商品名と数量)を認識し、商品マスタと突合する方法とその精度を検証しました。 精度の確認方法は、発話された商品名と数量がAWS Lambdaのログで発話通りに認識されているかを確認しました。 利用シーンとしては、電話での注文を無人対応するケースです。注文をヒアリング後は、自動で発注、もしくはオペレーターにエスカレーションが考えられます。 電話での対話の流れは、以下のようなイメージです。 発話した商品名と商品マスタの商品名を、生成AIを利用して突合することができれば、自動で発注が実現できます。 注文内容を復唱後、ユーザーには発話やプッシュ
「イルシル」は、株式会社イルシルが提供をしている「AI搭載スライド自動生成サービス」です。入力をしたキーワードやメモからAIがスライドを生成してくれます。 試しに「コーヒー」のスライドを作成してみます。キーワードと特徴をを入力すると、AIがスライド全体の構成とスライド作成のための指示文を生成してくれます。ここでは指示を編集して、自分の作りたい内容に修正をすることができます。 続いて「テキストをAI生成」をすると、指示文をもとに、それぞれのスライドの内容(スライドのタイトル、メッセージ、ヘッダー、ボディ)を生成してくれます。ここで生成された文言がスライドにも反映されます。 「スライドに反映」をすると、AIがスライドを生成してくれます。 あとは、それぞれのスライドを手直しをしていきます。スライド内の文章やパーツを編集したいときは、編集したい部分をクリックすれば編集することができます。 スライド
毎朝、デザイン系の英語記事を10件ほどおすすめしてくれるSlackボットです。このボットは現在も問題なく稼働し続けていますが、毎朝のニュースは文字で読むよりも音声として聞いたほうが負担が少なく続けられそうです。 そこで、このSlackボットを拡張して、毎朝デザインニュースのポッドキャストを自動生成する仕組みを作ることにしました。 成果物はじめに成果物について。完成したポッドキャストは毎朝SpotifyとApple Podcastで配信しています。 おおまかな処理の流れ開発前に想定した処理の流れは以下の通りです。 毎朝ポッドキャストが自動で配信される理想的なフロー自分はコンテンツ制作者ではなく、あくまでリスナーというスタンスを取りたいため、ワークフローに自分が介在しない完全自動化が理想です。 ところが、Sound Cloud APIの利用に必要なアプリケーション登録の受付が現在停止しているこ
パーカッションやブラスヒットなどジャンルを絞りつつ、AIで自動生成された好みのサンプリング用素材をダウンロードできるサービス「Soundry AI」が公開されています。「ワンショット」「ループ」などのタイプや「シンセ」「ベース」などのジャンルを指定して生成することが可能です。 Soundry AI https://soundry.ai/ Making Music using AI | Introducing Soundry AI - YouTube Soundry AIはブラウザで動作するデモ版とダウンロード版が存在しますが、今回はブラウザから「Start for free」をクリックしてデモ版を使います。 ログインを求められるので、アカウントを作成するために「Sign up instead」をクリック。 メールアドレス・パスワードを決めて入力し、利用規約・プライバシーに関する注意・16歳
以下のXを見て、早速「Create」を試してみたので、実際に使った所感をまとめます AIがリアルタイムでWebページを作ってくれる神サイト ㅤ 会話だけで、理想のUIを実現することが可能 ㅤ 使い方・活用法をツリーにまとめます! ㅤ ブックマーク保存をおすすめします↓ pic.twitter.com/J1cJkUkyO8 — すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) March 25, 2024 一言で言うとヤバいです... 詳細は以下のサイトでも解説しています Createとは Create 公式サイト Createは、1行のコードを書かなくても自然言語を使って、高度なAIを搭載したアプリやツールが作成できる生成AI搭載のノーコードツールです。 エンジニアでなくともChatGPT APIやStable Diffusion APIを組み込んだアプリが簡単に作れ
TL; DR OpenAI が非常に高品質な動画生成モデル Sora を公開 画像生成モデル Diffusion-Transformer を利用 動画を3次元画像として扱うことで画像モデルを拡張 キャプションは DALL•E3 同様、キャプション生成モデルで作成 OpenAI Sora Sora は OpenAI が今年の2月に発表した、動画生成モデルです。まずはこのモデルの出力例を見てみましょう。 図1. Sora の生成例: https://cdn.openai.com/sora/videos/big-sur.mp4 各フレームの画像が非常に美しく生成されています。また、従来の動画生成では時間が経った際に写っているオブジェクトを保つことが難しく、消えたり現れたり、急に歪んだりするものが多かったのに対し、Sora では一度隠れてから再度現れる場合であっても、矛盾なく生成できています。 こ
ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面(右上)、コードエディタ(右下)、Webブラウザ(左下)を持っています(左上は人間とチャットでやり取りする領域)。 人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。 今回、Dev
大規模言語モデルや画像生成AIなどの機械学習モデルでは、ファインチューニングやLoRA(Low Rank Adaptation)といった手法によって、モデルの重みを微調整し、特定のタスクや目的に沿った出力を行うようにカスタマイズすることができます。香港科技大学の研究チームが、LoRAよりも計算コストと時間を削減できる新たな手法「DoRA(Weight-Decomposed Low-Rank Adaptation)」を発表しました。 [2402.09353] DoRA: Weight-Decomposed Low-Rank Adaptation https://arxiv.org/abs/2402.09353 Improving LoRA: Implementing Weight-Decomposed Low-Rank Adaptation (DoRA) from Scratch https
DeepLを超えるやさしい翻訳アプリとGPTsを作りました 苦手な分野の英文を理解するのを助けてくれます。 なぜ翻訳アプリを作ったのか 私は最近ChatGPTのような大規模言語モデルに興味があり、AI開発者の方や、大規模言語モデル関連の情報を発信している方をフォローしていました。 すると最新の論文(英語)や英語のツイートが次々に流れてくるのですが、それらをGoogle翻訳したり、DeepLで翻訳しても、意味不明な場合が多いということに気づきました。 特に海外の方の1行だけのツイートなどは、DeepLで翻訳しても全く意味がわからない場合が多くて困っていました。 AI関連の論文は専門用語が多く、いちいち調べながら読んでいると、1日の大半の時間が情報収集だけで終わってしまいます。 これは要するに「自分の専門分野でない分野の英文を理解するのは大変」ということなので、例えば「Web制作初心者の方が海
ポイント Stable Cascadeは、Würstchen アーキテクチャをベースにした新しいテキスト画像変換モデルです。このモデルは、非商用利用のみを許可する非商用ライセンスの下でリリースされます。 Stable Cascadeは、3段階のアプローチにより、一般消費者向けハードウェアでのトレーニングと微調整が簡単にできます。 チェックポイントと推論スクリプトを提供するだけでなく、皆さんがこの新しいアーキテクチャをさらに試せるように、微調整、ControlNet、LoRAトレーニング用のスクリプトを Stability AI の GitHub で公開しています。 はじめに Stable Cascade の研究プレビューが公開されました。この革新的なテキストから画像へのモデルは、品質、柔軟性、微調整、および効率性のための新しいベンチマークを設定し、ハードウェアのバリアをさらに排除することに
1月27日から5月12日まで、台湾のコンテンポラリーアート美術館である台北当代芸術館(MoCA TAIPEI)で開催されているAIアート展覧会「你好,人類!Hello, Human!」に、筆者のAI作品が2点選出され、展示されています。現地での様子を見てきた筆者が、この展示会のキュレーターにAIアートについて聞いてきました。 台湾におけるコンテンポラリーアートの拠点として実績を持つMoCA TAIPEIは、日本による占領時代に作られた尋常小学校を改装して作られており、建物の半分が今でも中学校として使われています。このため、MoCA TAIPEIの展覧会には教育目的のものが多いようで、Hello Human!もそういう側面があります。 ▲およそ100年の歴史を持つ煉瓦造りの台北当代芸術館(MoCA TAIPEI) このため、記者会見後の内覧会には中学生たちが参加し、展示を興味深げにみていまし
お題箱から 797.生成aiについて無知なので質問です 下記のように学習元画像を合成したかのような元画像がでることから合成ツールと主張する人がいますが、実際に生成aiは合成ツールなのでしょうか? https://x.com/r18rensyu/status/1745959957990965624?s=61 これ去年の今ぐらいまでなら学習してるから合成ではない論はまだ通用したかもしれないけど、明らかに学習元となる画像がポンポン出るようになってきてしまって正体は引用合成ツールだったのがバレちゃったんだよね。 https://t.co/e367C2DqWl — リハビリ用 (@r18rensyu) 2024年1月13日 質問に対する答えは「依然として生成AIは合成ではなく学習を行っている」で、このツイートは100%誤りです。「塩水を沸騰させると砂糖水になる」と同じレベルの端的な誤りで、議論の余地
元米Googleの著名な研究者、リオン・ジョーンズ氏とデビッド・ハー氏が東京で立ち上げたAI企業Sakana.ai(東京都港区)は1月16日、シリコンバレーのベンチャーキャピタルやNTTグループ、KDDI、ソニーグループなどから45億円の資金を調達したと発表した。 調達元はシリコンバレーのベンチャーキャピタル米Lux Capitalや米Khosla Venturesに加え、日本ではNTTグループ、KDDI、ソニーグループ、ベンチャーキャピタルのみやこキャピタルやジャフコグループなども出資した。Googleで最高AI責任者を務めるジェフ・ディーン氏や、米Hugging Face創業者CEOのクレム・デラング氏、米Scale AI創業者CEOのアレックス・ワン氏といった個人からも出資を受けた。 調達した資金は人材採用に充てる。国内外から優秀なITエンジニア人材を集め、日本に招致するという。さら
リチウムイオン電池は、現代社会でスマートフォンや電気自動車などに広く使用される一方で、破裂や火災につながる危険性が指摘されています。2024年1月9日にMicrosoftとパシフィック・ノースウエスト国立研究所(PNNL)は共同で、既存のリチウムイオン電池よりも破裂しにくい可能性のある新たな固体電解質を用いたバッテリー材料を発見したことを発表しました。今回の発見には、Microsoftの量子コンピューティングサービス「Azure Quantum Elements」が用いられました。 Discoveries in weeks, not years: How AI and high-performance computing are speeding up scientific discovery - Source https://news.microsoft.com/source/featu
画像とテキストを組み合わせてタスクをこなせるマルチモーダル大規模言語モデルの「Ferret」のウェイト情報をAppleが公開しました。ウェイトのデータはCC-BY-NCライセンスでの提供となっており、研究目的でのみ利用可能です。 apple/ml-ferret https://github.com/apple/ml-ferret Ferretは2023年10月30日に公開されたマルチモーダル大規模言語モデルで、画像の領域を指定して解釈する能力があることが特徴です。領域の指定方法には「点」「四角形」「フリーフォーム」の3種類が存在しています。 画像の一部を指定することで、テキストで「領域[100, 600, 500, 900]には何がありますか?」のように領域を参照して質問することが可能です。Ferretモデルは画像とテキストを元に、「ネコの尻尾です」のように回答することができます。同時に、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く