[B! 人工知能] kns_1234のブックマーク

LOOSE AI

制作を依頼いただく際に、事前にLoose AIを利用いただき、その生成された素材をイラスト制作の参考として活用いただける場合には、制作料金から最大20%割引させていただきます。

kns_1234 2024/04/24

リンク

Amazon Bedrockで発話での注文から、商品名と数量を抽出し、商品マスタの商品名と突合してみた[AIチャットボット] | DevelopersIO

Amazon Bedrockで発話での注文から、商品名と数量を抽出し、商品マスタの商品名と突合してみた[AIチャットボット] はじめに Amazon Connect、Amazon Bedrock、Whisper APIを組み合わせて、電話で発話された注文内容（商品名と数量）を認識し、商品マスタと突合する方法とその精度を検証しました。精度の確認方法は、発話された商品名と数量がAWS Lambdaのログで発話通りに認識されているかを確認しました。利用シーンとしては、電話での注文を無人対応するケースです。注文をヒアリング後は、自動で発注、もしくはオペレーターにエスカレーションが考えられます。電話での対話の流れは、以下のようなイメージです。発話した商品名と商品マスタの商品名を、生成AIを利用して突合することができれば、自動で発注が実現できます。注文内容を復唱後、ユーザーには発話やプッシュ

kns_1234 2024/04/17

リンク

AIがパワポのスライド作成をしてくれる「イルシル」がシンプルでデザイン性の高いスライドを効率よく作成できる神ツールだった！ | イーカイ

「イルシル」は、株式会社イルシルが提供をしている「AI搭載スライド自動生成サービス」です。入力をしたキーワードやメモからAIがスライドを生成してくれます。試しに「コーヒー」のスライドを作成してみます。キーワードと特徴をを入力すると、AIがスライド全体の構成とスライド作成のための指示文を生成してくれます。ここでは指示を編集して、自分の作りたい内容に修正をすることができます。続いて「テキストをAI生成」をすると、指示文をもとに、それぞれのスライドの内容（スライドのタイトル、メッセージ、ヘッダー、ボディ）を生成してくれます。ここで生成された文言がスライドにも反映されます。「スライドに反映」をすると、AIがスライドを生成してくれます。あとは、それぞれのスライドを手直しをしていきます。スライド内の文章やパーツを編集したいときは、編集したい部分をクリックすれば編集することができます。スライド

kns_1234 2024/04/10

リンク

OpenAIのSoraに対抗しているOpen Sora Planを使ってみた｜Masayuki Abe

Open Sora PlanのGitHub プロジェクトの紹介OpenAIが自然言語から動画を作成するモデルSoraのプレスリリースをして世間を驚かせましたが、いつ頃出てくるのかはまだ発表されていません。そんな中、オープンソースで自然言語から動画を作成するプロジェクトがGitHubにありましたので紹介していきます。今回の成果物は次のような動画です。

kns_1234 2024/04/09

リンク

Feedly + ChatGPTで、毎朝自分専用のポッドキャストを自動生成する仕組みを作った｜鈴木慎吾 / TSUMIKI INC.

毎朝、デザイン系の英語記事を10件ほどおすすめしてくれるSlackボットです。このボットは現在も問題なく稼働し続けていますが、毎朝のニュースは文字で読むよりも音声として聞いたほうが負担が少なく続けられそうです。そこで、このSlackボットを拡張して、毎朝デザインニュースのポッドキャストを自動生成する仕組みを作ることにしました。成果物はじめに成果物について。完成したポッドキャストは毎朝SpotifyとApple Podcastで配信しています。おおまかな処理の流れ開発前に想定した処理の流れは以下の通りです。毎朝ポッドキャストが自動で配信される理想的なフロー自分はコンテンツ制作者ではなく、あくまでリスナーというスタンスを取りたいため、ワークフローに自分が介在しない完全自動化が理想です。ところが、Sound Cloud APIの利用に必要なアプリケーション登録の受付が現在停止しているこ

kns_1234 2024/03/31

リンク

サンプリングに使える素材をテキストプロンプトや音声ファイルを基に自動生成するAIサービス「Soundry AI」

パーカッションやブラスヒットなどジャンルを絞りつつ、AIで自動生成された好みのサンプリング用素材をダウンロードできるサービス「Soundry AI」が公開されています。「ワンショット」「ループ」などのタイプや「シンセ」「ベース」などのジャンルを指定して生成することが可能です。 Soundry AI https://soundry.ai/ Making Music using AI | Introducing Soundry AI - YouTube Soundry AIはブラウザで動作するデモ版とダウンロード版が存在しますが、今回はブラウザから「Start for free」をクリックしてデモ版を使います。ログインを求められるので、アカウントを作成するために「Sign up instead」をクリック。メールアドレス・パスワードを決めて入力し、利用規約・プライバシーに関する注意・16歳

kns_1234 2024/03/31

リンク

1行もコードを書かずに画像生成AIツール作ってみた - Qiita

以下のXを見て、早速「Create」を試してみたので、実際に使った所感をまとめます AIがリアルタイムでWebページを作ってくれる神サイト ㅤ 会話だけで、理想のUIを実現することが可能 ㅤ 使い方・活用法をツリーにまとめます！ ㅤ ブックマーク保存をおすすめします↓ pic.twitter.com/J1cJkUkyO8 — すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) March 25, 2024 一言で言うとヤバいです... 詳細は以下のサイトでも解説しています Createとは Create 公式サイト Createは、1行のコードを書かなくても自然言語を使って、高度なAIを搭載したアプリやツールが作成できる生成AI搭載のノーコードツールです。エンジニアでなくともChatGPT APIやStable Diffusion APIを組み込んだアプリが簡単に作れ

kns_1234 2024/03/29

リンク

OpenAI Sora に使われる技術

TL; DR OpenAI が非常に高品質な動画生成モデル Sora を公開画像生成モデル Diffusion-Transf ormer を利用動画を3次元画像として扱うことで画像モデルを拡張キャプションは DALL•E3 同様、キャプション生成モデルで作成 OpenAI Sora Sora は OpenAI が今年の2月に発表した、動画生成モデルです。まずはこのモデルの出力例を見てみましょう。図1. Sora の生成例: https://cdn.openai.com/sora/videos/big-sur.mp4 各フレームの画像が非常に美しく生成されています。また、従来の動画生成では時間が経った際に写っているオブジェクトを保つことが難しく、消えたり現れたり、急に歪んだりするものが多かったのに対し、Sora では一度隠れてから再度現れる場合であっても、矛盾なく生成できています。こ

kns_1234 2024/03/27

人工知能

リンク

Stability AI、回転しても形を保つ3Dを生成「Stable Video 3D」

kns_1234 2024/03/19

リンク

自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで | テクノエッジ TechnoEdge

ITジャーナリスト／Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面（右上）、コードエディタ（右下）、Webブラウザ（左下）を持っています（左上は人間とチャットでやり取りする領域）。人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。今回、Dev

kns_1234 2024/03/16

人工知能

リンク

中学１年生２５０人の半数超、理科の課題で同じ間違い…教諭の違和感の正体は生成ＡＩの「誤答」

【読売新聞】　東京都内の私立中で２月、１年生の半数超が理科の課題に対する解答を間違う事態が起きた。原因となったのは、生成ＡＩ（人工知能）が表示した“誤答”。食品大手「キユーピー」がホームページ（ＨＰ）に載せていた記述を基に生成し、生

kns_1234 2024/03/06

Google検索結果の生成AIは、試験運用の参加者にしか表示されません。教師とこの記者は、強調スニペットのことをAIと勘違いしているのでは？

人工知能

リンク

機械学習モデルの再学習でLoRAよりもより少ない計算コストと時間でより高いパフォーマンスを期待できる「DoRA」

大規模言語モデルや画像生成AIなどの機械学習モデルでは、ファインチューニングやLoRA(Low Rank Adaptation)といった手法によって、モデルの重みを微調整し、特定のタスクや目的に沿った出力を行うようにカスタマイズすることができます。香港科技大学の研究チームが、LoRAよりも計算コストと時間を削減できる新たな手法「DoRA(Weight-Decomposed Low-Rank Adaptation)」を発表しました。 [2402.09353] DoRA: Weight-Decomposed Low-Rank Adaptation https://arxiv.org/abs/2402.09353 Improving LoRA: Implementing Weight-Decomposed Low-Rank Adaptation (DoRA) from Scratch https

kns_1234 2024/02/20

人工知能

リンク

DeepLを超えるやさしい翻訳アプリとGPTsを作りました

DeepLを超えるやさしい翻訳アプリとGPTsを作りました苦手な分野の英文を理解するのを助けてくれます。なぜ翻訳アプリを作ったのか私は最近ChatGPTのような大規模言語モデルに興味があり、AI開発者の方や、大規模言語モデル関連の情報を発信している方をフォローしていました。すると最新の論文（英語）や英語のツイートが次々に流れてくるのですが、それらをGoogle翻訳したり、DeepLで翻訳しても、意味不明な場合が多いということに気づきました。特に海外の方の1行だけのツイートなどは、DeepLで翻訳しても全く意味がわからない場合が多くて困っていました。 AI関連の論文は専門用語が多く、いちいち調べながら読んでいると、1日の大半の時間が情報収集だけで終わってしまいます。これは要するに「自分の専門分野でない分野の英文を理解するのは大変」ということなので、例えば「Web制作初心者の方が海

kns_1234 2024/02/19

難解な生成AI関連の論文の内容を理解したいとき、英文メールのニュアンスが分からない時などにぜひ使ってみてください。

リンク

Stable Cascade のご紹介 — Stability AI Japan — Stability AI Japan

ポイント Stable Cascadeは、Würstchen アーキテクチャをベースにした新しいテキスト画像変換モデルです。このモデルは、非商用利用のみを許可する非商用ライセンスの下でリリースされます。 Stable Cascadeは、3段階のアプローチにより、一般消費者向けハードウェアでのトレーニングと微調整が簡単にできます。チェックポイントと推論スクリプトを提供するだけでなく、皆さんがこの新しいアーキテクチャをさらに試せるように、微調整、ControlNet、LoRAトレーニング用のスクリプトを Stability AI の GitHub で公開しています。はじめに Stable Cascade の研究プレビューが公開されました。この革新的なテキストから画像へのモデルは、品質、柔軟性、微調整、および効率性のための新しいベンチマークを設定し、ハードウェアのバリアをさらに排除することに

kns_1234 2024/02/13

人工知能

リンク

Galileo AI

kns_1234 2024/02/07

リンク

アーティストのAIへの反発をどう考える？　台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました（CloseBox） | テクノエッジ TechnoEdge

1月27日から5月12日まで、台湾のコンテンポラリーアート美術館である台北当代芸術館（MoCA TAIPEI）で開催されているAIアート展覧会「你好，人類！Hello, Human!」に、筆者のAI作品が2点選出され、展示されています。現地での様子を見てきた筆者が、この展示会のキュレーターにAIアートについて聞いてきました。台湾におけるコンテンポラリーアートの拠点として実績を持つMoCA TAIPEIは、日本による占領時代に作られた尋常小学校を改装して作られており、建物の半分が今でも中学校として使われています。このため、MoCA TAIPEIの展覧会には教育目的のものが多いようで、Hello Human!もそういう側面があります。 ▲およそ100年の歴史を持つ煉瓦造りの台北当代芸術館（MoCA TAIPEI）このため、記者会見後の内覧会には中学生たちが参加し、展示を興味深げにみていまし

kns_1234 2024/01/30

“カメラが写真を手軽に記録できるようにしたとき、画家はカメラを憎みました。それと同じようなことが今起きていると思います。”

人工知能

リンク

24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ

お題箱から 797.生成aiについて無知なので質問です下記のように学習元画像を合成したかのような元画像がでることから合成ツールと主張する人がいますが、実際に生成aiは合成ツールなのでしょうか？ https://x.com/r18rensyu/status/1745959957990965624?s=61 これ去年の今ぐらいまでなら学習してるから合成ではない論はまだ通用したかもしれないけど、明らかに学習元となる画像がポンポン出るようになってきてしまって正体は引用合成ツールだったのがバレちゃったんだよね。 https://t.co/e367C2DqWl — リハビリ用 (@r18rensyu) 2024年1月13日質問に対する答えは「依然として生成AIは合成ではなく学習を行っている」で、このツイートは100%誤りです。「塩水を沸騰させると砂糖水になる」と同じレベルの端的な誤りで、議論の余地

kns_1234 2024/01/29

リンク

東京発・AIドリームチーム「Sakana.ai」が45億円調達　元Googleトップ研究者らが設立　AI業界の著名人や日本の大手IT企業も出資

元米Googleの著名な研究者、リオン・ジョーンズ氏とデビッド・ハー氏が東京で立ち上げたAI企業Sakana.ai（東京都港区）は1月16日、シリコンバレーのベンチャーキャピタルやNTTグループ、KDDI、ソニーグループなどから45億円の資金を調達したと発表した。調達元はシリコンバレーのベンチャーキャピタル米Lux Capitalや米Khosla Venturesに加え、日本ではNTTグループ、KDDI、ソニーグループ、ベンチャーキャピタルのみやこキャピタルやジャフコグループなども出資した。Googleで最高AI責任者を務めるジェフ・ディーン氏や、米Hugging Face創業者CEOのクレム・デラング氏、米Scale AI創業者CEOのアレックス・ワン氏といった個人からも出資を受けた。調達した資金は人材採用に充てる。国内外から優秀なIT エンジニア人材を集め、日本に招致するという。さら

kns_1234 2024/01/17

人工知能

リンク

Microsoftがバッテリー内のリチウムの約70％を置き換えられる材料をわずか数日で発見、Azure Quantum Elementsを使ったシミュレーションとAIモデルで実行

リチウムイオン電池は、現代社会でスマートフォンや電気自動車などに広く使用される一方で、破裂や火災につながる危険性が指摘されています。2024年1月9日にMicrosoftとパシフィック・ノースウエスト国立研究所(PNNL)は共同で、既存のリチウムイオン電池よりも破裂しにくい可能性のある新たな固体電解質を用いたバッテリー材料を発見したことを発表しました。今回の発見には、Microsoftの量子コンピューティングサービス「Azure Quantum Elements」が用いられました。 Discoveries in weeks, not years: How AI and high-performance computing are speeding up scientific discovery - Source https://news.microsoft.com/source/featu

kns_1234 2024/01/11

リンク

Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される

画像とテキストを組み合わせてタスクをこなせるマルチモーダル大規模言語モデルの「Ferret」のウェイト情報をAppleが公開しました。ウェイトのデータはCC-BY-NCライセンスでの提供となっており、研究目的でのみ利用可能です。 apple/ml-ferret https://github.com/apple/ml-ferret Ferretは2023年10月30日に公開されたマルチモーダル大規模言語モデルで、画像の領域を指定して解釈する能力があることが特徴です。領域の指定方法には「点」「四角形」「フリーフォーム」の3種類が存在しています。画像の一部を指定することで、テキストで「領域[100, 600, 500, 900]には何がありますか？」のように領域を参照して質問することが可能です。Ferretモデルは画像とテキストを元に、「ネコの尻尾です」のように回答することができます。同時に、

kns_1234 2023/12/25

リンク

はてなブックマーク

タグ

関連タグで絞り込む (78)

人工知能に関するkns_1234のブックマーク (239)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス