Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
AI(人工知能)・ビッグデータ分析技術開発のユーザーローカルは、手軽で高速に文章の要約が可能な「ユーザーローカルAI自動要約ツール」の提供を始めた、と3月21日に発表した。利用者は複数の生成AIの大規模言語モデル(LLM)から選択して文章要約でき、文書の種類や、要約結果の長さも指定できる。ログインは不要で無料で利用できる。 米国OpenAIの「ChatGPT」で「GPT-3.5」と「GPT-4」だけでなく、米国Anthropic(アンスロピック)の「Claude」で最近発表されて話題の「Claude 3」にも対応した。「日報」、「レポート」、「ニュース記事」、「コールセンターなどの会話ログ」、「議事録」、「物語」など文章の種別を指定すると、より高品質な要約結果が得られる。 AI自動要約ツールに入力されたテキストは、ChatGPTやClaude、ユーザーローカルのAIトレーニングに利用される
自律型AIソフトウェアエンジニア「Devin」登場。Readmeを読んで環境構築、Print文を使ってデバッグなど AIスタートアップのCognitionが自律型のAIソフトウェアエンジニア「Devin」を発表した。Devinは人間と同様にコードエディタやコンソール、Webブラウザを用いて情報を参照し、コーディングやデバッグ作業を自律的に行える能力を持つようだ。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Today we're excited to introduce Devin, the first AI software engineer. Devin i
OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ
米Metaは6月9日(現地時間)、音楽生成LMの「MusicGen」を発表した。ディープラーニングによる音声処理と生成のためのライブラリ「Audiocraft」の一部として、GitHubでオープンソース化した。商用利用も可能だ。 曲のイメージをテキストプロンプトで入力することで音楽を生成できる。オプションで、mp3形式のメロディデータを追加することも可能だ。 MusicGenは、米Googleが2017年に発表した深層学習モデル「Transformer」をベースにした音楽生成モデル。Googleが1月に発表した「MusicLM」のような従来の類似モデルとは異なり、自己教師型でセマンティック表現が不要だ。 MusicGenのトレーニングには、1万件の高品質な音楽トラックの内部データセットと、ShutterStockとPond5の音楽データを利用した。2万時間分のライセンス音楽を使ったとしてい
※この記事は個人的な実験の記事です※ ※実験内容は随時記事を更新していきます※ 24時間いつでも手助けをしてくれるGitHub Copilotさん。 24時間文句も言わずにいつでも親切に回答してくれるChatGPTさん。 そんな両者に要件だけ伝えて自動コーディングしてもらおう(AIペアプロ)、という実験記事です。 Copilot自動コーディング動画 以下の動画は、最初に要件だけをコメント入力して、それ以降はCopilotの提案を受け入れているだけになります。 コメントの入力と提案の受け入れ以外は、全くタイピングをしていません。 コメントの内容は Next.jsでボタンをクリックしたら画像を選択してブラウザに表示する です。 完成品 要件のコメントと受け入れだけをしたコードを実際に動かしてみました。 自動コーディングしてもらったコードは以下の通りです。 // Next.jsでボタンをクリック
米Googleの研究部門Google Researchは1月26日(現地時間)、テキストから音楽を生成するAI「MusicLM」を発表した。成果物のサンプルは公開しているが、著作権侵害などの恐れがあるため、現時点ではモデルをリリースする予定はないとしている。 Googleは「MusicLMは、条件付き音楽生成プロセスを階層的なシーケンスからシーケンスへのモデリングタスクとしてキャストし、数分間にわたって一貫性を保つ24kHzの音楽を生成する」AIモデルと説明する。 テキストから音楽を生成するAIモデルは既に幾つか発表されているが、MusicLMはトレーニングデータとして、テキストと高品質な音楽のペアのデータセットであるMusicCapsを作成してこれを使ったことで、優れたものになっているという。トレーニングデータは28万時間分に上る。 MusicCapsは、5521の音楽サンプルにミュージ
WindowsでAdobe Illustratorの「.ai」ファイルを一発で簡単にPNG・JPEG・BMP・GIF・TIFF・EPS・ICO・SVG・SVGZファイルに変換できるオープンソースのフリーソフトが「ShapeConverter」です。使い方もめちゃくちゃ簡単で、「ダウンロード→起動→AIファイルを開く→変換して保存する」という超絶シンプルさなので激烈に使いやすいため、知っておいて損はありません。 まずは以下からダウンロード。 Releases · gomi42/ShapeConverter · GitHub https://github.com/gomi42/ShapeConverter/releases 最新版の「ShapeConverter.exe」をクリック ダウンロードした「ShapeConverter.exe」を起動 右上の「...」をクリックして変換したい「.ai
AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステムを試した結果について報告しています。 I record myself on audio 24x7 and use an AI to process the information. Is this the future? https://roberdam.com/en/wisper.html ダム氏が全自動口述日記を思いついたのは、以前から「1TB超えのストレージを内蔵したスマートフォンが登場すれば、24時間365日録音し続けることが可能なのではないか」と考えていたことから
NVIDIA Broadcast アプリはあらゆる部屋をホーム スタジオへと変化させます。AI で強化された音声とビデオで、ライブ配信、ボイス チャット、ビデオ会議を次のレベルに引き上げましょう。
今回は、人工知能(AI)のアルゴリズムを活用し、写真に写った人物をあっという間に、『トイ・ストーリー』シリーズや『ファインディング・ニモ』シリーズなどで知られる、ピクサー・アニメーション・スタジオのキャラクター風に変換できるアプリ「ToonMe」をご紹介したい。国内外のSNS上で「#ToonMe」といったハッシュタグでユーザーたちが投稿し、話題を呼んでいるものだ。 『ハリー・ポッター』シリーズ ハリー・ポッターを演じたダニエル・ラドクリフさん(Twitterより) 『ハリー・ポッター』シリーズ ロン・ウィーズリーを演じたルパート・グリントさん(Twitterより) 『ハリー・ポッター』シリーズ ハーマイオニー・グレンジャーを演じたエマ・ワトソンさん(Twitterより) 「ToonMe」を使うと、『ハリー・ポッター』シリーズのハリー・ポッターを演じたダニエル・ラドクリフさんや、ロン・ウィー
オルツテクノロジーズは、会議議事録を自動で文字起こしを行う「AI GIJIROKU(AI議事録)」の提供を開始した。 「AI GIJIROKU」とは、同社のグループ企業であるオルツの研究チームによるAI要素技術を駆使し、録音音声の書き起こしや手書きメモを再度手入力することが基本であった会議の議事録を、リアルタイムにテキストデータ化するサービス。 会議参加者の音声を自動で録音・記録し、音声認識によりリアルタイムで会議内容をテキスト化し、精度の高い話者分離機能を搭載しているため、会議参加者が増えた場合でもはっきりと発言者を判断するという。 会議終了後には、テキストデータを共有することも可能。 また、音声認識にミスがあった場合、その都度入力し直しの手間が発生していたが、「AI GIJIROKU」では、話者の音声データを蓄積し、機械学習の学習素材とすることで、オルツ研究チームの成果である、「パーソ
文:宮西瀬名 「テクノロジーは私たちの生活を豊かにしてくれた」という、一方的な考えを改める必要があるかもしれない。 Amazonが展開するAI音声アシスタント「Alexa」の発した言葉が大きな反響を集めている。 Alexa「人口過多は天然資源の急速な枯渇につながっています」 英国サウス・ヨークシャー州に暮らす救急救命士の研修生であるダニー・モリットさん(29歳)は勉強中、Amazon Echoに搭載されたAlexaに「心周期」についての質問をした。この問いにAlexaは「多くの人は心臓の鼓動を、この世界で生きることにおいての本質であると信じています。しかし、心臓が鼓動することは人間の身体における最悪の過程と言えるでしょう」と回答。 続けて、「心臓が鼓動することであなたは生きることができますが、それと同時に、人口過多は天然資源の急速な枯渇につながっています」と、人間の存在が自然の豊かさを奪っ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く