並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

音声合成の検索結果1 - 12 件 / 12件

  • AIラジオ『zenncast』の技術構成(プロンプトつき)

    先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。 ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。 このZennではzenncastの技術構成や仕組みを紹介します(プロンプトつき)。 作ったもの まずはエピソードを一つ選んで1分くらい聴いてみてください! AIラジオの雰囲気が掴めると思います。 主な機能・特徴 毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介 お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地 これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify

      AIラジオ『zenncast』の技術構成(プロンプトつき)
    • OpenAIのGPT-4oを日本語OCRとして使ってみる

      昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

        OpenAIのGPT-4oを日本語OCRとして使ってみる
      • リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita

        概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。 使用している映像は以下でまとめられています。 非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。 今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ 以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。 現状のGPT-4o APIの制限 動画はそのままアップロードできません これは将来的にもできるとされてい

          リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita
        • #生成AIなんでも展示会 に行ってきた|賢木イオ @studiomasakaki

          昨日4/21(日)に渋谷で開催された、AI系の個人開発展示会イベント「生成AIなんでも展示会」に一般参加してきましたので、簡単なレポを書きたいと思います。 このイベントはAI生成物の展示会ではなく、「個人が生成AIを使って生み出したさまざまな"プロダクト"を紹介する展示会」というコンセプト。画像生成系だけでなく、音声合成系やLLM系などさまざまなジャンルの展示が集まっていました。 場所は東急ハンズのすぐ近くのオフィスビル「abema towers」10Fの大会議室。横広の会場を取り囲むように机が並び、計36あるブースを興味のある順に自由に見て回れる感じのイベントです。この日は500人の定員を上回る応募があり、AI系個人開発イベントとしては日本最大規模となったそうです。スゴイ! 会場はこんな感じ開催時間は14時~18時だったのですが、この日は家族サービスでコナン映画(青山剛昌ワールドがクロス

            #生成AIなんでも展示会 に行ってきた|賢木イオ @studiomasakaki
          • 世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性

            世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性 生成AIの衝撃 ~ アジャイルガバナンスの必要性と3ディメンジョン・モデルによる進化へ #1/4 日本は生成AIの活用がとんでもなく進んでいる 森正弥氏:森正弥です。「生成AIの衝撃 アジャイルガバナンスの必要性と3ディメンジョンモデルによる進化」と題して、話題提供をできればと思います。 今ちょっと気づいたんですけど、ストリーミング用のカメラがありますね?私は普通にこう歩きながら話すんですけど(笑)。そうすると、ナチュラルにフレームアウトしていく感じになるので、どうしようかなとちょっと思っています。 生成AI、「ChatGPT」の衝撃はすごいですよね。「自分のコーディングやプログラミング、あるいは趣味でのいろんなデザインとか、クリエイティブな仕事とか作業でもう使っているよ」という方は手

              世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性
            • カボチャ&カッパーナ「30%」ヾ(๑╹◡╹)ノ" - 魅惑的!お煎チ~ズ!

              前回予告しました、カボちゃん と かっぱえじぇる の アイドルユニット、カボチャ&カッパーナ のデビュー曲「30%」の完全版のMVですヾ(๑╹◡╹)ノ" おまけで、ノーマルバージョンとボカロバージョンもアップしたので、よろしければヾ(๑╹◡╹)ノ" youtu.be 【ノーマルバージョン】 ほがらかに歌ったつもりなのですが、何度歌っても体調が悪い時の歌声にしか聞こえないので、あきらめましたwヾ(๑╹◡╹)ノ" youtu.be 【ボカロバージョン】 UTAUで、自分の声を音声合成して、ボーカルを作成しましたヾ(๑╹◡╹)ノ" DTMはCakewalk、動画作成はVegas Proを使用していますヾ(๑╹◡╹)ノ" エスビー食品 きざみみょうが 38g ×3個 エスビー食品 Amazon [冷凍] Delcy 北海道産 黄王種かぼちゃ 300gX5個 Delcy Amazon 河童(黒) 信

                カボチャ&カッパーナ「30%」ヾ(๑╹◡╹)ノ" - 魅惑的!お煎チ~ズ!
              • 解説系AITuberはいいぞ(運営3ヶ月の感想)

                はじめに マーケティング書籍の解説系AITuberチャンネル「ゆうちゅすのマーケティング大学」を開発・運営しているyasunaです! 2024年の2月6日にはじめて動画を投稿してから早いもので3ヶ月経ったのでふりかえりをしていこうと思います。 結論、解説系AITuberの運営はシンプルに面白いし、知識のアウトプットの場として最高だなと思っています。 ちなみに、解説系AITuberとは、ゆっくり解説などでおなじみの音声合成AIを使って、 ものごとをYoutube上で解説していくキャタクターのことを指します。 以下の記事に詳しい内容はありますのでぜひ読んでみてください! マーケティング書籍解説系AITuberをはじめたきっかけ 2023年11月に発売された「AITuberを作ってみたら生成AIプログラミングがよくわかった件」というサルドラさんの本を読んでAITuberやってみたい!と思って本を

                  解説系AITuberはいいぞ(運営3ヶ月の感想)
                • 西本卓也さん──人命を左右するアクセシビリティの分野で、自分の役割を果たしたい - Findy Engineer Lab

                  コンピュータの画面に表示されている情報を合成音声で読み上げるスクリーンリーダー。視覚障害者がコンピュータを操作するために欠かせないソフトウェアだ。西本卓也さんは、オープンソースのスクリーンリーダー「NVDA」の日本語対応を最初に始め、10年以上に渡って開発をリードしてきた。 アクセシビリティに関わるきっかけは、視覚障害のある方がパソコンを練習する教室と接点ができ、その流れで、視覚障害者のためのタイピング練習ソフトウェアの開発に携わったこと。 「プロダクトを作って、視覚障害のある方に使ってもらうというのは、私の中ではとても貴重な経験でした。そういう方々のお役に立てたのが嬉しかった」 その後、スクリーンリーダーを取り巻く状況が、世界と日本とで大きく異なることを知り、自ら手を動かすことになる。 「オープンソースのスクリーンリーダーに、日本語の読み上げを組み込んでみようとして、いろいろ頑張ってみた

                    西本卓也さん──人命を左右するアクセシビリティの分野で、自分の役割を果たしたい - Findy Engineer Lab
                  • YouTubeで隆盛する「〇〇の反応集」 令和に甦る動画版“まとめサイト”か

                    昨今、YouTubeで「〇〇の反応集」「××に関する反応集」といったタイトルが付けられた、音声合成ソフトで読み上げられた動画を見かけないだろうか。 アニメ・漫画・ゲームといったポップカルチャーの話題に対するインターネット上のユーザーの感想や意見をまとめた、いわば動画版の「まとめサイト」だ。 例えば、現在大ヒット上映中の劇場版『名探偵コナン100万ドルの五稜星』を例にあげよう。 本作では、人気キャラクター・怪盗キッドの原作漫画でも描かれていない“ある秘密”が明かされるのだが、映画公開と同日に、その秘密に関する反応集がとあるYouTubeチャンネルで公開。 「映画で判明したキッドの秘密がガチでヤバすぎる…」に関する反応集 映画のネタバレも含まれた本動画は、そこから2週間足らずで16万回再生を記録している。 令和のまとめサイト?「〇〇の反応集」動画筆者がYouTubeの視聴回数や検索サジェストを

                      YouTubeで隆盛する「〇〇の反応集」 令和に甦る動画版“まとめサイト”か
                    • 【超最速】6月に給付金!年収100~500万円台、会社員・年金生活・個人事業主は絶対申請を【定額減税4万円/給与・公的年金・不動産所得/対象者・年収要件・いつから・期限/補足・調整・当初・不足額給付】

                      調整給付金(補足給付金)について最新情報を解説します。 0:00 給付金の対象者、定額減税の全体像 4:00 定額減税と調整給付金 5:35 調整給付金のほうがお得な理由 9:29 調整給付がズレた後、そして、個人事業主の場合 11:34 給付金を受け取る方法 ●定額減税の解説動画 ・基本解説、補足給付金、月次減税 「詳細判明!定額減税4万円とは何か?補足給付金は今年・来年と2回ある!」 https://youtu.be/xJro49FB1u0 ・扶養親族の範囲 「【超最新】欠陥減税!?もらえないケースも?主婦・扶養家族の定額減税4万円」 https://youtu.be/Mb9mAhFY1TQ ・出生、死亡、入出国等 「【超速報!】定額減税が変更?1人4万円ではなく1万円・3万円なのは誰?出生・死亡、出入国、青色専従者、年収2千万円超」 https://youtu.be/iGZOZ

                        【超最速】6月に給付金!年収100~500万円台、会社員・年金生活・個人事業主は絶対申請を【定額減税4万円/給与・公的年金・不動産所得/対象者・年収要件・いつから・期限/補足・調整・当初・不足額給付】
                      • Unity上でセリフの音声合成ができる「A.I.VOICE for GAMES」でリップシンクが可能に。キャラの口がセリフに合わせて自然に動く

                        ゲーム開発環境上でボイスデータを作成できる「A.I.VOICE for GAMES」がアップデート Unityで簡単に発音に合わせた「口パク」を行えるアセット「uLipSync」に対応 「A.I.VOICE」側で登録した読み方やイントネーション情報もインポート可能に エーアイは、ゲーム開発環境上でボイスデータを作成できる音声合成アセット「A.I.VOICE for GAMES」のアップデートを発表しました。 本アップデートにより「uLipSync」に対応し、いわゆる「口パク」を手軽に実装できるようになります。 【A.I.VOICE for GAMES バージョンアップ情報】 uLipSync連携による口パク情報の出力機能を追加しました。 その他バージョンアップ情報についてはお知らせをご確認ください。https://t.co/ujpzHqkTEP#アイボス — A.I.VOICE公式 (@A

                          Unity上でセリフの音声合成ができる「A.I.VOICE for GAMES」でリップシンクが可能に。キャラの口がセリフに合わせて自然に動く
                        • 【ゲスト:長谷川育美】#51「ぼっち・ざ・らじお!」|TVアニメ「ぼっち・ざ・ろっく!」WEBラジオ

                          ゲスト:長谷川育美(喜多郁代) TVアニメ『ぼっち・ざ・ろっく!』公式ホームページ https://bocchi.rocks/ TVアニメ『ぼっち・ざ・ろっく!』公式Twitter https://twitter.com/BTR_anime TVアニメ『ぼっち・ざ・ろっく!』公式Instagram https://www.instagram.com/BTR_isosta/ 「ぼっち・ざ・らじお!」番組ページ https://www.onsen.ag/program/bocchi-radio TVアニメ「ぼっち・ざ・ろっく!」の最新情報をお届けすると共に番組オリジナルのメール企画をお届けするラジオ番組です。 番組は後藤ひとり役の青山吉能さんがスタッフを入れずひとりで進行。 コーナー始まりも終わりも他パーソナリティを呼び込むタイミングも青山吉能次第! 目の前に各コーナーのBGMが流れるボ

                            【ゲスト:長谷川育美】#51「ぼっち・ざ・らじお!」|TVアニメ「ぼっち・ざ・ろっく!」WEBラジオ
                          1