本文「音声合成」を検索 - はてなブックマーク

1 - 3 件 / 3件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声合成の検索結果1 - 3 件 / 3件

AIラジオ『zenncast』の技術構成（プロンプトつき）
- 352 users
- zenn.dev/himara2
- テクノロジー
- 2024/05/16
先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。このZennではzenncastの技術構成や仕組みを紹介します（プロンプトつき）。作ったものまずはエピソードを一つ選んで1分くらい聴いてみてください！ AIラジオの雰囲気が掴めると思います。主な機能・特徴毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify
- AI
- あとで読む
- LLM
- webサービス
- 技術
- API
- ラジオ
- エンジニア
- radio
- 人工知能
商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生｜DTMステーション
- 170 users
- www.dtmstation.com
- テクノロジー
- 2024/05/31
ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS＝Text to Speech（音声読み上げソフト）の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。さらにStoryblocksという音素
- AI
- あとで読む
- DTM
- 音声合成
- sound
- 人工知能
- DAW
- 音声
- tool
- ソフト
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 142 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- GPT
- OCR
- 人工知能
- api

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx