すでにご存じの方も多いと思いますが、2月22日にAIきりたんなるものが登場し、大騒ぎとなりました。正確にはSHACHI(@SHACHI_KRTN)さんという方が開発したNEUTRINOというAI歌声合成ソフトがフリーウェアで公開されるとともに、それで歌わせた楽曲が、くろ州さんなどによって公開され、話題になったのです。2月22日は、ちょうどMIDI 2.0の日米合意があった日で、そのドタバタでネットをチェックできておらず、私が気づいたのは24日になってから。その歌声を聴いて驚愕しました。 実際どんなものなのかと、さっそくNEUTRINOをダウンロードし、手元にあったMusicXMLデータを元に歌わせてみると、従来のVOCALOIDなどとは別次元の人間的な歌声で、東北きりたんが歌ってくれてさらに驚いたのです。どういうことなのか知りたいと思い、開発者のSHACHIさんに連絡してみたところ「種々の
アメリカの大手IT企業、「アマゾン」は、入力された文字情報を人工知能を活用して自然な日本語で読み上げる「音声合成」のサービスの分野に本格的に参入することになりました。 「音声合成」のサービスは、国内の多くの企業が展開していますが、今回、アマゾンが発表したサービスは、ネットワーク上でソフトを利用できる「クラウド」と呼ばれる形態をとっているのが特徴で、利用者は自前のシステムを用意したりソフトを購入したりする必要がなく、100万文字で440円と格段に安く利用できるとしています。 また大量の音声データを人工知能で分析することで、自然な抑揚のつけ方を学び、新しい用語や流行語も直ちに覚えて発音できるということです。 海外では目の不自由な人に本を読み上げるボランティア活動や外国語の発音を学ぶアプリなどに利用されているということです。 一方、国内では、和歌山市にあるコミュニティーFMが、アナウンサーの代わ
ラジオ風という聴きやすさ このオトラテの特徴がラジオ風に流れてくる聴きやすさじゃないかと思います。 ただ単にWebページをいきなり読み始めるんじゃなくて、番組という形でチェックするサイトがまとめられており、ほんとにラジオを聴いているかのごとく、サイトの情報チェックができます。 ▼この番組というものがアプリを起動すると、あらかじめ用意されていて、すぐにラジオ感覚で番組を楽しめます。 番組というのはどういうものかというと、まさにラジオの番組のように、最初に番組のオープニングがあり、天気予報、Webページのチェック、間に音楽をはさんで、最後にエンディングという形で流れていきます。 もちろん、天気予報や音楽などが不要だったり、流れる場所を変えたい場合はカスタマイズ可能です。 実際どんな感じかの紹介動画もyoutubeにもあがっていたんで、貼っておきます。 どうでしょう?このラジオ風にしたのって私と
1 スフィンクス(空) :2013/04/28(日) 10:16:50.89 ID:HeD4e/C60 ?PLT(12001) ポイント特典 無償の音声合成・歌声合成ソフト「CeVIO Creative Studio FREE」が公開された。 簡単な操作でキャラのおしゃべりを制作できる期待の新星、その開発の経緯やこれからを教えてもらった。 ※下記リンクより、一部抜粋。続きはソースで http://www.itmedia.co.jp/news/articles/1304/26/news133.html http://cevio.jp/ ※関連記事 【ワンピース】「サンジの満腹ごはん」の帯wwwwwwwwワロタwwwwww 桜庭和志が秋山ヌルヌル事件を語った雑誌を読んで来たけどマジで総合格闘業界が腐りすぎててワロタwwwwwwwwwwww ゲームの専門学校酷すぎワロタwww
Speak.jsはJavaScriptだけでテキストを読み上げるソフトウェアです。 Webブラウザで音声ファイルを指定してJavaScriptで解析、なんてソフトウェアもありますが今回は一から“音声”を生み出してしまう驚きのソフトウェア、Speak.jsを紹介します。 ボタンを押すとHello Worldと話します。 こんな感じで任意の言葉を話させることもできます。 Speak.jsはジェネレータを通じて音声を動的に生み出します。対応しているのは英数字のみとなっており、日本語には対応していません。常に動的に生成しているので自由なテキストを読み上げさせることができます。 Speak.jsはJavaScript製のオープンソース・ソフトウェア(GPL)です。 MOONGIFTはこう見る テキストを外部サーバに送って、それを音声ファイルにして返すAPIも世の中にはあります。当然、こちらの方が英語
先週のレシピでは、mbrolaを使った音声合成と、MeCabを使った形態素解析のレシピをお届けしました。 今回は予告どおり、一連の流れを自動化するPythonスクリプトを作成してみます。 なお、Pythonを選択した理由は2つあります。ひとつはMeCabのPythonバインディングのパッケージが提供されていて都合が良かったこと、もうひとつは日本語文字の扱いが簡単そうなことです。後者を先に簡単に説明します。 Pythonで日本語処理 Mecabを通じて辞書から取得した「読み」をmbrolaの音素リストに変換するためには、日本語を1文字1文字処理する必要があります。例えば冒頭の例「八戸」の読みである「ハチノヘ」を音素リストに変換するには、次を行う必要があります。 「ハチノヘ」を「ハ」、「チ」、「ノ」、「ヘ」に切り分けたリストを得る リストのそれぞれの要素に対して置換処理を行い
今回から2回に渡り、Ubuntuで利用可能ないくつかのソフトウェアを組み合わせて、入力テキストを喋る仕組みを作るレシピをお届けします。Mbrola、MeCabを使って音声を合成し、Linuxのサウンドサブシステムを通じて音声を出力します。 MBROLAプロジェクトとは MBROLAとは、汎用音声合成エンジン「mbrola」と、mbrolaで利用可能な音声データベースを開発するプロジェクトです[1]。1995年にベルギーのFaculte Polytechnique de Mons大学のTCTS研究室が開始しました。音声合成エンジンもデータベースもバイナリーの形で提供されているためオープンソースソフトウェアではありませんが、フリーなライセンス[2]のもとで利用できます。 DebianやUbuntuではmbrolaのパッケージが提供されています。Ubuntuソフトウェアセンターでmbrolaを
たとえば、自分で作った文章をアナウンサーが読み上げてくれる。草野球のスターティングメンバーをウグイス嬢がアナウンスしてくれる。 こんな夢を実際にかなえてくれるパソコンソフトが汎用知的音声合成システム「ボイスソムリエ」です。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く