並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1262件

新着順 人気順

音声合成の検索結果321 - 360 件 / 1262件

  • 18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史

    近年では、AI技術や合成音声技術の進歩に伴って、まるで人間の声のような音声シミュレーションは目覚ましい発展を遂げています。しかし、18世紀のヨーロッパでも、人間の声をシミュレートするような技術や機械が数多く開発されていました。 “You Are My Friend”: Early Androids and Artificial Speech — The Public Domain Review https://publicdomainreview.org/essay/early-androids-and-artificial-speech/ 最初の「人間の機能を模した」アンドロイドが誕生したのは、1738年2月のこと。エンジニアのジャック・ヴォーカンソンがアントワーヌ・コワズヴォーの「フルートを演奏する羊飼い」をモデルに製作し、パリのサンジェルマン見本市で展示されたアンドロイドは、これまで

      18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史
    • AI歌声合成に「Synthesizer V AI」参入 AHSが発売へ 「Saki」「小春六花」などの音源も

      7月に発売した歌声合成ソフト「Synthesizer V Studio Pro」に、ディープニューラルネットワーク(DNN)を活用した歌声合成機能を追加。従来は、あらかじめ収録しておいた歌声データを加工して切り貼りする「素片接続」という方式で歌声を合成していた。既存ユーザーには無償でアップデートする。 音楽制作ソフト(DAW)との連携機能を搭載。音声の品質を抑えることで、AIによる歌声の合成スピードを上げる機能も追加した。 AHSはすでに別のAI音声合成ソフト「CeVIO AI」用音源の発売も発表しており、AIによる歌声合成ソフトの取り扱いは2例目になる。AHSの尾形友秀代表は「両者は使い勝手がだいぶ違う。互いに補いながら使えると思う」としている。 Synthesizer V AI専用音源として「Saki」「小春六花」も発売する予定。SakiはSynthesizer V Studio Pr

        AI歌声合成に「Synthesizer V AI」参入 AHSが発売へ 「Saki」「小春六花」などの音源も
      • Ado本人も驚く「唱」ボカロカバーが驚異の完成度 歌い手とボカロの技術的相似形

        歌い手のAdoさんが9月にリリースした「唱」。 9月にBillboard Japan Hot 100で1位を獲得するなど、今なお絶大な人気を誇る楽曲ですが、そのボーカロイドカバー楽曲が注目を集めています。 投稿したのはボカロPのCreuzerさん。Adoさんがラジオで「過去一難しい」と語った「唱」を見事にカバー。 Adoさんの多彩で独特な歌唱を、音声合成ソフト「Synthesizer V」で再現しつつ、自然な聴き心地に仕上げています。 Adoさんは11月1日、自身のXに「唱」の「歌ってみた」動画を集めたYouTubeプレイリストを公開。注目の作品を挙げる中で、ニコニコ動画の作品としてCreuzerの動画を別枠で紹介しています。 「唱」の歌ってみたで、注目👀したいと思った作品を集めました!!https://t.co/XhRO6TVIp0 新しい出会いをお楽しみください!そして歌ってみたをし

          Ado本人も驚く「唱」ボカロカバーが驚異の完成度 歌い手とボカロの技術的相似形
        • 「華麗なるセキュリティ対策」IPAがアニメ公開 “ローウェイ姉妹”がてんやわんや

          IPA(情報処理推進機構)は3月6日、情報セキュリティ対策の周知に向け、アニメ映像「華麗なる情報セキュリティ対策」全8編を同月中旬に公開すると発表した。先行して、内容をまとめたダイジェスト版も公式Twitterアカウントで公開している。 アニメのテーマは「企業の従業員向けの日常における情報セキュリティ対策」。登場人物は、架空の企業・ローウェイ社の社長「ローウェイ瑛美」と、妹で秘書の「ローウェイ美幸」。セキュリティ意識が低い彼女たちを、情報システム管理者「情ヶ崎」が指導するストーリーという。 なお、公式に説明はないが「ローウェイ」は「ろうえい」から来ていると思われる。 関連記事 「うぎゃ~! 情報漏えいですわ~!」 ITお嬢様と学ぶ、フィッシング詐欺に遭遇したときの対処法 ITお嬢様がフィッシング詐欺に遭遇したようです。 邪神ちゃん、トークソフトになる 「このソフトが売れれば私は大金持ちです

            「華麗なるセキュリティ対策」IPAがアニメ公開 “ローウェイ姉妹”がてんやわんや
          • VALL-E

            Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers [Paper] Chengyi Wang*,   Sanyuan Chen*,   Yu Wu*,   Ziqiang Zhang,   Long Zhou,   Shujie Liu, Zhuo Chen,   Yanqing Liu,   Huaming Wang,   Jinyu Li,   Lei He,   Sheng Zhao,   Furu Wei Microsoft Abstract. We introduce a language modeling approach for text to speech synthesis (TTS). Specifically, we train a neural codec language m

            • リアルな人間っぽい合成音声を生成するAI 「えー」「あぁ」「うん」なども再現 YouTubeやPodcastで学習

              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米カーネギーメロン大学に所属する研究者らが発表した論文「A Vector Quantized Approach for Text to Speech Synthesis on Real-World Spontaneous Speech」は、より人間に近い会話の音声合成を生成できる学習モデルを提案した研究報告である。 テキストから音声合成を生成するText-to-Speech(TTS)システムは、合成した音声の品質を大幅に向上させた。しかし、TTSシステムのトレーニングに使用する標準コーパスは、ほとんどの場合、制御された環境で録音した読み上げや演技の音声

                リアルな人間っぽい合成音声を生成するAI 「えー」「あぁ」「うん」なども再現 YouTubeやPodcastで学習
              • 最新AIでついにラップも実現、まだまだ進化するSynthesizer Vの技術背景と目指す方向|DTMステーション

                すでに使っている方も多いと思いますが、2023年6月21日にSynthesizer Vの最新バージョン1.9.0が正式にリリースされています。これまでのSynthesizer V Studio Proのユーザーであれば、誰でも無料でバージョンアップできるようになっているのがスゴイところですが、この1.9.0ではついにラップに対応するという、音声合成・歌声合成の世界の中で初の試みが実現されています。これまでラップを音声合成ソフトや歌声合成ソフトで、無理やり実現させようと打ち込みを頑張ってみた経験のある方も少なくないと思います。でも、なかなか思うようにいかなかったのが現実ではないでしょうか? そのラップを今回のSynthesizer V 1.9.0ではついに現実のものにしたのです。現時点においては英語のラップと中国語のラップへの対応で、日本語にはまだ対応できていないようですが、現在準備中なので

                  最新AIでついにラップも実現、まだまだ進化するSynthesizer Vの技術背景と目指す方向|DTMステーション
                • 機械の声で気持ちよくなれるか ささやきAIで「メイドさんASMR」動画作ってみた

                  「ASMR動画」をご存じだろうか。YouTubeでは主に「脳がゾクゾクするような気持ちいい音を収録した動画」という意味で使われる言葉だ。「包丁でいろんなものを切る音」「耳かきの音」「ささやき声」などを収めた動画が人気ジャンルになっている。そんなASMRにぴったりの“ささやくAI”が登場したので、早速動画にしてみた。 シナリオは普段からASMR動画を楽しんでいるという同僚に頼んで書いてもらった。タイトルは「あなたのことを世界一愛している一途メイドと密着添い寝ASMR」。登場人物はメイド、聞き手は女主人とのこと。後半が少し過激だったためカットしている。 「あなたのことを世界一愛している一途メイドと密着添い寝ASMR」 シナリオ:吉川大貴 コメント「音声作品らしさを出しつつ、プラトニックラブにも見えるようにしました」 いかがだろうか。普段からASMR動画を聞いている人であれば「これは確かにASM

                    機械の声で気持ちよくなれるか ささやきAIで「メイドさんASMR」動画作ってみた
                  • 人力VOCALOIDの作り方メモ(切り貼り人力ボカロ用):メカブ(メカPのブロマガ) - ブロマガ

                    ※突貫工事で書いたので随時内容修正します。 ■はじめにこの記事で紹介する手法は ・UTAUは使いません。いわゆる切り貼り人力ボカロです。 ・アカペラ音源を素材にします。セリフ音源は(ほとんどの場合)使いません。 ・あくまで一つの手法です。どれが正解とかはなく、人力ボカロは全ての道が邪道です。 ■既に人力分かってる人向けの説明加工を減らすため切り出しを多くして、ピッチ編集後の耳選別に重きを置くスタイルです。 時間がかかるので切り出し効率を上げる小技を使っています。 オレンジ字のポイント、青字の小技らへん、参考になれば幸いです。 ■作品例 ■0. 用意するもの○素材・原曲のカラオケ音源、アカペラ音源 ・歌うキャラ(歌手)のアカペラ音源=素材曲 ・素材曲の歌詞テキスト○ソフト・アカペラやカラオケを作るソフト ・音源編集ソフト(REAPER等) ・ピッチ編集ソフト(Vocal Shifter, M

                      人力VOCALOIDの作り方メモ(切り貼り人力ボカロ用):メカブ(メカPのブロマガ) - ブロマガ
                    • 言語学習アプリDuolingoがどう機械学習を活用しているか

                      ゲーム化言語学習の代名詞ともいえる、ピッツバーグを拠点とする新興企業のDuolingoは、コロナ流行の最中の今年3月に世界的に新規ユーザーが101%増加し、最速の成長期を迎えた。単に自分の手に多くの時間を持っている人から、パンデミックの学校の間に追いつこうとしている学生まで、このアプリは大きな恩恵を与えている。 Duolingoは、AIベースの言語学習プラットフォームを提供している。Duolingoは、フランス語やタミル語からハワイ語やナバホ語などの絶滅危惧種の言語まで、32以上の言語コースを提供しており、3億人以上のユーザーに利用されている。 Duolingoの特徴は、ポイント制のリワードシステムにより学習体験をゲーム化し、ユーザーの学習意欲を高め、習熟度に合わせて学習を進めていくというパーソナライズされた学習アプローチにある。米国務省によると、フランス語やイタリア語のような1つの言語を

                        言語学習アプリDuolingoがどう機械学習を活用しているか
                      • 超知能AIが人類を滅ぼす…? - デマこい!

                        超知能AIの暴走リスク このブログではAIの歴史と現在、そして近未来について考察してきました。 今回の記事では、もう少し先の未来――AIが人間と同等かそれ以上の知能を身に着けて、「超知能」となった時代の話をしましょう。 超知能AIの暴走は、サイエンス・フィクションでは定番のテーマの1つです。 たとえば映画『ターミネーター』は、自我に目覚めたAI「スカイネット」が人類に反旗を翻し、機械の軍隊で襲い掛かるという設定でした。映画『マトリックス』は、人類は薬漬けで眠らされて、一生を夢を見ながら過ごすという設定でした。機械の目的は、人体から出る微弱な電流を電源として利用することでした。ビデオゲーム『デトロイト:ビカム・ヒューマン』では、奴隷として扱われていたアンドロイドたちが立ち上がり、人権を主張するという物語が描かれました。 これらのシナリオは、どれほど現実味があるのでしょうか? じつを言えば、私

                          超知能AIが人類を滅ぼす…? - デマこい!
                        • 「それってあなたの感想ですよね」女児の流行語に 「ちゃお」読者に聞くランキングで上位

                          漫画雑誌「ちゃお」読者の間で流行している言葉は──小学館は5月19日、こんな調査結果を発表した。「クラスや友達の間ではやっている言葉」を聞いたところ、3位にひろゆき(西村博之)さんの「それってあなたの感想ですよね」が入った。 1位は「それな」、2位は「マジで?」、4位は「草」、5位は「かわちい」、6位は「やばい」、7位は「しらんけど」、8位は「ギャルピース」、9位は「ぴえん」、10位は「ガチで」だった。25位までには「ちいかわ」(11位)、「かわいくてごめん」(16位)、「おいしいヤミーかんしゃかんしゃ」(23位)なども入った。 小学館は結果について「YouTuberが考案したネタやお笑い芸人のYouTubeがきっかけで話題となったリズムネタで使われている言葉が目立つ。イマドキの女子小学生の会話や言葉は、話題の動画コンテンツがトレンドの源になっている可能性が高い」と分析している。 調査は4

                            「それってあなたの感想ですよね」女児の流行語に 「ちゃお」読者に聞くランキングで上位
                          • 合成音声を使ってboard(SaaS)のチュートリアル動画を制作した話(VOICEPEAKとGoogle Cloud Text-to-Speech) - ヴェルク - IT起業の記録

                            boardというSaaSのチュートリアル動画を合成音声を使って制作しているので、その話を書いていきます。 個別相談会のデモとチュートリアル動画 以前書いた board(SaaS)個別相談会の変遷 の中で少し触れたのですが、2021年に、個別相談会の中でやっていたデモをベースに、チュートリアル動画を制作しました。 個別相談会では、業務の流れに沿って基本的な操作を一通り説明していくデモを行っていたのですが、途中に質問が挟まることも多く、そうすると、全体で30〜40分ほどかかってしまうことも多くありました。 個別相談会は1時間枠なので、そのうち40分をデモで使うのは、時間の使い方としてもったいないなという課題感がありました。また、弊社は営業など外向けに活動するメンバーがいないため個別相談会はすべて僕がやっており、個別相談会を開催できる回数にも限りがありました。 一方で「お試しする前にとりあえずデ

                              合成音声を使ってboard(SaaS)のチュートリアル動画を制作した話(VOICEPEAKとGoogle Cloud Text-to-Speech) - ヴェルク - IT起業の記録
                            • 喋り出しを高速化したり現実の情報とリンクしてAIエージェントを進化させる|ねぎぽよし

                              ChatGPT APIが公開されてからいろんな人が自分のキャラクターとおしゃべりしたりAITuberが一歩先に進化したりと面白いものがたくさん見れてとても嬉しいです! AI界隈の情報密度が高すぎて↓の記事を書いたのが2日前というのが信じられませんね。 さてChatGPT APIでみんなのキャラクターが知能を持って喋れるようになったわけですが、自分が作ったものを振り返ってみたらまだまだ改善の余地がいっぱいありそう+もうちょっとできることが増えてほしいなと思い、自分のAIエージェントに追加で実装をしてみました。 そこで実装した内容について概要をお話します。 AIの喋り出しを高速化するまず気になったのは自分とAIエージェントのコミュニケーションにおいて待たされる時間が非常に長いことです。 この間を整理すると、以下のような時間がかかります。 1.自分の発話をテキストに起こす時間 2.そのテキストを

                                喋り出しを高速化したり現実の情報とリンクしてAIエージェントを進化させる|ねぎぽよし
                              • “千葉市の市章が初音ミク似!?” 注目いかしあちこちでPR | NHK

                                シンボルマークの市章のデザインがバーチャルアイドルの「初音ミク」と似ていると話題になった千葉市。 市はこの注目度を生かして、まちのあちこちに初音ミクを中心に若者に人気のキャラクターのデザインを取り入れて、PRに努めています。 バーチャルアイドルの「初音ミク」は、音声合成ソフトのキャラクターとして若者を中心に日本だけでなく世界中で人気を集めています。 その「初音ミク」とデザインが似ているとSNSなどで話題になったのが千葉市の市章です。 月や星、そして千葉の「千」という漢字を模したデザインになっています。 この市章が「初音ミク」と似ているか、街で市民に聞いたところ、多くの人が最初は似ていることに気付かない様子でしたが「市章の上の部分の丸い形が初音ミクの頭で左右の月が髪の毛で」などと少し説明すると、すぐに気付いて納得した様子でした。 千葉市では、この注目度を生かそうと毎年1日限定で市のホームペー

                                  “千葉市の市章が初音ミク似!?” 注目いかしあちこちでPR | NHK
                                • 中学生が将来なりたい職業、「YouTuber」「eスポーツプレイヤー」が引続き上位に ゲーム実況者やボカロPなども新たにランクイン

                                  ソニー生命が中高生の男女を対象に行った「将来なりたい職業」の2020年調査結果にて、これまで上位だったYouTuberやプロeスポーツプレイヤーに加えて、新たにゲーム実況者やボカロPなどが上位にランクインしました。 中学生男女の結果では「ゲーム実況者」や「ボカロP」が新たに登場 調査では全国の中学生と高校生、男女それぞれの将来なりたい職業を調べています。対象人数は1000人で、中学生が200人、高校生が800人です。 中学生の結果では、男女ともに「YouTuberなどの動画投稿者」が上位にランクイン。2019年に引き続き男子では1位となりました。女子では2019年の7位から2位にランクが上昇しています。 また、2019年では上位に入らなかった「ボカロP(音声合成ソフト楽曲のクリエイター)」が登場しました。男子では10位、女子では5位です。 男女ともにTOP5に大きな変化はありませんが、男子

                                    中学生が将来なりたい職業、「YouTuber」「eスポーツプレイヤー」が引続き上位に ゲーム実況者やボカロPなども新たにランクイン
                                  • ニコニコで100万回以上再生されたボカロ動画を大公開!2007年-2020年を年代別に約700曲をリストアップ

                                    2007年、音声合成ソフト初音ミクがリリースされ、ニコニコ動画に「VOCALOID(ボカロ)」という一大ジャンルが誕生した。 ボカロPとよばれる楽曲制作者によるオリジナル曲や、その原曲を使った「歌ってみた」、「演奏してみた」、「オリジナルPVをつけてみた」など数多くの派生動画が投稿され、 2020年12月1日現在、ニコニコ動画で「VOCALOID」と検索すると、約90万本以上の動画が投稿されていることが分かる。 VOCALOIDを使ったオリジナル楽曲、いわゆる「ボカロオリジナル曲」は、10万回再生を突破すると「VOCALOID殿堂入り」、100万回再生を突破すると「VOCALOID伝説入り」というタグが付けら、人気ボカロ曲のひとつの基準となっている。 この記事では、2020年11月1日時点で100万回再生を突破したボカロオリジナル曲を全てまとめて紹介する。2007年から2020年まで、再生

                                      ニコニコで100万回以上再生されたボカロ動画を大公開!2007年-2020年を年代別に約700曲をリストアップ
                                    • 第63回ビッグハンドタウンシェル芸勉強会の問題と解説 - NTT Communications Engineers' Blog

                                      はじめに シェル芸勉強会について 問題と解説 Q1(@butackle66さんから) 解答例1 解答例2 Q2(@butackle66さんから) 解答例1 解答例2 Q3 解答例1 解答例2 Q4 解答例1 解答例2 Q5 解答例 Q6 解答例 LT LT1 curlでTelegram botを操作 (やべえ @yabeenico) LT2 音声合成してみよう (たいちょー @xztaityozx_001) おわりに はじめに こんにちは。デジタル改革推進部データドリブンマネジメント推進部門の江川尋喜 (Hiroki Egawa / @yabeenico) です。 第63回ビッグハンドタウンシェル芸勉強会が2023年02月25日に開催されました。 今回は NTT Com のオフィスビル、大手町プレイスを会場提供させていただきました。 このブログエントリでは、勉強会で出題された問題の解答と解

                                        第63回ビッグハンドタウンシェル芸勉強会の問題と解説 - NTT Communications Engineers' Blog
                                      • AI歌声ライブラリ「LAUGH DiAMOND (ラフダイヤモンド)」プロジェクト始動!

                                        ひょんな事から、とある芸能事務所に入ることになり、 篁 響季、風祭 朝陽、小紫 桃果、山田 花音らは ユニット「LAUGH DiAMOND」を結成することになったが、デビューどころか、自分たちの曲も用意してもらえず目下日々自主練(≒放置)状態の憂き目に遭っている。 あまりにも放置されているため、自分たちで路上ライブを試みるが…。 そしていつの日か、ライブハウスでたくさんの曲で ライブをやることが LAUGH DiAMOND の目標に… そんな彼女たちに、 あなたの曲を歌わせてあげてくれませんか? 「LAUGH DiAMOND」プロジェクトとは? 最新のディープラーニング技術を駆使したAI歌声ライブラリでもあり、 「篁 響季(たかむら・ひびき)」「風祭 朝陽(かざまつり・あさひ)」 「小紫 桃果(こむらさき・ももか)」「山田 花音(やまだ・かのん)」 で結成された夢見るシンガーユニット「LA

                                          AI歌声ライブラリ「LAUGH DiAMOND (ラフダイヤモンド)」プロジェクト始動!
                                        • 「AIが世界中の仕事を奪う」の(当面は)誤解を正す。日本で評価されなさすぎる名著『AI世界秩序』の慧眼【連載】高須正和の「テクノロジーから見える社会の変化」(23)|FINDERS

                                          LIFE STYLE | 2022/04/11 「AIが世界中の仕事を奪う」の(当面は)誤解を正す。日本で評価されなさすぎる名著『AI世界秩序』の慧眼【連載】高須正和の「テクノロジーから見える社会の変化」(23) 写真右は米TIME誌が実施する「100 Most Influential People(最も影響力がある100人)」の選... 写真右は米TIME誌が実施する「100 Most Influential People(最も影響力がある100人)」の選出記念イベント(2019年)に出席した際の李開復 Photo by Shutterstock(写真右のみ) 李開復(カイフ・リー)『AI世界秩序』は、AI研究でもビジネスでも第一人者である筆者が、「今のAIにできること、できそうなこと、できないこと」を技術と社会実装の両面から総覧し、かつ技術屋が臆病になりがちな大胆な未来予測を行った名著

                                            「AIが世界中の仕事を奪う」の(当面は)誤解を正す。日本で評価されなさすぎる名著『AI世界秩序』の慧眼【連載】高須正和の「テクノロジーから見える社会の変化」(23)|FINDERS
                                          • ホーム

                                              ホーム
                                            • 電車内で耳にする「英語アナウンス」何て言ってる? 「融合してコンティニュー」とは | 乗りものニュース

                                              電車の車内で流れる英語放送、実際にどのような文章になっているのでしょうか。複雑な表現もあれば、日本語と異なる内容になっている場合もあります。 車内放送で学ぶ英語表現 グローバル化やインバウンド需要への対応のため、鉄道でも駅や車内で英語の案内放送を行う場面が増えてきました。その英語放送、実際にどのような文章になっているのでしょうか。もちろん日本語の放送内容と主旨は同じでしょうが、細部に違いが見られます。 通勤電車のイメージ(草町義和撮影)。 ●レア度1 ・「次は、○○、お出口は△側です」 The next station is Shibuya, station number JY20. The doors on the left (right) side will open. 【訳】次の駅は渋谷、駅番号JY20です。左(右)側の扉が、開きます。 ※「左側の扉」を「The doors on t

                                                電車内で耳にする「英語アナウンス」何て言ってる? 「融合してコンティニュー」とは | 乗りものニュース
                                              • NEUTRINO(歌声合成エンジン)とは (ニュートリノとは) [単語記事] - ニコニコ大百科

                                                NEUTRINO(歌声合成エンジン)単語 16933件 ニュートリノ 4.4千文字の記事 66 0pt ほめる 掲示板へ 記事編集 概要歌声合成手法の詳細について関連動画関連リンク関連項目脚注掲示板NEUTRINOとは、ニューラルネットワークを用いた歌声シンセサイザーである。 概要 楽譜データ(MusicXML形式)から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定し、実際の歌唱データからなる歌声ライブラリで合成するソフトウェア。 「NEUTRINO」との名称については、「まだ聞いたことのないような楽曲・ジャンルを開拓してほしいという思いを込めて名付けました。[1]」とのこと。 2020年2月22日にαテスト版のVersion.0.100が公開された。公開されると早速、NEUTRINOを用いて様々な楽曲を歌唱させた動画が複数のユーザーからニコニコ動画などで

                                                  NEUTRINO(歌声合成エンジン)とは (ニュートリノとは) [単語記事] - ニコニコ大百科
                                                • ニュータイプになった初音ミクはどこへ向かうのか  “VOCALOIDじゃないミク”の開発者に聞く

                                                  VOCALOIDの代名詞と言っても過言ではない「初音ミク」が、VOCALOIDとは別のソフトウェアとして登場した。これまでとは音質や機能も変わり、イメージイラストも新衣装にリニューアルされた彼女は、一体どこへ向かうのか。 11月27日、クリプトン・フューチャー・メディア(CFM)が歌声合成音源「初音ミク NT(ニュータイプ)」を発売した。これまでVOCALOID用の音源としてリリースしてきた初音ミクを、今回は自社開発のオリジナルソフト「Piapro Studio NT」用の音源として大きく作り替えている。 新型ミクはVOCALOID上では動かない。歌声を合成するエンジンも、VOCALOIDに使われているものではなく、産業技術総合研究所(産総研)と共同で新たに開発したものを採用した。 オリジナルの歌声合成エンジンを作るに至った経緯や、初音ミクの新規イラストについて、開発者であるCFMの佐々木

                                                    ニュータイプになった初音ミクはどこへ向かうのか  “VOCALOIDじゃないミク”の開発者に聞く
                                                  • AI技術でリアルな歌声を再現できる音声合成ツール「CeVIO Pro (仮)」α版が無料公開/商用可のボイスライブラリも付属

                                                      AI技術でリアルな歌声を再現できる音声合成ツール「CeVIO Pro (仮)」α版が無料公開/商用可のボイスライブラリも付属
                                                    • 東大FoundX、スタートアップの基礎を学べるオンラインスクールを無料開講——東大IPCの協力で、修了者にはアイデア補助費用の提供も - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                      ワイクル代表取締役の角征典氏、FoundX ディレクターの馬田隆明氏 Image credit: FoundX 東京大学産学協創推進本部のスタートアップ支援プログラム「東京大学 FoundX」は8日、スタートアップの基礎を学べるオンラインスクール「FoundX Online Startup School」の提供を開始した。MOOC(Massive Open Online Coursesite) 形式で提供される。FoundX が東京大学の卒業生・研究生・学生の起業を支援しているのと対照的に、このオンラインスクールでは、これから起業を考える人やスタートアップに新たに入社した従業員を主な対象としている。希望者は誰でも、デスクトップ、タブレット、モバイルで無料利用が可能だ。 FoundX Online Startup School のコンテンツは、FoundX ディレクターの馬田隆明氏と、アジャ

                                                        東大FoundX、スタートアップの基礎を学べるオンラインスクールを無料開講——東大IPCの協力で、修了者にはアイデア補助費用の提供も - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                      • ChatGPTを開発したOpenAIが「AIの壊滅的なリスク」を分析して人類を保護するための専門チームを結成

                                                        近年はAI開発が急速に進展する一方で「AIがもたらすリスク」を懸念する声も高まっており、チャットAIのChatGPTや画像生成AIのDALL-E 3を開発したOpenAIのサム・アルトマンCEOも、「AIの規制は不可欠」と主張しています。新たにOpenAIが、既存のAIモデルを超える性能を持つであろう将来の「フロンティアAIモデル」がもたらす壊滅的なリスクを管理するため、「Preparedness(準備)」と名付けられた新たな専門チームを結成したと発表しました。 Frontier risk and preparedness https://openai.com/blog/frontier-risk-and-preparedness OpenAI forms team to study ‘catastrophic’ AI risks, including nuclear threats |

                                                          ChatGPTを開発したOpenAIが「AIの壊滅的なリスク」を分析して人類を保護するための専門チームを結成
                                                        • 余命わずかな科学者が世界初の完全サイボーグに!?(ニューズウィーク日本版) - Yahoo!ニュース

                                                          難病により余命わずかな61歳の英国人科学者が「世界初の完全サイボーグ」に変身しようとしている。 動画:「ピーター2.0」の可能性を追求するスコット=モーガン博士 30年にわたって政府機関や民間企業で活躍したのち、2007年以降、自身の研究活動に専念していたピーター・スコット=モーガン博士は、2017年、「運動ニューロン疾患(MND)」の末期であると診断された。運動ニューロン疾患は、2018年3月に死去した英理論物理学者のスティーブン・ホーキング博士が闘い続けた病としても知られ、運動神経細胞がゆっくりと変性し、重要な機能や随意運動を制御する神経システムの能力が次第に失われていく難病だ。 ■ 「これが『ピーター1.0』としての最後の投稿です」 スコット=モーガン博士は、運動ニューロン疾患と診断された後、研究プロジェクト「ラディカル・ディスアビリティ・プロジェクト」を立ち上げ、自ら実験台となって

                                                            余命わずかな科学者が世界初の完全サイボーグに!?(ニューズウィーク日本版) - Yahoo!ニュース
                                                          • AIカンパニー内に新たに設置された「Computer Vision Lab」が目指す未来

                                                            LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog 2021年11月10日・11日の2日間にわたり、LINEのオンライン技術カンファレンス「LINE DEVELOPER DAY 2021」が開催されました。特別連載企画「DEVDAY21 +Interview」では、登壇者たちに発表内容をさらに深堀り、発表では触れられなかった関連の内容や裏話などについてインタビューします。今回の対象セッションは「LINEのコンピュータビジョン研究-その現状と将来」です。 音声認識や音声合成、自然言語処理などのAI技術について研究開発を進めているLINE AIカンパニーは、画像認識に特化したR&D部門である「Computer Vision Lab」を2021年7月に立ち上げました。Computer

                                                              AIカンパニー内に新たに設置された「Computer Vision Lab」が目指す未来
                                                            • Unity でリアルタイムにリップシンクを行うプラグインを更に作り直してみた - 凹みTips

                                                              はじめに 前回、リップシンクするプラグインを作り直してみた記事を書きました。 tips.hecomi.com 色々とご反響を頂いたのですが、しかしながら母音推定の性能がいまいちでした。第 1 、第 2 フォルマントという周波数スペクトルの 1 つ目、2 つ目のピークを検出する方法を採用していたのですが、このピークの検出が周波数スペクトル包絡を得るために使っている LPC 解析のパラメタに大きく依存したり、またノイズや声の高さによって容易にピークが別の場所に移ってしまったりといったことが原因でした。 そこで手法を変え、MFCC(メル周波数ケプストラム係数)を求める方式へと変更しました。 speechresearch.fiw-web.net これはディープラーニング以前の音声認識に使われていたもののようで、母音だけでなく子音も含む音素の検出が可能な特徴量になります。以前の手法と異なりピッチ変化

                                                                Unity でリアルタイムにリップシンクを行うプラグインを更に作り直してみた - 凹みTips
                                                              • AI音声プラットフォーム「CoeFont」、最高精度のAI音声モデルのβ版を提供開始

                                                                AI音声プラットフォーム「CoeFont」、最高精度のAI音声モデルのβ版を提供開始〜ロゴリニューアルとCoeFontが作り放題となる「Businessプラン」の2ヶ月間無料トライアルも提供開始~ 株式会社CoeFont(本社:東京都港区、代表取締役:早川 尚吾、以下当社)は、AI音声プラットフォーム「CoeFont」の最高精度モデルのβ版を2022年8月22日(月)より提供開始いたします。今後は、順次、すべてのCoeFontに当モデルを適用することで、人が発する音声と遜色ない最高精度のAI音声を誰でも作成、利用可能となります。また、より声の社会インフラになるべく、ロゴのリニューアルも行い、あわせてAI音声を利用しやすくするために「Businessプラン(月額5,000円 / 1アカウント〜)」の2ヶ月間無料トライアルも開始いたします。 AI音声プラットフォーム「CoeFont」、最高精度

                                                                  AI音声プラットフォーム「CoeFont」、最高精度のAI音声モデルのβ版を提供開始
                                                                • テキストの読み上げソフト「SofTalk」がメジャーバージョンアップ/オリジナル音声合成エンジンを搭載、「UTAU」音源にも対応

                                                                    テキストの読み上げソフト「SofTalk」がメジャーバージョンアップ/オリジナル音声合成エンジンを搭載、「UTAU」音源にも対応
                                                                  • ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。

                                                                    ※つくよみちゃんイラスト素材:花兎*さん 概要(忙しい人向け) 手軽にローカル LLM (音声・立ち絵付き) と会話できるソフトウェア ez-chat-llm を開発しました。動作の様子は動画 (https://www.nicovideo.jp/watch/sm43196446) からご覧いただけます。 ez-chat-llm は、GitHub のリポジトリ (https://github.com/offtoung/ez-chat-llm) から利用できます。また、Google Colab Pro をお使いの方は、ノートブックから簡単に試せます。 副産物として、Pythonから簡単に利用できる音声合成ライブラリ eztts ができました。なんと、このために音声合成モデルをフルスクラッチで学習するという手の込みようです。 上記の GitHubリポジトリをクローンしたディレクトリに入り、次のよ

                                                                      ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。
                                                                    • 記者たちはパスワードをどう管理しているのか? またはドクターフィッシュの秘密

                                                                      記者たちはパスワードをどう管理しているのか? またはドクターフィッシュの秘密:記者トーーク!(1/4 ページ) テクノロジー関連のあれやこれやについて、ITmedia NEWS編集部のメンバーが、あーでもない、こーでもないとよもやま話を繰り広げる「記者トーーク!」。第1回は、「パスワードを紙で保存するのは危険? Twitter上で賛否 安全な管理方法をIPAに聞いた」についてです。この記事を読んで、あれ、そういえばみんなパスワードってどう管理してるんだろう? と思いませんでしたか。では、編集部の人たちはパスワードにどう向き合っているのでしょうか。 メンバーは6人。ITmedia NEWS編集部の編集長キーチ、Web・雑誌双方での編集経験を持つサイトウ、AI音声合成技術を使った楽曲制作などが趣味のタニイ、ギリギリ“Z世代”の若手記者ヨシカワで話し合ってみました。 サイトウ 今回のお題は、「パ

                                                                        記者たちはパスワードをどう管理しているのか? またはドクターフィッシュの秘密
                                                                      • Kindle に入っているビジネス書をオーディオブック化したい

                                                                        TL; DR ゴールデンウィークの自由研究として、 Kindle 書籍を音声化するアプリケーションを作って公開したよ 手元の PC で書籍部分を抜き出して画像化するよ。 macOS では Automator を使って Kindle.app を自動でページめくりさせてスクショをとるよ できた PDF を GCP の Cloud Storage にアップロードすると、 Cloud Functions が起動して Vision API + Text-to-Speech に突っ込んで MP3 ができあがるよ 著作権の問題から Web サービスとして公開はしないけど、自分用に環境構築して使えるよ。慣れてない人でも30分〜1時間くらいでできると思うよ 一度環境構築すれば、あとは1冊10分以内、費用もほぼ無料〜1冊最大200円程度で好きな Kindle 書籍を音声化できて、積ん読消化が捗るよ はじめに

                                                                          Kindle に入っているビジネス書をオーディオブック化したい
                                                                        • AIとVTuberの現在地 - AITuberとは何か?

                                                                          みなさんはAITuberというのをご存知だろうか? 2023年の年明けにSNSで話題になり、もしかしたら耳にしたことのある方も少なくないと思います。「AI」と「VTuber」を組み合わせた造語で、アバター技術とAI技術を活用して、さまざまな新しい表現を生み出しているのが特徴です。今記事では、国内外の事例について紹介しながら、刻一刻と進化を続けているAITuberの現状について解説していきます。 「Neuro-sama」が与えた衝撃 年初からいきなり話題になったのは、Neuro-samaというVTuber的な活動をするAI(AITuber)です。海外開発者Vedalさんが開発したもので、Twitchでの配信をメインにしています。 2022年の末に活動し始めた所、瞬く間にVTuberの中心人物の1人になってしまいました。アバターは、Live2D「桃瀬ひより」という比較的見た目の落ち着いたサンプ

                                                                            AIとVTuberの現在地 - AITuberとは何か?
                                                                          • 【連載】中山淳雄の「推しもオタクもグローバル」第39回 『初音ミク』15年のキセキ:ネットとボカロとアニメを融合させた声の楽器 | gamebiz

                                                                            2007年8月に生まれた初音ミクは、ニコニコ動画というプラットフォームにのって爆発的に普及したキャラクターである。だがおよそ他一般の「キャラクター」と一緒にしてしまってよいのかという呵責もある。なぜなら初音ミクの楽曲も、初音ミクのイラストも何万・何十万と存在するからだ。そしてまた初音ミクを通じて育ったボカロPは米津玄師からまふまふ、YOASOBIに至るまで現在の音楽業界を牽引する一大勢力になっている。この初音ミク15年を改めて振り返ることで、ボカロという“異質な"キャラクタービジネスについて考えてみたい。今回は北海道・札幌を拠点とするクリプトン・フューチャー・メディア社に話を伺った。 ※「VOCALOID(ボーカロイド)」および「ボカロ」はヤマハ株式会社の登録商標となっている ――:自己紹介からお願いいたします。 伊藤博之と申します。1995年にクリプトン・フューチャー・メディア(以後CF

                                                                              【連載】中山淳雄の「推しもオタクもグローバル」第39回 『初音ミク』15年のキセキ:ネットとボカロとアニメを融合させた声の楽器 | gamebiz
                                                                            • 公道走って最短30分 スーパーの商品を自動配送ロボットが届けるサービス、つくば市で

                                                                              パナソニックホールディングス、楽天グループ、西友、つくば市の4者は5月26日、自動配送ロボットの公道走行によりスーパーの商品を最短30分で届ける配送サービスを茨城県つくば市内で提供すると発表した。配送料は1回110円。 スーパーマーケット「西友つくば竹園店」で取り扱う生鮮食品や日用品など2000点以上の商品を注文から最短30分でロボットが配送する。対象は市内1000世帯で、5月28日から7月30日までの毎週土曜日に実施する。 利用者は楽天が開発したスマートフォン向けの専用サイトでオーダー。配送中は専用サイトでロボットの位置や到着予定時刻を確認できる。到着するとSMSや電話(自動音声)で通知が届く。 配送ロボットはパナソニックの「X-Area Robo」(クロスエリア ロボ)を使用する。つくば市から約60km離れた「Panasonic Laboratory Tokyo」(東京都中央区銀座)か

                                                                                公道走って最短30分 スーパーの商品を自動配送ロボットが届けるサービス、つくば市で
                                                                              • OpenAI「ChatGPT API」を発表、GPT-3.5モデルと比べて10分の1の料金

                                                                                米OpenAIは3月1日(現地時間)、「ChatGPT API」と「Whisper API」を発表した。 ChatGPT APIでは、OpenAIが現在ChatGPT製品で用いているモデルと同じ「gpt-3.5-turbo」を利用できる。料金は1000トークンあたり0.002ドル。システム全般にわたる一連の最適化によって、2022年12月からChatGPTの計算コストを約90%削減しており、GPT-3.5モデル(Davinci:1000トークンあたり0.02ドル)の10分の1の料金に抑えた。また、従来のGPTモデルが一連のトークンとして非構造化テキストを消費していたのに対して、ChatGPTモデルはChatML(Chat Markup Language)という新フォーマットによってメタデータとともに一連のメッセージとしてChatGPT APIにテキストを供給する。 すでに、いくつかのパート

                                                                                  OpenAI「ChatGPT API」を発表、GPT-3.5モデルと比べて10分の1の料金
                                                                                • 音声合成してみよう

                                                                                  第63回シェル芸勉強会のLTで使った資料です

                                                                                    音声合成してみよう