並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 1262件

新着順 人気順

音声合成の検索結果201 - 240 件 / 1262件

  • ドコモ、人気声優の「声」をAI合成&提供するサービス

      ドコモ、人気声優の「声」をAI合成&提供するサービス
    • 無限にしゃべる「AIひろゆき」爆誕 本人っぽい声で年中無休YouTubeライブ GPT-3活用で質問にもそれっぽく回答

      AI音声合成サービスを提供するCoeFont(東京都港区)は3月14日、匿名掲示板「2ちゃんねる」の開設者・西村博之(ひろゆき)さんのようなコメントを、ひろゆきさんのような声で発し続けるAIを開発したと発表した。YouTube上で24時間365日質問に答え続けられるという。まずは16日午後6時から6時間、専用のチャンネルでテスト配信する。 米OpenAIの「ChatGPT」にもマイナーチェンジ版が搭載されている自然言語モデル「GPT-3」を活用した。ひろゆきさんがしゃべりそうなことを教えたAIでテキストを生成。CoeFontが開発した、ひろゆきさんの声を再現した音声合成AIで読み上げる仕組み。 YouTubeのライブ配信では、コメントでの質問に応じてテキストを生成し、それを読み上げる。配信画面には、AI画像生成技術を使って作成したひろゆきさんの画像を使用。読み上げの内容に応じた画像を用意し

        無限にしゃべる「AIひろゆき」爆誕 本人っぽい声で年中無休YouTubeライブ GPT-3活用で質問にもそれっぽく回答
      • 無料のAI音声合成ソフト「VOICEVOX」公開。商用利用も可

          無料のAI音声合成ソフト「VOICEVOX」公開。商用利用も可
        • 小学館世界J文学館 | 小学館

          読めるよ! アカウントの登録時にできたインターネット上の「マイ本棚」には「小学館世界J文学館」に収録されている125冊の本が並んでいて、紙の本がなくてもそこから読むことができるんだ。 「小学館世界J文学館」は、NetflixやSpotifyと同じようにインターネットからリアルタイムでデータを配信するストリーミング形式だから、ダウンロードはできないよ。そのかわりデータを端末に残さないので端末の容量に負担をかけないんだ。 J文学館の音声自動読み上げ機能は、視覚障害や読字障害など、文字による読書が困難な方へのアシストを目的とした機能なんだ。ナレーターや声優が本を朗読するオーディオブックとは違って、AIが文章を解析して、コンピュータによる音声合成で本文を読み上げてくれるよ。できるだけ正しく自然な読み上げが実現できるように努力しているよ。(※現時点では、読み上げ内容やイントネーションに、誤りや不自然

            小学館世界J文学館 | 小学館
          • 無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox) | テクノエッジ TechnoEdge

            「VOCALOID β-STUDIO」の試用申し込み受け付けが開始されたという記事を書くとともに、実際に申し込みもしていました。リリース前の協力者による作例が少しずつ公開されてきた23日、初回受付分からの抽選が行われ、筆者は運良く当選しました。 当選の案内著名ボカロPで外れた方もいらしたようなので、かなりの難関だった模様ですが、せっかく試す機会を得られたので、まずはインプレッションを書いてみようと思います。 Cubaseユーザー以外の使い勝手VOCALOIDを開発するヤマハにとって、Cubaseを開発している独Steinbergは子会社。ヤマハのDAWにはCubase LEのライセンスが付属するなど、強い連携をしています。VOCALOIDと連動するVOCALOID Editor for Cubaseも早くから提供されていて、「VOCALOIDを使うならCubase」となるのは当然のことでし

              無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox) | テクノエッジ TechnoEdge
            • AI音声のCoeFontが、ゆっくり実況プレイ動画編集ソフトで使えるようになった!|DTMステーション

              AI技術の進化で、ここ1、2年で急激な性能向上を実現している音声合成の世界。まさに機械が読んでいるのか、人間が読んでいるのか区別がつかないレベルになってきているわけですが、ここにきて、また面白い活用例が登場してきました。いわゆる「ゆっくり実況動画」を作成するフリーウェア「ゆっくりMovieMaker4」で、AI音声合成で人気のCoeFontが利用できるようになり、ゆっくりMovieMakerの利用範囲が一気に広がる形になったのです。 CoeFontは声をフォントのように利用できるようにしたサービスで、誰でも自分の声をCoeFontにできるとともに、ユーザーは公開されているCoeFontを使って喋らせることができる、というもの。今回このCoeFontとゆっくりMovieMakerがシステム的に連携したことにより、まさに人のような声で、誰でも無料で、簡単にテロップ・音声入りの解説動画を作ること

                AI音声のCoeFontが、ゆっくり実況プレイ動画編集ソフトで使えるようになった!|DTMステーション
              • 『VOICEPEAK 小春六花』の商用利用に関しまして|TOKYO6 ENTERTAINMENT

                『VOICEPEAK 小春六花』の商用利用に関しまして、多数のお問い合わせを頂いております。 販売を担当している株式会社AHS様のサイトにおいて、商用利用に当たる範囲、使用可能な用途を整理したサイトがありますのでご参照ください。 【非商用で利用可能な範囲について】 個人、同人活動を目的とする個人の集団(グループ)、法人格を持たず業務や商売を行っている個人事業主がVOICEPEAK キャラクター製品シリーズの合成音声を非商用・非業務目的で利用可能な範囲について

                  『VOICEPEAK 小春六花』の商用利用に関しまして|TOKYO6 ENTERTAINMENT
                • リックライダー「人と計算機の共生」 - 山形浩生の「経済のトリセツ」

                  翻訳中の本に、影響力の強い文として出てきたので、座興でやってみた。んー、いまだとそんなにすごい感じではないのと、ChatGPTとか出てきて、人間計算機共生のありかたそのものの、歴史的前提が崩れ始めている感じではある。とはいえ、60年以上前の話だから…… むしろ、この中で出てくる、人間で拡張された機械、という概念の方が妥当性が高いんじゃないかとさえ思う。 人と計算機の共生 Man‑Computer Symbiosis J. C. R. リックライダー 山形浩生訳 (hiyori13@alum.mit.edu) IRE Transactions on Human Factors in Electronics, volume HFE-1, pages 4-11, March 1960 groups.csail.mit.edu 要約 人と計算機の共生は、人と電子計算機との協力的な相互作用の中で、予

                    リックライダー「人と計算機の共生」 - 山形浩生の「経済のトリセツ」
                  • 【企業向け】ChatGPTの機会と脅威 | ドクセル

                    Introduction: 当社もAIに取り組んでいるのですが・・ もともと「AIと呼ばれるもの」は多岐にわたります。たとえばこのような分類です データ分析・予測 過去のデータにアルゴリズムを適用することで、これか ら起こりうることを予測します。単純なルールベースの もの、機械学習、ディープラーニングなど様々な手法が あります。 画像・音声処理 画像や動画、音声データを解析し、認識や理解を行うた めのAI技術です。オブジェクト検出、顔認識、シーン認 識、音声認識、音声合成、画像生成といったタスクをこ なします。 © 2022 UpLucid Inc. 自然言語処理(NLP) 人間が話す言葉を理解・解析、生成する各種機能です。 たとえばテキスト品詞分類、感情分析、機械翻訳や チャットボットなどが代表的です ロボティクス 厳密にはAIではありませんが、処理部分にAIを搭載した ロボティクスやI

                      【企業向け】ChatGPTの機会と脅威 | ドクセル
                    • 機械学習の煩雑なパラメーター管理の決定版 「Hydra」「MLflow」「Optuna」の組み合わせで手軽にはじめる一元管理

                      Optuna™は、オープンソースのハイパーパラメーター自動最適化フレームワークです。 「Optuna Meetup #1」では、Optunaのユーザー、導入を検討している方、また開発者を中心に、Optunaの様々な活用方法が共有されました。中村氏は、Hydra・MLflow・Optunaを組み合わせたハイパーパラメーター管理について発表しました。 ふだんは音声合成と声質変換技術などの音声を用いる技術を研究 中村泰貴氏(以下、中村):「HydraとMLflowとOptunaの組み合わせで手軽に始めるハイパーパラメータ管理」というタイトルで、東京大学大学院情報理工学系研究科の修士課程2年の中村が発表します。 軽く自己紹介ですが、先ほど述べたように情報理工学系研究科の、猿渡・小山研究室の修士課程2年です。音声合成に関する技術をふだん研究しています。「Twitter」をやっているので、ぜひフォロー

                        機械学習の煩雑なパラメーター管理の決定版 「Hydra」「MLflow」「Optuna」の組み合わせで手軽にはじめる一元管理
                      • 声のプロに音声合成AIの品質はどう映る 声優・森川智之さんが語る“技術への向き合い方”

                        「辛口なことを言うと、もっと詰められる部分はある」――声優の森川智之さんは自身の声を再現したAIの声を聞いてそう感じたという。 森川さんといえば、映画「ミッション イン ポッシブル」のイーサン・ハント(トム・クルーズ)役、「ジョン・ウィック」のジョン・ウィック(キアヌ・リーブス)役、「クレヨンしんちゃん」の野原ひろし役などを務める有名声優だ。 森川智之(もりかわとしゆき) 声優事務所アクセルワン代表取締役。 トム・クルーズやキアヌ・リーブスなどハリウッド俳優の吹替を担当する他、アニメ作品にも多数出演。 現在は自身が立ち上げた声優事務所「アクセルゼロ」で後進の育成にも当たっている。 2021年9月、小学館とAI音声合成のスタートアップCoeFont(東京都港区)は、音声合成AIを生成できるクラウドサービス「CoeFont」を活用して森川さんの声をAI化。その音源を使ってオーディオブックを作成

                          声のプロに音声合成AIの品質はどう映る 声優・森川智之さんが語る“技術への向き合い方”
                        • 月3000枚の墓石写真を自動で名前消し “AIに無関心”だった元石材屋の社員がエンジニアと業務AIを作るまでの一部始終

                          元石材屋の女性がIT企業に転職。エンジニアと協力してAIを開発し、墓石情報サイトの業務削減に成功する──Webサービスの開発を手掛けるエイチームライフスタイル(名古屋市)で実際にあった出来事だ。 キーパーソンは、同社で墓や葬儀に関する情報サイト「ライフドット」の運営に携わる小野寺智子さん(ライフエンディング事業部)。もともとは石材屋でチラシ作りなどの仕事をしており、AIには関心がなかったという。そんな小野寺さんがどういった経緯でAIによる業務削減を実現できたのか。そのきっかけは親会社であるエイチームがグループ全社で行った社内研修にあったという。 サイトに掲載する写真の加工作業に手間と時間が 小野寺さんは2年前の2019年、「もっとWebに携わる仕事がしたい」と考えエイチームライフスタイルに転職。務めていた石材屋がライフドットと提携していたこともあり、同サービスを運営する部署に配属された。

                            月3000枚の墓石写真を自動で名前消し “AIに無関心”だった元石材屋の社員がエンジニアと業務AIを作るまでの一部始終
                          • 新「チョロQ」はプルバック式なのにモーターで走る 「EV化の流れに着想」とタカラトミー

                            タカラトミーは6月9日、モーターを搭載しながらプルバックで走り出す「チョロQ」を夏に発売すると発表した。「トヨタ86」「カローラレビン(AE86)」など8種のスポーツカーを各1699円で販売する。 近年の自動車電動化の流れに着想を得てモーター駆動を採用したという。ゼンマイは搭載していないが、プルバックを合図に走り出す。車体後部にコインを載せるとウィリーするなど初期のチョロQの特徴を再現した。 プルバックは1回で直進、2回でランダムターン、3回でバックスピンなど回数によって走りが変わる。5回めには「ピーッ」という電子音が鳴りプログラミングモードに移行する。 プログラミングもプルバックで行う。1回で直進、2回で「右向き小回転+直進」など4つの走行パターンを順番に入力すると5秒後に走り出し、プログラム通りに動く。同時発売のコントローラー(1500円)を使えば最大10ステップのプログラミングが行え

                              新「チョロQ」はプルバック式なのにモーターで走る 「EV化の流れに着想」とタカラトミー
                            • AIで自分のしゃべり声をリアルタイムに別人の声に変換させる無料のサービス、CoeFontボイスチェンジャーの威力|DTMステーション

                              すでにご存じの方、使っているという方も少なくないと思いますが、自分のしゃべる声をAIでリアルタイムにまったく違う人の声に変換するシステム、CoeFont ボイスチェンジャーが大きな話題になっています。これは株式会社CoeFontが提供しているAIによるボイスチェンジャーで、マイクに向かってしゃべれば、非常にリアルな声で別の人に声に置き換わるというもので、男性の声を入力しても、まったく違和感なく、リアルな女性の声にすることが可能です。あの、ひろゆきさんの声を含め、現在10人の声に変換が可能で、それを無料で使えてしまうというのが大きなポイント。 今後は人気キャラクターや著名人を含む1万種類以上の声への変換も可能になるとのことで、まさにボイスチェンジャーの世界における革命となりそうです。現時点ではWindowsのみで利用可能ですが、近い将来、Macにも対応するとのこと。またGPU搭載のパソコンで

                                AIで自分のしゃべり声をリアルタイムに別人の声に変換させる無料のサービス、CoeFontボイスチェンジャーの威力|DTMステーション
                              • ディープラーニングで歌声音声合成エンジンを自作する

                                この記事は、ドワンゴ Advent Calendar 2019の1日目の記事です。 モチベーション 最近、理想の人工知能(歌ったり踊ったり喋ったりできるキャラクター)を作りたいと思うようになりました。人工知能が歌を歌うためには、歌声音声合成エンジンが必要です。ということで、ディープラーニングを使って、歌声音声合成エンジンの作成に挑戦してみました。この記事では、実際に音声合成した歌声や、その仕組み、別条件での実験結果、ディープラーニング周りの手法を紹介します。 デモ動画実際に作成した音声合成エンジンを使った歌唱のデモです。 (歌声音声合成を作ったら絶対最初にカバーしたいと思っていた歌、ハジメテノオトのカバーです。) 歌唱デモ音声 まだ挑戦し始めてから2週間ほどしか経っていないのでかなり荒削りですが、それでもちゃんと歌詞や音程が取れていたり、溜めの部分で大きく息を吸う音が入っていたりと、そこそ

                                  ディープラーニングで歌声音声合成エンジンを自作する
                                • “クリエイターのための謝罪フレーズ集”電子書籍を無料公開

                                  「締め切りに間に合わない」「納品したものに盗作の疑いがあった」――“謝罪待ったなし”のこんな状況で、適切な謝罪フレーズを提案する電子書籍「謝罪パーフェクトガイドブック」を、AI執筆アシスタントサービス「Catchy」を運営するデジタルレシピが無償公開した。 第一弾はクリエイター向けで、10の謝罪シチュエーションと謝罪文を掲載。「実用性とユーモアのバランスを、利用シーンに合わせて選べる」としている。 ダウンロードにはCatchyへのログインが必要。Catchyは、文章を入力すれば、キャッチフレーズや謝罪文などをAIで自動生成するサービスだ。同書を参考にCatchyも利用すれば「最短1分で最適なごめんなさいのフレーズを作成できる」とアピールしている。 同社は「最適な言葉が見つからない、どれくらいの分量で伝えればいいか判断に迷うとき、言葉を捻出する時間に比例して精神的な負担は積み重なっていく」と

                                    “クリエイターのための謝罪フレーズ集”電子書籍を無料公開
                                  • 余命わずかな科学者が世界初の完全サイボーグに!?

                                    テクノロジーの活用により重度の障害を乗り越える可能性を探る..... Peter Scott-Morgan-Twitter <「運動ニューロン疾患(MND)」の末期と診断された科学者が、自ら実験台となって、テクノロジーの活用により重度の障害を乗り越える可能性を探ろうとしている......> 難病により余命わずかな61歳の英国人科学者が「世界初の完全サイボーグ」に変身しようとしている。 30年にわたって政府機関や民間企業で活躍したのち、2007年以降、自身の研究活動に専念していたピーター・スコット=モーガン博士は、2017年、「運動ニューロン疾患(MND)」の末期であると診断された。運動ニューロン疾患は、2018年3月に死去した英理論物理学者のスティーブン・ホーキング博士が闘い続けた病としても知られ、運動神経細胞がゆっくりと変性し、重要な機能や随意運動を制御する神経システムの能力が次第に失わ

                                      余命わずかな科学者が世界初の完全サイボーグに!?
                                    • ケンモFMの配信バックエンド :: ラジオ番組の制作からライブ配信、Podcast化までを全自動化 - Qiita

                                      ケンモFMとは 5ちゃんねる嫌儲板で、コロナ感染者を適当に予測したスレが立ち、明確なソースが貼られないまま「ソースはラジオで聴いた」などの一文が添えられていました。それを揶揄し、「ケンモFMかよ」のようなレスが付いたのが元ネタです。 せっかくなので、fmドメインを取得した上で、スレタイ(スレッドのタイトルのことです)を自動で読み上げるサイトを作ったのが https://kenmo.fm です。YouTubeにも同時配信しており、 https://www.youtube.com/channel/UCHBucrED96_pdOCvIs6jNSQ/live で聴けます。 とりあえずサイトにて自動で生成される音声を聴いてみてください。 システム構成 現状はこのようになっています。 ほぼTypeScriptで書かれており、所々にBashも使用しています。 順に解説します。 1 スクレイピング この項

                                        ケンモFMの配信バックエンド :: ラジオ番組の制作からライブ配信、Podcast化までを全自動化 - Qiita
                                      • スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】

                                        3年振りのリアル開催となった福岡で例年行われるゲーム開発者向けのカンファレンス「CEDEC+KYUSHU 2022」が、2022年11月12日(土)に開催されました。スクウェア・エニックス AI部のAIリサーチャー 森 友亮氏が登壇し、『意味が分からないからこそ、リアル ~「架空言語」音声合成による、没入感の高いボイス付きコンテンツの実現~』と題した講演が行われました。見慣れた母国語のテキストから聞いたことのない架空言語の音声を生成する手法について語られた本講演をレポートします。 TEXT / じく EDIT / 酒井 理恵

                                          スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】
                                        • AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai

                                          サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                            AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai
                                          • 高木浩光@自宅の日記 - 速報:Claude 3に判例評釈を自動生成させてみた(Coinhive事件最高裁判決の巻)

                                            ■ 速報:Claude 3に判例評釈を自動生成させてみた(Coinhive事件最高裁判決の巻) 一昨日の「Claude 3に例の「読了目安2時間」記事を解説させてみた」の感触からすると、これだけLLMが長文の意味内容を「理解」するようになったとなると、もはや、書評や論文紹介、判例批評など、定形的なスタイルを持つ学術記事は、LLMによって自動生成が可能なんではないか?と思えてくる。 というわけでやってみた。土地勘のあるところで、Coinhive事件最高裁判例(刑集第76巻1号1頁)でやってみよう。しかし、さすがに、ただ最高裁の判決文を投入するだけでは、通り一遍の内容のない判例評釈になってしまうことが予想される。そこで、実在する一審の解説と二審の解説(私が書いたやつ)を読ませて、それを踏まえた最高裁判決の評釈を生成させてみる。これはうまくいくに違いない。たぶん。いや、どうかな。 さて結果は……

                                            • 音声読み上げソフト「SofTalk」がゆっくりボイスへの対応を終了→実況界隈への影響やライセンス関係に対するさまざまな意見

                                              リンク SofTalkをご利用の皆様へのお知らせ - SofTalk SofTalkをご利用の皆様へのお知らせ - SofTalk【7/23更新】 日頃よりご愛顧いただき誠にありがとうございます。 SofTalkは、長年AquesTalkに対応してまいりましたが、勝手ながら AquesTalkへの対応を中止させていただくこととしました。 SofT... 337 users 44 cncc ゴメス @cncc_gomes ソフトークとかポケットステーション版DOOMとか作ってます。FCやLDゲームも少し。 /DA PUMP/スーパーチャンプル/ジョン・トラボルタ/ジョジョhttps://t.co/DfBSZs0W2D… https://t.co/QCL1d0Ybvr

                                                音声読み上げソフト「SofTalk」がゆっくりボイスへの対応を終了→実況界隈への影響やライセンス関係に対するさまざまな意見
                                              • 誰の声でもキャラの声に--DeNA、AIを活用した音声変換サービスのプロトタイプを公開

                                                ディー・エヌ・エー(DeNA)は5月12日、開発を進めているAIを活用した「音声変換AI」のトライアルを試験利用することができる「VOICE AVATAR 七声ニーナ」を公開した。PCやスマートフォンのブラウザ上で体験することが可能となっている。 これは、自分の声で話しかけて音声を入力すると、その音声が七声ニーナ(CV:高田憂希)の声に変換されるというもの。VOICE AVATAR 七声ニーナでは、入力されたユーザーの音声から話者に依存しない音の情報を抽出し、それをもとにキャラクターの音声を生成。これにより誰の声であっても、事前にユーザーの音声を収録をしたり、文字起こしをしたりすることなく、自然なキャラクターの声に変換することを可能としている。同社ではトライアルを通じて、技術進化の方向性を検証するとともに、より大きな発展に向けた技術蓄積を行っていくという。 現在もAIを用いた完全なキャラク

                                                  誰の声でもキャラの声に--DeNA、AIを活用した音声変換サービスのプロトタイプを公開
                                                • [インタビュー]西 和彦氏に聞く「次世代MSX」とは何なのか――目指すのは,ユーザが自分で作り出す“遊び”の世界

                                                  [インタビュー]西 和彦氏に聞く「次世代MSX」とは何なのか――目指すのは,ユーザが自分で作り出す“遊び”の世界 編集部:早苗月 ハンバーグ食べ男 カメラマン:永山 亘 Microsoftとアスキー(当時)によって制定された「MSX」規格最初のマシン「ML-8000」が三菱電機から発売されたのは,今から40年前である1983年のこと。 日本をはじめ,世界各国(とくに北米や欧州の8bit PCの進出が鈍かったソビエト連邦や中東など)で一世を風靡したMSXシリーズだが,家庭用コンピュータやゲーム機が高性能化していく1990年代に姿を消していった。2006年にFPGAでMSX2を再現した「1chip MSX」(関連記事),2020年にスペインのデベロッパによるRaspberry PI 3B+ベースの「MSXVR」が発売されるなど,復古の動きもあったが,いずれも小規模なものに留まっている。 Mic

                                                    [インタビュー]西 和彦氏に聞く「次世代MSX」とは何なのか――目指すのは,ユーザが自分で作り出す“遊び”の世界
                                                  • 「攻殻」のベテランキャストはAIに自らの声を渡せるのか?『攻殻機動隊 SAC_2045 最後の人間』出演の田中敦子、大塚明夫、山寺宏一に聞く

                                                    人間は同じキャラクターを20年以上も演じれば、自身の精神にそのキャラが根付くのか? そして人間が演じてきた情報をAIに膨大に学習させれば、その先に人間の精神のようなものは生まれるのか? 考えてみれば、商業アニメで特定の役柄を数十年にわたって演じ続けるという意味で声優という職種は突出している。もちろん、俳優が同じ舞台や同じドラマで同じ登場人物を演じ続けるケースは多い。しかし商業アニメが特殊なのは、映画版や別のシリーズごとに監督も絵柄も脚本も違う場合がしばしばあることだ。その場合、声優は各シリーズでキャラをどう解釈しているのだろうか。 とりわけ「攻殻機動隊」シリーズは作品ごとに極端な変化が観られるものの一つだろう。映画『GHOST IN THE SHELL/攻殻機動隊』(以下、映画「攻殻」)や『イノセンス』では、押井守監督の写実的な画作りと衒学的なシナリオが全編に張り詰めている。 一方『攻殻機

                                                      「攻殻」のベテランキャストはAIに自らの声を渡せるのか?『攻殻機動隊 SAC_2045 最後の人間』出演の田中敦子、大塚明夫、山寺宏一に聞く
                                                    • 命綱の本が紙クズに変わる時 芥川賞「ハンチバック」が問うマチズモ:朝日新聞デジタル

                                                      ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                                        命綱の本が紙クズに変わる時 芥川賞「ハンチバック」が問うマチズモ:朝日新聞デジタル
                                                      • 子どもたちはゲームやインターネットの世界で何をしているんだろう?(関 正樹:大湫病院児童精神科医)#子どもたちのためにこれからできること|「こころ」のための専門メディア 金子書房

                                                        子どもたちはゲームやインターネットの世界で何をしているんだろう?(関 正樹:大湫病院児童精神科医)#子どもたちのためにこれからできること 「ゲーム・ネット・スマホとどう付き合うか」(吉川 徹 先生)に続く、ゲーム・ネットと子どもたちについての第2弾です。ゲームやインターネットに熱中している子どもに対して、大人はどうしても不安を感じてしまいがちです。その背景には、ゲーム・ネットの世界や、また、子どもたちがその世界をどう楽しんでいるのかを、大人の側が知らないこともあると思います。今回は、児童精神科医の関正樹先生に、ゲームやネットの世界のこと、その世界に没頭する子どもたちと出会ったときに、支援者や保護者に何ができるかを解説いただきます。 1.どうしてインターネットやゲームはネガティブな側面に注目が集まりやすいのだろう?  インターネットゲーム障害がアメリカ精神医学会の診断基準であるDSM-5に「

                                                          子どもたちはゲームやインターネットの世界で何をしているんだろう?(関 正樹:大湫病院児童精神科医)#子どもたちのためにこれからできること|「こころ」のための専門メディア 金子書房
                                                        • 「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた

                                                          ヤマハは9月29日、NHK総合で放送されたドキュメンタリー番組「NHKスペシャル AIでよみがえる 美空ひばり」の中で、AIの技術を活用して再現した美空ひばりさんの新規音声を披露した。 美空ひばりさんは1989年に亡くなった、昭和を代表する歌手の一人だ。ヤマハは機械学習の一種であるDNN(ディープニューラルネットワーク)を使い、美空ひばりさんの歌い方や話し方の癖を再現できる音声合成システムを作った。番組では作詞家の秋元康さんがプロデュースした新曲「あれから」を披露。まるで本人が歌っているかのような音声を再現した。 番組を見た人からは、「まるで本物のようだ」と再現度に驚く声もある一方で、「子音が弱い」「声質が機械っぽい」など厳しい評価も上がっていた。 これまで、歌声合成ソフトウェア「VOCALOID」を開発してきたヤマハだが、今は亡き美空ひばりさんの新曲を作るため、いったいどのような工夫を重

                                                            「AI美空ひばり」を支えた技術 「七色の声」どう再現? ヤマハ技術者に詳しく聞いた
                                                          • 【NERV防災】全員アプリ開発未経験のチームが生んだ異例の“初日10万DL”の裏側(ゲヒルン石森×糠谷) - エンジニアtype | 転職type

                                                            2020.07.17 スキル 情報セキュリティ事業などを手掛ける創業10年のベンチャー・ゲヒルンが作った防災アプリ『特務機関NERV防災』は、2019年9月のリリース初日にiOS版が10万ダウンロードを記録。人気アニメ『エヴァンゲリオン』の世界観を踏襲していることや、2010年から運用している人気Twitterアカウント「特務機関NERV(@UN_NERV)」というベースはあったにせよ、異例の大ヒットと言っていいだろう。 『特務機関NERV防災』HPより 驚くべきことに、代表の石森大貴さん以下、開発チーム8人にアプリ開発の経験者は一人もいなかった。文字通り人生で初めて作ったアプリで、いきなり大成功を収めたことになる。そして、さらに衝撃的なのは、続いて12月にリリースされたAndroid版の開発経緯だ。 メンバー全員がiPhoneユーザーだったため、まずはAndroid端末を購入してくるとこ

                                                              【NERV防災】全員アプリ開発未経験のチームが生んだ異例の“初日10万DL”の裏側(ゲヒルン石森×糠谷) - エンジニアtype | 転職type
                                                            • ジミー大西をAI化 音声対話アプリ「携帯人間AIジミー」開発 ドコモの技術で

                                                              対話型AIに実在の人物や架空のキャラクターを模した受け答えをさせるNTTドコモの「キャラクタ雑談技術」を活用し、タレントのジミー大西さんを再現したAIとの音声対話を楽しめるアプリ「携帯人間AIジミー」がリリースされる。吉本興業とNTTグループなどが共同出資したラフ&ピース マザーが、iOS/Android向けに3月20日に公開する。 キャラクタ雑談技術は、実在の人物やキャラクターの対話データ(質問・応答)を学習することで、まるでその人やキャラと会話しているような対話型AIを作成できる技術。「ドコモAIエージェント」と組み合わせると、音声認識・音声合成による対話が可能になる。 AIジミーは、同技術を初めて活用した商用サービス。ジミー大西さん本人が作成した対話データをもとに学習したAIを構築した他、本人の音声から作成したオリジナル音声合成モデルを使った。ジミーさんの声を分析し、ジミーさんらしい

                                                                ジミー大西をAI化 音声対話アプリ「携帯人間AIジミー」開発 ドコモの技術で
                                                              • ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換

                                                                ドワンゴは9月14日、ディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。デモページでは、声を録音して変換先の声を選び、変換ボタン押すと自分の声を100人分の声に変換できる。 録音した音声を加工するのではなく、目標の人物の声に変換するもの。選べるターゲットの数は100種類。変換のリアルタイム性より変換品質を優先しており、変換には数十秒から数分の時間がかかる。 既存の声質変換システムはリアルタイムに変換するものが多く、品質を重視したものはあまり見かけないとして開発に挑んだという。音声の合成には、スマートスピーカーなどで使われるWaveNetという方式から派生したWaveRNNを採用した。 ディープラーニングを使った声質変換では、変換前の声と目標とする人物の声をセットで学習する手法がとられることがある。この手法ではボイスチェンジャーを使い

                                                                  ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換
                                                                • LambdaとDynamoDBでIoTバックエンド開発

                                                                  2019年7月30日、Serverless Community(JP)が主催するイベント「Serverless Meetup Tokyo #12」が開催されました。世界各地で運営されているServerless Architectureやその周辺技術について情報を共有する本コミュニティ。今回は、株式会社Speeeのオフィスにて、3人のエンジニアが知見を共有しました。プレゼンテーション「LambdaとDynamoDBでつくるIoTバックエンド」に登壇したのは、 株式会社MMMの岡本忠浩氏。 LambdaとDynamoDBでIoTバックエンド開発 岡本忠浩氏:よろしくお願いします。「LambdaとDynamoDBでIoTバックエンド開発」というタイトルなんですけど、ちょっとスライドを作るのがギリギリになってしまって。至らないところがあるかもしれないんですが、お願いします。 自分はMMMとい

                                                                    LambdaとDynamoDBでIoTバックエンド開発
                                                                  • Synthesizer Vの歌声合成は次の次元へ。調声は不要、AIリテイク機能で好みの歌い方を選べる時代に|DTMステーション

                                                                    についても、発表があり、「これは何なんだろう?」と気になっていました。この時は具体的な内容まではわからず、その翌日にHigh Dynamics Voice Modelに関する紹介ビデオも公表されたのですが、ここでもいま一つ、ピンときませんでした。が、それが実装されたβ版を使わせてもらうとともに、Kanruさんに話を聞いて、ようやくこれが歌声合成における革命であることが分かりました。 以下が、そのAIリテイクの様子を捉えたビデオです。 だいたいの雰囲気が、理解いただけたでしょうか? そう、このAIリテイク機能は、High Dynamics Voice Modelという技術をSynthesizer Vの機能として実装させたものであり、歌声を新たに作り直すというものなのです。 「歌声合成は、ここ数年で大きく進化してきましたが、やはり人間の歌声の魅力にはかなわない面があります。その大きな理由の一つ

                                                                      Synthesizer Vの歌声合成は次の次元へ。調声は不要、AIリテイク機能で好みの歌い方を選べる時代に|DTMステーション
                                                                    • VOCALOIDじゃない「初音ミク NT」は何が違う? 現役ユーザーが詳細レビュー

                                                                      クリプトン・フューチャー・メディア(CFM)の“VOCALOIDじゃない初音ミク”、6月4日に公開された試作バージョンに早速触れてみたのだが、すぐに「地味でも本当に欲しかった機能が盛りだくさんでうれしい……うれしい……」と語彙力を失った。ミクの歌声をもっと細かくいじり倒したかった人々には、文句なしにおすすめできる。 “VOCALOIDじゃない初音ミク”とは、初音ミク NTのことだ。CFMオリジナルの歌声合成ソフト「Piapro Studio」専用のボーカル音源で、ヤマハの歌声合成ソフト「VOCALOID」では使えない。 開発が自由にできるようになったのか、細かいところから大きなところまで、既存の歌声合成ソフトのいいとこ取りをしている。いじり倒したかった側の人間としては、「そう! それが欲しかったんだよ!」と叫びながら作業してしまう程度には満足度の高いものに仕上がっていた。 これまで約30種

                                                                        VOCALOIDじゃない「初音ミク NT」は何が違う? 現役ユーザーが詳細レビュー
                                                                      • ボカロ初心者の音楽好きが選ぶ「ボカロ名盤」60枚

                                                                        最近、これまで触れなかったボーカロイドの音楽(以下、ボカロ音楽)を聴き始めました。 そして色々聴くにつれ、次第にボカロ音楽の奥深さと幅広さに魅了されるように。 しかし、「ニコニコ動画」が中心の文化であることから、「アルバムで視聴する人」は少ないように思います。 視聴の中心は曲単位によるもの また(かくいう自分もそうだったのですが)ボカロ音楽に「どれも同じような曲調」という偏見を持つ人が少なからずいる気がします。 本記事では、様々な国/ジャンルのボーカロイドのアルバムを紹介し、「ボカロの魅力」をお伝えできればと思います。 なお、ボカロ音楽について自分もまだ勉強中ですので、もし説明に誤りなどございましたら、ご指摘頂けますと助かります。 この記事で、自分のようにボカロ音楽を聴き始める人が少しでも増えれば幸いです。 *本記事ではUTAUなど「本来はボカロに含めない」合成音声も、便宜上「ボカロ」で取

                                                                          ボカロ初心者の音楽好きが選ぶ「ボカロ名盤」60枚
                                                                        • 無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」 本日より提供開始! | ニュース | LINE株式会社

                                                                          LINEの音声認識AIによるテキスト変換機能を無料提供 複数名の話者分離を可能とした会議の議事録作成や書き起こしにマルチデバイスで対応 LINE株式会社(本社:東京都新宿区、代表取締役社長:出澤 剛)は、LINEのAIテクノロジーブランド「LINE CLOVA」より、「会話を目で見る」ことができる無料のAI音声認識アプリ「CLOVA Note(クローバ・ノート)」のβ版の提供を本日5月24日(火)より開始しましたので、お知らせいたします。 「CLOVA Note」は、LINE CLOVAのAI技術である「CLOVA Speech(音声認識)」の音声認識AIによって、録音した声をテキストに変換するAI音声認識アプリです。アプリをインストールし、スマートフォンやタブレットの録音ボタンを押すだけで、誰でも簡単にご利用いただけます。学校での授業やセミナーなどの書き起こしメモだけでなく、録音時の複数

                                                                            無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」 本日より提供開始! | ニュース | LINE株式会社
                                                                          • SHAREVOX

                                                                            MIDDLE LEVEL TTS SYSTEM 中品質な音声合成システム SHAREVOXはディープラーニングを用いた音声合成システムを採用し、中品質な音声合成を実現しています。 FREEDOM 自由度の高い調声機能 イントネーションや音の長さ、全体の抑揚や音高、話速の変更が可能な、自由度の高い調声システムを提供します。 BECOME 合成音声になる あなたの声を元に、Google Colaboratoryを用いて自由に話せる音声ライブラリを作ることが可能です。 また、これを他の人に配布することもできます。 (※今後実装されます)

                                                                              SHAREVOX
                                                                            • 取り残されたメンタルヘルス後進国・日本 - wezzy|ウェジー

                                                                              本連載の目的は、「メンタルヘルス」が関連した事件と、その背景を解きほぐすことである。「メンタルヘルス」あるいは「メンタル」という用語は、もはや、日常にありふれている。しかし、これらの用語は、誰の何のことを意味しているのだろうか? たとえば「メンタル」と対になる用語は「フィジカル(肉体的な)」だが、一人の人間の「メンタル」と「フィジカル」を明確に区分することは出来るだろうか? おそらく、不可能だ。 いずれにせよ、社会の「メンタルヘルス」が良好ではない場合、社会の中の誰かの「メンタルヘルス」が良好でなくなる。逆に、ある社会に「メンタルヘルス」が良好ではない誰かがいるとき、その社会の「メンタルヘルス」も良好ではなくなる。このことは確かだろう。 社会と個人、心と身体の複雑な相互関係が絡み合う中で、時に不幸な巡り合わせが重なる。そして、誰かが残酷に殺傷されてしまう事件が起こったり、誰かが自殺に至って

                                                                                取り残されたメンタルヘルス後進国・日本 - wezzy|ウェジー
                                                                              • 「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!

                                                                                株式会社Yellston(本社:東京都港区、代表:早川 尚吾、以下当社)は、Web音声合成サービス『CoeFont STUDIO』を2021年4月23日(金)にリリース、無料公開いたします。 当社は、Web上で音声合成が可能な音声合成サービス『 CoeFont STUDIO』(コエフォントスタジオ) https://coefont.studio/ を2021年4月23日(金)にリリースしました。 CoeFont STUDIOのリリースを記念し、全サービスを期間限定で無料で公開いたします。終了時期は未定ですが、その間本サービス及び出力した音声データは営利・非営利問わずご自由にご利用いただけます。ぜひ当社の音声テクノロジーを用いた「声のフォント」をお試しください。 CoeFont STUDIO編集画面 アクセント・ヨミ編集 『CoeFont STUDIO』は、DeepLearningにより人間

                                                                                  「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!
                                                                                • 中学時代、ボカロ曲にのめり込んでいた少女が、小春六花の中の人に。声優・青山吉能さんインタビュー|DTMステーション

                                                                                  先日、VOICEPEAK 小春六花が発表されるとともに、CeVIO AI 小春六花やSynthesizer V 小春六花など既存の小春六花製品を持っている人は7月12日までの期間限定でVOICEPEAK 小春六花が無料でもらえることも発表されて大きな話題になっています。その小春六花のCVを務めるのは、声優の青山吉能(あおやまよしの @Yopipi555)さん。昨年大ヒットとなったアニメ「ぼっち・ざ・ろっく」の主人公、後藤ひとり役を務めたことでも注目を集めた青山さんですが、中学時代はボカロ曲、ニコニコ動画にハマっていたのだとか……。 かなりの熱の入れようだったそうですが、そこから10年近くを経て自分自身がSynthesizer VやCeVIO AI、そしてVOICEPEAKの小春六花になる、というのはどんな感覚なのでしょうか?そもそも、どんな経緯で、小春六花になることになったのか、実際の収録

                                                                                    中学時代、ボカロ曲にのめり込んでいた少女が、小春六花の中の人に。声優・青山吉能さんインタビュー|DTMステーション