並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 3550件

新着順 人気順

音声の検索結果361 - 400 件 / 3550件

  • ケロログ | VOICE BLOG PORTAL

    2021年12月5日 【2021年最新】医療脱毛が本当に安いおすすめクリニックランキングTOP7|顔・VIOを含む全身から部位別まで徹底料金比較

      ケロログ | VOICE BLOG PORTAL
    • CoeFont

      10,000種類以上の豊富な音声ナレーターやアナウンサー、声優、著名人など老若男女の幅広い音声を提供

        CoeFont
      • Microsoftの音声アシスタント「Cortana」、2021年にフェードアウト 縮小のロードマップ公開

        米Microsoftの音声アシスタント「Cortana」の消費者向けアプリおよびサービスの多くが2021年に終了する。Microsoftは8月1日(米国時間)、「Upcoming changes to Cortana」と題したサポートページでCortanaフェードアウトのロードマップを提示した。 同社はCortanaをOfficeやクラウドサービスなどを含むサブスクリプションサービス「Microsoft 365」のためのAIベースデジタルアシスタント体験として再定義することを理由に、Cortanaサードパーティースキルのサポートを9月7日で終了。21年初めにはiOSおよびAndroid向けCortanaアプリのサポートを終了する。

          Microsoftの音声アシスタント「Cortana」、2021年にフェードアウト 縮小のロードマップ公開
        • SUPER © - k本的に無料ソフト・フリーソフト

          MP4 / AVI / WMV / MKV / TS / MPG / ASF / FLV / MOV / RM 等の動画を変換できるフリーソフトの紹介。 MP4 / AVI / FLV などの動画ファイルを変換することができるフリーソフトを紹介しています。 DVD の変換にも対応したソフトや、動画内の音声をMP3 等に変換して抽出できるフリーソフト、iPhone / Android などのスマートフォン向けの動画に変換できるフリーソフト、PSP などのゲーム機向けの動画に変換できるフリーソフト... などが存在します。

            SUPER © - k本的に無料ソフト・フリーソフト
          • 『ずんだもん』企業勢も“問い合わせナシ”で読み上げやイラストの「無料使用」が可能に。プロゲーマーやVTuberとのコラボ期待

            『VOICEVOX』に音声ライブラリとして収録されている「ずんだもん」「九州そら」「四国めたん」(いずれも「東北ずん子プロジェクト」のキャラクター) (画像は東北ずん子プロジェクト公式サイトより) また「東北ずん子ガイドライン準拠」を示す(ず・ω・きょ)の記載があるユーザー作成の素材についても、公式のガイドラインに基づいて非商用の範囲であれば立ち絵などが利用可能となる。 たとえば、ユーザー制作のずんだもんの立ち絵のなかでも見かけることの多い、坂本アヒル氏制作の「ずんだもん立ち絵素材」や「四国めたん立ち絵素材」は(ず・ω・きょ)の記載がされているため、配信等で自由に使うことが可能だ。 坂本アヒル氏製作の「ずんだもん立ち絵素材」 (画像はニコニコ静画「ずんだもん立ち絵素材」より)(画像は東北ずん子プロジェクト公式サイトより) なお『VOICEVOX』には「東北ずん子プロジェクト」以外のキャラも

              『ずんだもん』企業勢も“問い合わせナシ”で読み上げやイラストの「無料使用」が可能に。プロゲーマーやVTuberとのコラボ期待
            • あいちトリエンナーレ2019に寄せられたご意見等 - 愛知県

              県庁住所:〒460-8501 名古屋市中区三の丸三丁目1番2号 (県庁舎へのアクセスはこちら) 代表電話:052-961-2111 (県機関の連絡先はこちら) 開庁時間:午前8時45分~午後5時30分(土日祝日・12月29日~1月3日を除く)※開庁時間の異なる組織、施設があります。 法人番号:1000020230006 Copyright (C)Aichi Prefecture. All rights reserved.

              • 無料&手続き不要で3400曲以上ある日本ファルコムの全楽曲が利用できる「ファルコム音楽フリー宣言」

                イースIIのOPテーマ「TO MAKE THE END OF BATTLE」などのように、やたら鮮烈に記憶に残るBGMが多いことで有名な日本ファルコムが世界初の試みとして「ファルコム音楽フリー宣言」を本日・2009年6月5日(金)から開始します。 日本ファルコムによると、この宣言は現時点(2009年6月5日)までに公開された全3453曲すべてが対象。使用料無料&手続き不要というのが最大の特徴で、テレビCMの曲として使用したり、ラジオ番組のBGMとして使ったり、バンドのライブで演奏したり、イベントやプレゼンのBGMとして使うなど、おそらくJASRAC管理楽曲であればとても無料では使えないような形での利用も可能になっています。 ファルコム音楽フリー宣言 | Falcom https://www.falcom.co.jp/music-use 利用の具体例は以下のようになっています。 ■フリーで利

                  無料&手続き不要で3400曲以上ある日本ファルコムの全楽曲が利用できる「ファルコム音楽フリー宣言」
                • NHK外国語講座 ビジネス英会話

                  Copyright NHK(Japan Broadcasting Corporation.) All rights reserved. 許可なく転載を禁じます。著作権保護について NHKにおける個人情報保護について|NHKオンライン利用上のご注意|NHKオンライン番組表

                  • 小岩井ことりさん作詞・作曲・歌唱のDB公開で、AI歌声合成の民主化へ躍進。NEUTRINOの新キャラクタ『No.7』がリリースへ|DTMステーション

                    NEUTRINO、CeVIO AI、Synthesizer V……と、まるで人間のように歌う、AI歌声合成の世界が賑わっていますが、今年この世界がさらに大きく変わる可能性が出てきました。一般ユーザーが自分の声を収録し、それを元にAI歌声合成をするための統一した楽曲の規格を作り、公開されることになったのです。その仕組みづくりに貢献したのが、声優であり、マルチクリエイターでもある小岩井ことり(@koiwai_kotori)さん。AI歌声合成のために、小岩井さんが作詞・作曲するとともに、自ら歌唱したデータ、計50曲が公開されることとなり、それをテンプレートにして歌えば、それぞれのAI歌声合成ができる世界が実現できることになりそうなのです。 そのプロトタイプとなる小岩井さんの歌唱データベースが公開に向けて、準備を進めているところですが、正式公開前に、実際に歌わせることができるソフトであるNEUTR

                      小岩井ことりさん作詞・作曲・歌唱のDB公開で、AI歌声合成の民主化へ躍進。NEUTRINOの新キャラクタ『No.7』がリリースへ|DTMステーション
                    • Songle

                      Songle is a web service for active music listening that facilitates a deeper understanding of music and enriches your music listening experience. Songle utilizes music-understanding technologies that automatically estimate music scene descriptions and enable visualization of elements such as structural segments, hierarchical beat structure, melody line, and chords. All users accessing the Songle s

                        Songle
                      • LとRの発音の違い学ぶ画期的方法 | web R25

                        YouTubeの「LUX Japan」公式チャンネルで公開されている動画。現在の出演女優は、ニ-ナ・ドブレフ。画像は、ちょうど“R”を発音しているところだ ※この画像はサイトのスクリーンショットです 日本人が英語を学ぶ際に難しく感じる点のひとつが、“L”と“R”の発音の違いだ。一般的に、“L”は発音する際に舌を上の歯の後ろにつけ、“R”を発音する際には舌を引っ込めどこにもつかないようにすると言われている。しかし、言葉では理解できても、実際に聞き取ったり発音したりするのは難しいもの。 そんな“L”と“R”の発音について、ある有名な商品を引き合いに出して述べたツイートが人気を集めている。10月15日に投稿されたそのツイートは、以下のようなものだ。 「過去、“L”の発音を教えてた時の事。“L”を使う単語として“Love”だとか“Cloud”だとかで練習しても全然上達してくれないのに、“Lu

                        • オーディオプログラミング言語のカレンダー | Advent Calendar 2020 - Qiita

                          オーディオプログラミング言語について、メジャーどころや面白そうなものを実際に触ってみて紹介する企画です。 共通のテーマは、(1)440Hzのサイン波生成+ゲイン調整、(2)wavファイルに400msecのディレイをかけてフィードバックとウェットレベルを調整の上で再生、としました。それぞれの言語でこの二つのプログラムを実装します。 オシレーター、ファイル読み込み、バッファ格納、フィードバック処理といった頻出処理の実装方法(もしくはライブラリ利用方法)がひととおり確認できて、言語間の比較もしやすいのではないかと思います。 githubの方も公開しました。こちらはすべての実行確認済みソースコードをダウンロード可能です。 https://github.com/aike/audiolang

                            オーディオプログラミング言語のカレンダー | Advent Calendar 2020 - Qiita
                          • EvernoteにSkype通話を自動保存してくれる『Callnote』 | ライフハッカー・ジャパン

                            疲れやすい、呼吸の浅さを改善。ストレッチポールは毎日使いたいほど気持ちがいい!【今日のライフハックツール】

                            • 無料でロイヤリティフリーのBGM素材や効果音がダウンロードできる「RoyaltyFreeMusic.com」 - GIGAZINE

                              教育目的や学生、個人利用や非営利プロジェクトであれば無制限に利用できる無料のBGMや音楽素材、効果音などが「RoyaltyFreeMusic.com」から会員登録不要でダウンロード可能です。 現時点でBGMとして20曲、ループ素材として50曲、効果音が106曲など、かなりたくさんの素材が置いてあり、視聴も可能。定期的に新しい曲を追加したり、入れ替えたりするとのことなので、時々チェックしてみるといいかもしれません。 ダウンロードの手順は以下から。 Royalty Free Music, Music on Hold, Stock Music, Production Music, Free Background Music, Buyout Music http://www.royaltyfreemusic.com/ Free Stock Music for Educational Use ダウン

                                無料でロイヤリティフリーのBGM素材や効果音がダウンロードできる「RoyaltyFreeMusic.com」 - GIGAZINE
                              • 声優に「録音した音声でAIに合成音声を生成させることを認める」契約を迫るケースが増加、声優や組合からは反対の声

                                ゲームやアニメに声を吹き込む声優が、「AIで自分の声を再現する合成音声を生成することを認める」という条項を含む契約書にサインを求められるケースが増えていると、アメリカの声優や組合がIT系ニュースサイトのMotherboardで訴えています。声優たちは、こうした契約がまん延することで声優業界全体が大きなダメージを受ける可能性を危惧しています。 ‘Disrespectful to the Craft:’ Actors Say They’re Being Asked to Sign Away Their Voice to AI https://www.vice.com/en/article/5d37za/voice-actors-sign-away-rights-to-artificial-intelligence AIで声を再現する技術は急速に進歩しており、個人でも本人の音声データを学習させた

                                  声優に「録音した音声でAIに合成音声を生成させることを認める」契約を迫るケースが増加、声優や組合からは反対の声
                                • Slackにおける音声通話機能のWebRTC観点からの解析

                                  はじめに 2016/3/3より、Slackに音声通話機能が搭載された。 試しに使ってみたSlackユーザもそれなりにいると思う。 Slack音声通話機能の対応クライアントは、現時点では限定的だ。Slackの設定画面の一文を引用すると Currently on Mac and Windows desktop apps and in Chrome; coming soon to mobile! の通りで、Chromeまたはデスクトップのネイティブアプリとなる。 音声機能が実装されていてこの種類の対応状況なら、もちろん利用技術はWebRTCと考えるのが素直だ。(しかもWebRTCベースのスタートアップであるScreenHeroを買収していることもあり) ここで、最も気になるのは内部でWebRTCをどのように利用しているか、という点だ。 すでに、WebRTCエンジニア御用達のWebRTCHacks

                                    Slackにおける音声通話機能のWebRTC観点からの解析
                                  • プロ声優を起用した音声合成用データ、無償公開 研究用途に期待

                                    声優やアニメを研究するサークルの日本声優統計学会は6月26日、プロの声優を起用した音声データとテキストを含むデータベース「声優統計コーパス」をWebサイト上で公開した。音声合成ソフトの作成や言語研究などに使われるデータで、研究目的に限り無償で利用できるという。 公開したのは、プロの女性声優がさまざまな音の要素を含む文章(音素バランス文)を「通常」「喜び」「怒り」の感情別に読み上げたwavファイル。「また東寺のように五大明王と呼ばれる主要な明王の中央に配されることも多い」「カーミラ星と呼ばれている惑星から宇宙船に乗って地球に侵入した宇宙人」──などの文を読み上げている。 参加した声優は土谷麻貴さん(「喰霊-零-」「アルカナハート」など)、上村彩子さん(「エルドライブ」「惡の華」など)、藤東知夏さん(「けいおん!」「グッド・ドクター~禁断のカルテ~」など)。長さは計2時間、総ファイルサイズは7

                                      プロ声優を起用した音声合成用データ、無償公開 研究用途に期待
                                    • しゃべった内容を文章に変換する無料のiPhoneアプリ『Dragon Dictation』

                                      海外で先に公開され、その認識率の高さで話題となったiPhoneアプリ『Dragon Dictation 』がついに日本語に対応。App Storeで無料で公開されています。 iPhoneに向かってしゃべった内容をテキストに変換してくれるので、タッチパネルでの文字入力が苦手なひとでも、素早くかつストレス無く大量のメモや長文メールを書くことができます。 アプリの初回起動時に、使用規約への承諾などを求められます。アドレス帳の連絡先をアップロードすると個人名の認識率が高くなるようですが、必須ではありません。 こちらが開発元によるデモ動画。 マイクからの音声入力をサーバーに送信して処理するため、Wi-FIまたは3G回線でネットワークに接続している必要があります。 使用法はいたってシンプルで、録音ボタンを押してマイクに向かってしゃべるだけです。 「完了」ボタンをタップするとデータがサーバーに送信され、

                                        しゃべった内容を文章に変換する無料のiPhoneアプリ『Dragon Dictation』
                                      • iTunes内の重複した曲を表示する方法 | ライフハッカー・ジャパン

                                        デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール

                                          iTunes内の重複した曲を表示する方法 | ライフハッカー・ジャパン
                                        • どこでもファーストクラスな「Bose QuietComfort 20i」は究極に人をダメにするノイキャンイヤホンだった

                                          どこでもファーストクラスな「Bose QuietComfort 20i」は究極に人をダメにするノイキャンイヤホンだった2014.11.25 22:00Sponsored 武者良太 この小ささで、静けさ、大。 もういくつ寝ると師走。そして最後の仕事の追い込みや忘年会をクリアした先にあるのは年末年始の連休です。このタイミングで海外や国内の各地遠方へ飛行機を使った旅行、新幹線などでの国内旅行を楽しむ人も多いでしょう。 しかし長距離移動の場合、ビジネスクラス以上やグリーン車に乗って少しでも乗車環境を良くしたいところ。特にこの季節はどの便も混み合うため、ノイズレベルが普段より高くなりがちですし。 そこでお立ち会い。ヘッドホン・イヤホンのトレンドの1つにノイズキャンセリング機能があります。ハウジングに仕込んだマイクが周囲の環境音・ノイズを集音、耳穴内での反響を加味した上で解析し、DSP(デジタルシグナ

                                            どこでもファーストクラスな「Bose QuietComfort 20i」は究極に人をダメにするノイキャンイヤホンだった
                                          • 棒読みちゃん - ダウンロード(音声合成で日本語文章を読み上げ)

                                            ニコニコ実況が2020/12/16にリニューアルし、ニコ生の機能を利用する形式に変わりました。 旧APIの廃止に伴い棒読みちゃんに添付していたプラグインからは接続できなくなりました。 ニコ生用には棒読みちゃんと連携できるコメントビューアが色々ありますので、そちらと連携してご利用ください。 ■概要 漢字を含む日本語の文章を音声合成で読み上げるツール。 IMEで漢字をひらがなに変換し、AquesTalkで音声合成します。 SAPI5やSpeech Platformの音声合成エンジンにも対応しています。 ■動作環境 Microsoft Windows 2000以上(7の64bit版のみ確認) Microsoft .NET Framework 2.0以上(3.5のみ確認) ■カンパのお願い フリーウェアなので無料でご利用いただけますが、気に入ってくださった方は、ご支援いただければ幸いです。 Ama

                                            • 窓の杜 - 【REVIEW】ループをつなげて簡単に楽曲を制作できる“ACID”のフリー版「ACID Xpress」

                                              「ACID Xpress」は、ループ素材をつなげるだけで簡単に楽曲を制作できるソフト“ACID”シリーズのフリー版。Windows XP/Vistaに対応しており、Sony Creative Software Inc.が運営するミュージシャン向けコミュニティサイト“ACIDplanet.com”からダウンロードできる。なお、ダウンロードにはメールアドレスなどの登録が必要。 WAVE/MP3/WMA形式のループ素材を読み込み、指定したテンポに合わせてピッチを保ったまま自動でタイムストレッチできるのが特長。また、トラック上をドラッグしてループ素材を連続貼り付け可能なほか、貼り付けたループを選択してテンキーの[+][-]キーを押すだけでピッチを半音ずつ変更できるなど、直感的な操作で楽曲を作れるのもうれしい。 利用できるトラック数は10トラックまでで、1つのトラックに異なる複数のループ素材を貼り付

                                              • XMedia Recode

                                                非常に多くのフォーマットに対応した動画&音声ファイル変換ソフト。 主要なものからマイナーなものまで、幅広いフォーマットに対応したメディアコンバーターです。 Intel Quick Sync / Nvidia NVENC を利用した GPU エンコード(H.264 / H.265 / MPEG-2)、解像度変更、クロップ、黒塗り追加、インターレース解除、色調・明るさ補正、回転、ノイズ軽減、特定場面の切り出し、音声のリサンプリング、音量変更、字幕合成、チャプター編集... 等々の機能も付いています。 XMedia Recodeは、幅広いレンジのフォーマットに対応したメディアファイル変換ソフトです。 対応しているフォーマットがとにかく豊富なところが最大の特徴で、メジャーなものからマイナーなものまで大抵のものは変換できるようになっています。 (ウェブ上の動画や、ISO / NRG 形式のイメージフ

                                                  XMedia Recode
                                                • 1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応

                                                  音声合成ソフトの開発と販売を手掛けるAHS(東京都台東区)は2月17日、AI技術により人間らしいトーク音声を合成できるソフトウェア「VOICEPEAK 商用可能 6ナレーターセット」を3月11日に発売すると発表した。価格は1万5800円からと安価だが、追加の許諾を得なくても商用利用できる。対応OSはWindows、MacOS、Linux。 音声合成エンジンは、AI歌声合成ソフト「Synthesizer V」を開発したDreamtonics(東京都台東区)が開発。文章を入力すると、AIが文脈などを基に人間らしく読み上げる。イントネーションや読み上げ速度、感情表現の変更などのコントロールも可能。 同社製の個人向け・商用利用ライセンス別売の製品は1キャラクターで1万円前後のものが多いが、本ソフトには男性3種類、女性3種類、女の子1種類の計7音源が付属。価格は初回限定版が1万5800円、割引なしの

                                                    1.6万円で商用利用も可 AI読み上げソフト「VOICEPEAK」登場 7音源付属、Win・Mac・Linuxに対応
                                                  • 音声だけで完全な長文が書ける技術、東大教授が開発 ささやき声で“改行”や“修正”などコマンドを入力

                                                    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ソニーコンピュータサイエンス研究所(CSL)フェロー・副所長であり東京大学大学院情報学環の暦本純一教授が開発した「DualVoice: A Speech Interaction Method Using Whisper-Voice as Commands」は、キーボードやマウスなどを使用せず、音声入力だけで長い文章が書ける技術だ。文字入力以外のコマンド入力と音声認識ミスによる修正は、通常の声とは別に「ささやき声」で操作する。通常の声とささやき声を使い分ける方法で、ハンズフリーの完全な音声入力を実現する。 音声による文字入力はタイピングに比べて格段に速いため、アイデアを書き留めたり、原稿を素

                                                      音声だけで完全な長文が書ける技術、東大教授が開発 ささやき声で“改行”や“修正”などコマンドを入力
                                                    • 国の機関が提供する音声翻訳アプリが、超多言語対応だし翻訳レベルがめっちゃ高くて「テンション上がる」「会話も怖くない」と話題に

                                                      情報通信研究機構 @NICT_Publicity 情報通信研究機構(NICT)の公式アカウントです。プレスリリース、トピックス、イベント情報を中心に、当機構からお知らせしたい情報を発信します。本アカウントの詳細についてはnict.go.jp/sns.htmlをご覧ください。 nict.go.jp

                                                        国の機関が提供する音声翻訳アプリが、超多言語対応だし翻訳レベルがめっちゃ高くて「テンション上がる」「会話も怖くない」と話題に
                                                      • SoundEngine Free / Cycle of 5th

                                                        SoundEngineは、Windows(2000/XP/Vista)向けサウンド編集ソフトです。WAVEファイルの再生・録音・編集・変換機能をもち、軽快な動作と多彩なエフェクトにより多くの方々からご好評を頂いております。日本人好みな、音声ファイル版メモ帳を目指し開発中。 使い方に困った時はフォーラムを、細かな使い方を知りたい時はオンラインヘルプを、また、使用例などについてはTipsをご覧下さい。 →インストール方法 ※ このソフトは、個人・教育利用及び転載目的にのみご利用頂けます。(ver.4.00から) ※ このソフトによって発生するいかなる結果も、弊社は責任を負いません。 ※ ネットラジオ・Podcast(ポッドキャスト)などのミキシング作業が必要な音声コンテンツ作りには、RadioLine Free(マルチトラック編集ソフト)も利用すると便利です。 ※ カセットテープ・ビデオ・

                                                        • PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記

                                                          PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。 ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan

                                                            PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
                                                          • 初音ミクと「ゆっくり」の声、何が違う? アクエスト社に聞く (1/5)

                                                            ニコニコ動画好きなら、東方Projectの派生キャラクター「ゆっくり」の声はご存知のはず。 「SofTalk」(ソフトーク)という無償ソフトを使って作られた、独特の間延びした口調はまさに「ゆっくり」としか言いようがないわけだが、そのソフトークが使っている音源ライブラリの名を「AquesTalk」(アクエストーク)という。 またUTAU(関連記事)のデフォルト音声として有名な「唄音ウタ」、通称デフォ子の音源も、実はこのAquesTalkだ。 AquesTalkは株式会社アクエストが開発し、無償頒布している音声ライブラリ。元来組み込み向けに開発されたため、非常に容量が小さい。現在はAquesTalk2に発展したが、それでも音声データ込みでわずか約50KBという軽さ。これは競合するものがない。 アクエスト社自身でも、このAquesTalkのライブラリを使った歌唱ソフト「AquesTone」を開発

                                                              初音ミクと「ゆっくり」の声、何が違う? アクエスト社に聞く (1/5)
                                                            • 日本レコード協会「守ろう大切な音楽を」キャンペーンサイト

                                                              CD・レコードの普及促進、著作権意識の啓蒙活動、ゴールドディスク大賞を実施する日本レコード協会(RIAJ)のオフィシャルサイト。CDやレコードの生産実績・売上実績の統計データ、音楽に関する調査・レポートなどを掲載。

                                                              • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

                                                                以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

                                                                  OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
                                                                • {{$root.metatags.ogp.title}}

                                                                  {{$root.metatags.description}}

                                                                  • 無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力

                                                                    市販の歌声合成ソフトとして、ヤマハのVOCALOIDとともに独自の歴史を刻んできた「CeVIO」が1月29日、登場から8年を前に大きく進化。深層学習の技術を取り入れ「CeVIO AI」として、開発元のテクノスピーチが発売した。まずはその歌声を聴いてほしい。 これは、ソフト上で楽譜を打ち込んで再生ボタンを押しただけで出力された音声だ。それだけでこのように人間らしい歌声が出力できる。「しゃくりあげ」や「ビブラート」といった歌唱表現も勝手に付く。メインボーカルとして起用するにはもう少し調整が必要だが、作曲中の仮歌に使うなら文句のないクオリティーになっている。人間らしい歌声を合成するまでの時間が短いため、作業を迅速に進められるのがメリットの一つだ。 CeVIO AIリリースまでの道のり CeVIOは2013年公開のWindows専用音声/歌声合成ソフト。名古屋工業大学が長年研究しているHMM(隠れ

                                                                      無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力
                                                                    • ひるおびの報道について音声学者として思うこと|川原繁人のnote(言語学者・音声学者)

                                                                      5/28日追記:ある先生から咳のデータを見せて頂きました。論文の公開はできないとのことですが、咳における流量は発話における流量に比べて文字通り桁違いでした。また、音圧もこれまた桁違いでした。もちろん発話時の飛沫も大事ですが、咳の恐ろしさを実感する値でした。 *** やはり我慢ができなくなり、動画を撮ってUPしました。でも、書いたのはこちらの記事が先です。 *** 5月21日ごろでしょうか、『ひるおび』という番組で、以下のような仮説が紹介されたようです。日本語で「これはペンです」と言った場合と、英語でThis is a penと言った場合だと、後者の方が飛沫が飛ぶので、それが欧州やアメリカでの完成拡大に繋がっているのではないか、という話しです。 川原は実際の番組を見ておらず、しかも、前後は切り取られているので、どのような文脈だったのか詳しく存知あげていないのですが、音声・言語の専門家としてい

                                                                        ひるおびの報道について音声学者として思うこと|川原繁人のnote(言語学者・音声学者)
                                                                      • 英語の発音記号 読み方と音声サンプル

                                                                        英語の入門書には英単語の発音をカタカナで示したものをよく見かけますが,英語の音はカタカナとは異なります。 多少面倒でも,発音記号の発音の仕方をネイティブの発音と共にきちんと覚え,英単語を発音記号に沿って正しく発音できるようにしておくと将来的に役に立ちます。 (1)母音の発音 (2)子音の発音

                                                                        • Webページやアプリの実装に、知っておくと便利なHTMLの属性のまとめ

                                                                          Webページやアプリの実装に役立つ、知っておくと便利なHTMLの属性を紹介します。すでに使用されているものあると思いますが、いくつはこんな属性もあったのか、と発見があるかもしれません。 24 Lesser-Known HTML Attributes You May Want to Use ✨📚 by Madza (@madzadev) 下記は各ポイントを意訳したものです。 ※当ブログでの翻訳記事は、元サイト様にライセンスを得て翻訳しています。 はじめに 私は少し前に、HTMLのタグについての記事を公開しました。今回はその続編として、知っておくと便利なHTMLの属性を紹介したいと思います。 この記事で紹介する属性はすべて簡単に使用でき、外部ライブラリを使用しなければできないようなタスクを実現するのに役立ちます。 HTMLで特に便利な各属性の使用例と構文を理解しやすいように、コードスニペット

                                                                            Webページやアプリの実装に、知っておくと便利なHTMLの属性のまとめ
                                                                          • 男性が喋っても女性の声になるリアルタイムAIボイスチェンジャー「MMVC」でずんだもんなどがサポート

                                                                              男性が喋っても女性の声になるリアルタイムAIボイスチェンジャー「MMVC」でずんだもんなどがサポート
                                                                            • 「ゆっくりしていってね!!!」の声はどうやって生まれたのか 開発者が語る“起業エンジニアの生存戦略”

                                                                              「ゆ っ く り し て い っ て ね ! ! !」 ニコニコ動画などで10年超にわたって使われているフレーズですから、ご存じの方は“脳内再生余裕でした”という感じでしょう。ゲーム実況などの分野では「ゆっくりボイス」と呼ばれる合成音声を使う手法が定着しており、耳にしただけで、丸っこくデフォルメされた東方Projectのキャラクターが頭に浮かぶ人もいるのではないでしょうか。 筆者は「魔理沙だぜ」の方が脳内再生しやすいです(AsciiArt*AsciiArtより) しかし、意外と知られていないのは、この合成音声の“正体”です。 使用されているエンジン「AquesTalk」は本来、動画制作ではなく、組み込み用途向けに開発されたもの。また、有名声優などの声をベースにしているわけでもなく、エンジニアが自分の耳を頼りにチューニングし、手作業で作り上げたといいます。 今や「日本におけるインターネット文

                                                                                「ゆっくりしていってね!!!」の声はどうやって生まれたのか 開発者が語る“起業エンジニアの生存戦略”
                                                                              • ビデオ会議中、マイクが“ミュート”でも音が取得されている問題 米国チームが検証

                                                                                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米University of Wisconsin-Madisonと米Loyola University Chicagoの研究チームが発表した「Are You Really Muted?: A Privacy Analysis of Mute Buttons in Video Conferencing Apps」は、一般的なビデオ会議アプリにおいて、マイクをミュートにしている状態であっても音を取得できる可能性を指摘した論文だ。 結果は、全ての主要なビデオ会議アプリに対し、ミュート時でもやろうと思えば音を取得できる状態であることが示された。さらにWebexに関しては、マイクのミュートのオン/オ

                                                                                  ビデオ会議中、マイクが“ミュート”でも音が取得されている問題 米国チームが検証
                                                                                • 24bit/192kHzにも対応。元Rolandのエンジニアが開発したiPhone/iPad用の無料リニアPCMレコーダーアプリ、『オーディオ・レコーダー』がシンプルで便利|DTMステーション

                                                                                  そう、このオーディオ・レコーダーを使うことで、最高で24bit/192kHzのレコーディングができるわけです。また録音したデータは、このアプリ内で再生することができるのはもちろんですが、wavおよびm4aのファイルで保存されるので、これをCubasisやAuriaをはじめとするiOSのDAWなど、別のアプリに持っていって利用することもできるし、MacやWindowsに転送して、PCで利用するということも可能。 オーディオ・レコーダーの設定画面 つまり、いざというときにiPhoneでオーディオ・レコーダーを起動して、録音し、家に持ち帰ってからDAWや波形編集ソフトでじっくり編集……といった使い方ができるわけです。 「でもiPhone単体で24bit/192kHzなんて録音できるんだっけ?」と思った方もいると思います。その通り、iPhoneやiPad本体のマイクから録音する場合は最高で24bi

                                                                                    24bit/192kHzにも対応。元Rolandのエンジニアが開発したiPhone/iPad用の無料リニアPCMレコーダーアプリ、『オーディオ・レコーダー』がシンプルで便利|DTMステーション