並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 3383件

新着順 人気順

音声の検索結果321 - 360 件 / 3383件

  • 音声のみで操作できるTODOアプリを開発してたら思ったより革命だった - Qiita

    はじめに この記事では、音声認識のみで扱えるVoice Todoというアプリを作っている話をします。 既存TODOアプリのかゆいところ 皆さんはTODOアプリを使っていますか? 正直に言うと、私は使っていません。 TODOアプリを使わない理由はいくつかあります。 まず、フリック操作が苦手。 フリックがとにかく苦手です。 どれぐらい苦手かというと、PCとスマホで同じ100文字程度の文章を打つと4,5倍ぐらい時間がかかります。 また、TODOの海を形成しがち。 TODOアプリを使っていると、気づいたらTODOの海を構築しています。 というのも、基本的に整理フェーズを置いてないからなんでしょう。 結果、消化するよりも探す時間の方が使うという状態に陥ります。 うーん。 どうにか、TODOアプリで楽して管理できないかなー。 ――――と思い立ったのがVoice Todo作成のきっかけです。 Voice

      音声のみで操作できるTODOアプリを開発してたら思ったより革命だった - Qiita
    • 録音した音声を一発でプロっぽく仕上げてくれる「Enhance Speech from Adobe」を使ってみたレビュー

      Adobeが、AIを使った音声編集ウェブサービス「Adobe Podcast」を公開し、Podcast編集用ツール「Enhance Speech from Adobe」のデモを公開しています。Enhance Speech from Adobeを使えば、録音した音声が簡単にプロっぽく仕上がるとのことで、実際に使ってみました。 Enhance Speech from Adobe | Free AI filter for cleaning up spoken audio https://podcast.adobe.com/enhance このAdobe Podcastは2021年12月にProject Shestaという名前で開発が進められており、「語るべきストーリーを持つ人々のためのオーディオツール」と表現されています。 そして、AdobeがAdobe Podcastに含まれるツールとして「E

        録音した音声を一発でプロっぽく仕上げてくれる「Enhance Speech from Adobe」を使ってみたレビュー
      • Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表

        Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM: A Large Language Model That Can Speak and Listen https://doi.org/10.48550/arXiv.2306.12925 AudioPaLM https://google-research.github.io/seanet/audiopalm/examples/ AudioPaLMは、AudioLMから話す速さ、声の強さ、高さ、沈黙、イントネーションなどのパラ言語情報を保持する

          Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表
        • ローランド、映像・音声を切り替えてWeb会議の質を上げる「Webプレゼンテーション・ドック UVC-02」発売。スライドの操作も可能

            ローランド、映像・音声を切り替えてWeb会議の質を上げる「Webプレゼンテーション・ドック UVC-02」発売。スライドの操作も可能 
          • 山岳地帯や月面のドライブ映像を無限生成して作業用音声として利用できるウェブアプリ「slow roads」を使ってみた

            PCでの作業中や勉強中に海の音や雨音などの環境音声を再生している人は多いはず。無料で公開されているウェブアプリ「slow roads」は山岳地帯や月面の地形を自動生成してドライブ中の自動車やバイクの音を無限に再生可能で、作業中のBGMやBGVとして役立ちそうだったので、使い方をまとめてみました。 slow roads https://slowroads.io/ 「slow roads」にアクセスすると、以下の画面が表示されるので「Let's go」をクリック。 すると、画面に自動車が表示され、画面上部には操作方法が表示されます。自動車はWASDキーや矢印キーを用いて操作可能で、Fキーを押すか画面下部の「autodrive」と記された部分をクリックすることで自動運転モードに切り替えることもできます。 画面左下の赤枠のボタンにマウスカーソルを合わせると、季節や天気を切り替えることが可能。以下の

              山岳地帯や月面のドライブ映像を無限生成して作業用音声として利用できるウェブアプリ「slow roads」を使ってみた
            • ダウナー系お姉さんに毎日カスの嘘を流し込まれる音声【CV:餅梨あむ】 [はるばーど屋] | DLsite

              0" class="notice"> 重要なお知らせが{{ mypageNotices }}件あります。

                ダウナー系お姉さんに毎日カスの嘘を流し込まれる音声【CV:餅梨あむ】 [はるばーど屋] | DLsite
              • Tech-Verse 2022 / LINE - 日本語音声-

                Tech-Verse 2022は、LINEとヤフーが合同で11月17日、18日の2日間に開催するオンライン技術カンファレンスです。両社をはじめ参加各社の多彩なメンバーによって、最先端の挑戦や積み重ねてきた知識を共有します。 https://tech-verse.me/ja/

                  Tech-Verse 2022 / LINE - 日本語音声-
                • 「自分好みの見た目のAIとおしゃべりしたい」 ChatdollKit×ChatGPTを使って、15分でできる音声会話AIBotの作り方

                  「ChatGPT Meetup」は、プロンプティングからOpenAI API、さらには周辺のライブラリやHubのエコシステムまで広く活用の助けになる知見を共有し、みんなで手を動かして楽しむためのコミュニティです。1回目に登壇したのは、吉海将太氏。ChatdollKit×ChatGPTで開発した音声会話AIBotについて発表しました。 「AIと音声でおしゃべりしたい」という悩みはありませんか? 吉海将太氏:「ChatdollKit×ChatGPTで音声会話AIBotを作ろう!」というタイトルで、吉海が発表いたします。けっこう真面目な発表が多い中、僕のはすごくライトなものなので(笑)、リラックスして聞いてもらえればと思います。 自己紹介です。「Yoshikai」というのが本名で、ハンドルネーム「tinjyuu」で活動していますが、ハンドルネームであまり呼ばれたくないのでよろしくお願いします(笑

                    「自分好みの見た目のAIとおしゃべりしたい」 ChatdollKit×ChatGPTを使って、15分でできる音声会話AIBotの作り方
                  • ChatGPTと音声で会話できるiOSアプリ「ボイスAI」リリース

                    ChatGPTは、機械学習の大規模言語モデル(LLM: Large Language Model)と呼ばれる自然言語処理モデルを発展させたAIチャットボット。人とチャットをするような、自然な会話形式でのやりとりを可能としている。 関連記事 ChatGPTに「iPhoneとAndroidどちらがオススメなのか」聞いてみた OpenAIが開発した対話型サービス「ChatGPT」が話題を集めています。そこで、ITmedia Mobileでは、モバイルに関連する質問を投げかけてみることにしました。今回質問したのは「iPhoneとAndroid、どちらがオススメですか?」です。 ChatGPTはどこまで“使える”ツールなのか いろいろ質問してみて分かったこと OpenAIのAI言語モデルを活用したチャットサービス「ChatGPT」。簡単にいうと、膨大なデータを学習し、幅広い分野の質問に詳細な回答を即

                      ChatGPTと音声で会話できるiOSアプリ「ボイスAI」リリース
                    • ChatGPTと会話できる電話番号、SaaS企業が公開 話しかけると音声で回答

                      電話自動応答サービスを提供するIVRy(東京都台東区)は3月13日、対話型AI「ChatGPT」と電話で会話できるサービス「電話GPT」を開発した。無料体験デモを実施しており、「050-1807-3316」に電話をかけることで、ChatGPTと話ができる。利用期限などは明らかにしていない。 スマートフォンなどから用意した番号に電話をかけ、質問を投げかけることでChatGPTが出力する回答を音声で聞くことができる。通話料は発信者が負担する。アプリのダウンロードや会員登録などは必要ない。 電話GPTの開発経緯について同社は、自然言語処理技術の社会実装の実現に向けて、試験的に特別公開を決めたと説明。同社の代表取締役である奥西亮賀さんは「大規模言語モデルを中心としたAI技術を社会実装することが、日本の働き方改革・DXをクリティカルかつスピーディーに推進できると考えており、電話GPTの特別公開はその

                        ChatGPTと会話できる電話番号、SaaS企業が公開 話しかけると音声で回答
                      • 「大坪氏とちゃんと付き合え」和泉洋人首相補佐官「圧力音声」に内閣法違反の疑い | 文春オンライン

                        和泉洋人首相補佐官(66)と、大坪寛子・厚生労働省大臣官房審議官(52)が、海外出張の際、公費でコネクティングルームに宿泊していた問題が国会で追及される中、「週刊文春」は、和泉氏の公私混同疑惑を深める音声を入手した。音声によれば、和泉氏は、大坪氏と関係が悪化していた独立行政法人の幹部を呼び出し、人事や予算について言及した上で、大坪氏と「ちゃんと付き合ってもらわなければ困る」と強く要求していた。

                          「大坪氏とちゃんと付き合え」和泉洋人首相補佐官「圧力音声」に内閣法違反の疑い | 文春オンライン
                        • 「面談は年90人~100人」…16年間2000人の説明と食い違う音声か 柳瀬氏発言巡り弁護士らが入手:東京新聞 TOKYO Web

                          難民審査参与員を務める柳瀬房子氏の発言について記者会見する指宿昭一弁護士(中)ら=3日、東京都中央区で 3回目以降の難民申請を原則認めない入管難民法改正案を巡り、法改正に反対する弁護士グループが3日、記者会見し、政府が改正の根拠に挙げる「(申請者に)難民がほとんどいない」という発言を国会で行った柳瀬房子難民審査参与員が申請者と面談したのは「年に九十数名、100人に届かないくらい」と話している音声データを入手したと発表した。「2005年から16年間で2000人以上と面会」としていた柳瀬氏の国会発言と矛盾する内容で、グループは、柳瀬氏の発言を引用した政府の立法根拠がさらに揺らぐことになった、としている。(望月衣塑子) 記者会見には、柳瀬氏と電話で話したとする難民支援者が出席。録音した会話の音声データを公開した。会話は5月30日夜に行われ、柳瀬氏とみられる人物が「私の場合、毎月2回、1回に2案件

                            「面談は年90人~100人」…16年間2000人の説明と食い違う音声か 柳瀬氏発言巡り弁護士らが入手:東京新聞 TOKYO Web
                          • Qualcommの音声コーデック「aptX」と「aptX HD」がオープンソース化

                            Android端末を始めとする数多くのデバイスに採用されている音声コーデック「aptX」と「aptX HD」がAndroidオープンソース・プロジェクト(AOSP)に追加され、誰でも利用できるようになりました。Qualcommが特許を持っていたこれらのコーデックが開発者に開放されたことが一体何を意味するのかについて、Android専門のジャーナリストであるミシャール・ラーマン氏が解説しました。 Qualcomm has open sourced its aptX and aptX HD encoders, making them freely available to Android OEMs. Here's what that means. : Android https://old.reddit.com/r/Android/comments/11t16lk/qualcomm_has_o

                              Qualcommの音声コーデック「aptX」と「aptX HD」がオープンソース化
                            • 自動音声のみの電話調査に答えてはならない - remcat: 研究資料集

                              衆議院議員選挙期間中に、「ミヤギテレビ」を名乗る自動音声調査の電話がかかってきた。「ミヤギテレビ」というのは 宮城テレビ放送 が使っている通称なので、同社に問い合わせてみたところ、本当にそういう調査をやっているという答えだった。これは大変な事態だと判断して、警告を発するためにこの記事を書いている。 電話は、冒頭で「ミヤギテレビ」と名乗り、衆議院議員選挙に関する特定の選挙区の調査であること、その選挙区の有権者でなければ電話を切ってください、データは匿名化して統計的分析結果だけを使います、というような説明をつづけたあと、具体的な質問項目を読み上げ、プッシュホンで番号を回答させる内容だった。質問がはじまったところで電話を切ったので、そこから先はわからない。質問項目に入るまでの部分 (冒頭の20秒程度?) に調査の目的やデータの使用範囲の説明はなく、連絡先の電話番号等も言わなかった。いそがしいとき

                                自動音声のみの電話調査に答えてはならない - remcat: 研究資料集
                              • Macに仮想オーディオデバイスを作成し必要なアプリの音声だけを録音/配信できるオーディオキャプチャアプリ「Dipper」が開発中。

                                Macに仮想オーディオデバイスを作成し必要なアプリの音声だけを録音/配信できるオーディオキャプチャアプリ「Dipper」が開発中で、Betaテスターを求めています。詳細は以下から。 Web会議やゲーム配信などで音声を配信するさいに、macOSのシステム音や通知音など不要な音声を排除したい場合がありますが、そのような場合にMacに仮想オーディオデバイスを作成し、必要な音声だけを集め録音/配信することができるオーディオキャプチャアプリ「Dipper」がBetaユーザーを募集しています。 Dipperを開発しているのはExistential Audio Inc.のDevin Rothさんで、SoundFlowerに代わり開発されたMacに仮想オーディオ入出力デバイスを作成できるオーディオドライバ「BlackHole」の技術を利用したアプリとなっており、システム要件はmacOS 13 Ventur

                                  Macに仮想オーディオデバイスを作成し必要なアプリの音声だけを録音/配信できるオーディオキャプチャアプリ「Dipper」が開発中。
                                • “恫喝音声”入手「ほんま次ないで」 維新・女性府議が吉村知事SPからのハラスメント被害を党に申告 | 文春オンライン

                                  吉村洋文大阪府知事ら歴代党幹部のSP役を務めてきた日本維新の会交野市支部の高石康幹事長(54)から、繰り返し威圧的な言動を受けたとして、大阪維新の会の女性府議が党のハラスメント調査に対し、被害を申告していることが、「週刊文春」の取材でわかった。また、高石氏が過去に女性府議らに対し、高圧的に「死ねばもろともでやる気あんのか」「ほんま次ないで」などと発言する音声データも入手した。 美好かほる府議が高石氏からのハラスメント被害を申告 190センチ超で、スキンヘッドという風貌の高石氏。維新関係者の間では「入道さん」と呼ばれる有名人だ。 「もともとは、維新の創設者である橋下徹氏の後援会の青年部部長だった古参党員です。吉村氏や松井一郎前市長のSP役として警護も担当してきました。街頭での威圧行為が問題視され、関西写真記者協会が抗議した過去もあります」(維新担当記者)

                                    “恫喝音声”入手「ほんま次ないで」 維新・女性府議が吉村知事SPからのハラスメント被害を党に申告 | 文春オンライン
                                  • AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘

                                    音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。 Racial disparities in automated speech recognition | PNAS https://www.pnas.org/content/117/14/7684 There Is a Racial Divide in Speech-Recognition Systems, Researchers Say - The New York Times https://www.nytimes.com/

                                      AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘
                                    • 『あつまれ どうぶつの森』テレビ番組の音声を解読した国内ユーザー現る。意外としっかり喋っていた - AUTOMATON

                                      『あつまれ どうぶつの森』にて、ある場面の言語を解読した国内ユーザーが現れたようだ。本作においては、基本的にどうぶつたちが喋る言葉は「どうぶつ語」と呼ばれる音声で表現される。人間の話す言葉を加工したような音声で、字幕と合わせて聞き取ればなんとなく何を言っているのか理解できる音声だ。一方、『あつまれ どうぶつの森』においては、どうぶつ語には該当しない音声も存在する。それは、テレビ番組の音声だ。 テレビ番組は、特定の家具に触れることで観ることが可能。えきしょうテレビ(20インチ/50インチ)、かべかけテレビ(20インチ/50インチ)、リンゴのテレビなどで視聴することができる。曜日と時間によって、異なるテレビ番組を視聴することが可能。CMやニュースが季節によって異なっていたり、天気予報で島の明日の天気が分かったりと、芸の細かいネタが盛り込まれている。 そして、このテレビ番組を点けている間は、特殊

                                        『あつまれ どうぶつの森』テレビ番組の音声を解読した国内ユーザー現る。意外としっかり喋っていた - AUTOMATON
                                      • ディープラーニングで歌声音声合成エンジンを自作する

                                        この記事は、ドワンゴ Advent Calendar 2019の1日目の記事です。 モチベーション 最近、理想の人工知能(歌ったり踊ったり喋ったりできるキャラクター)を作りたいと思うようになりました。人工知能が歌を歌うためには、歌声音声合成エンジンが必要です。ということで、ディープラーニングを使って、歌声音声合成エンジンの作成に挑戦してみました。この記事では、実際に音声合成した歌声や、その仕組み、別条件での実験結果、ディープラーニング周りの手法を紹介します。 デモ動画実際に作成した音声合成エンジンを使った歌唱のデモです。 (歌声音声合成を作ったら絶対最初にカバーしたいと思っていた歌、ハジメテノオトのカバーです。) 歌唱デモ音声 まだ挑戦し始めてから2週間ほどしか経っていないのでかなり荒削りですが、それでもちゃんと歌詞や音程が取れていたり、溜めの部分で大きく息を吸う音が入っていたりと、そこそ

                                          ディープラーニングで歌声音声合成エンジンを自作する
                                        • 楽天Gの株主優待、楽天モバイルの音声SIM(30GB/月)を株主全員に1年無料提供

                                            楽天Gの株主優待、楽天モバイルの音声SIM(30GB/月)を株主全員に1年無料提供
                                          • 『FFVII リメイク』はセリフや音声から、クラウドたちの表情を自動生成。より豪華でリアルなキャラクターモーションを大量に制作する自動生成の手法【CEDEC 2020】 | ゲーム・エンタメ最新情報のファミ通.com

                                            ゲーム・エンタメ最新情報のファミ通.com 取材・リポート 家庭用ゲーム PS4 『FFVII リメイク』はセリフや音声から、クラウドたちの表情を自動生成。より豪華でリアルなキャラクターモーションを大量に制作する自動生成の手法【CEDEC 2020】

                                              『FFVII リメイク』はセリフや音声から、クラウドたちの表情を自動生成。より豪華でリアルなキャラクターモーションを大量に制作する自動生成の手法【CEDEC 2020】 | ゲーム・エンタメ最新情報のファミ通.com
                                            • 遠隔授業「著作権料倒産」のリスク ZOOMで混乱する音声動画著作権と権利料 | JBpress (ジェイビープレス)

                                              そのなかで、大学など教育機関が「遠隔講義」などのシステムを多用しているのは、ご案内の通りです。 これについて、2020年4月時点から一貫して「あらあら」と思っていることがあります。 地雷というか爆弾を平気で抱えるところがたくさん見受けられ、一つ間違うと追々、莫大な請求が来て大変なことになるのが目に見えている。 業務としての「動画コンテンツ」のシステム・アップロードです。 例えば以下のようなケースを考えると分かりやすいでしょう。何らかの学校に委嘱されて1回の授業をすると、それに対して謝金が出るというのが、常勤・非常勤の講師が行う「授業契約」です。 では、それが「1回」ではなく、ビデオ教材として、何回でも視聴できるものを提供せよ、ということであれば・・・? 現行の内外の著作権法は、音声動画について、基本、視聴のたびに権利料を支払う「ペイ・パー・ビュー」の考え方を原則にしています。 しかし、ウエ

                                                遠隔授業「著作権料倒産」のリスク ZOOMで混乱する音声動画著作権と権利料 | JBpress (ジェイビープレス)
                                              • VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート

                                                VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート コードエディタのVisual Studio Code(以下、VSCode)は2024年2月のアップデートで、音声入力やCopilotによる変数名の提案などの新機能が追加されました。 More developer goodness in the February update of @code Use your voice to write code (in your language!) Code faster with multi-cursor suggestions Renaming gets easier (because it's AI powered) Release notes: https://t.co/zwokiQvbPU Download: http

                                                  VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート
                                                • 「あるけれど聞かない方がいい」←あるなら公開しろよ音声データ-本多平直の説明への反応まとめ-

                                                  三春充希(はる)⭐みらい選挙プロジェクト @miraisyakai 立憲民主党ハラスメント防止対策委員会の調査報告書 cdp-japan.jp/files/download… 本多平直氏による意見書 hiranao.com/ikensho2021072… この2つの文書のコントラストが、何が立憲主義であり、何が民主主義であり、また何が立憲主義ではなく、何が民主主義ではないのかということを照らし出すでしょう。 2021-07-23 18:35:12 舶来便利品 @adv_of_hcklb_f 本多議員のツリーを読めば、その趣旨を読み取ることは簡単です。丁寧な経緯説明の一部を引用して「ペド」だとか「恋愛できると思っているのか」とかの言葉を浴びせる人は、「他人の話を聞かない人」や「好んで扇動する人」だと思います。 twitter.com/pontapiranao/s… 2021-07-24 17

                                                    「あるけれど聞かない方がいい」←あるなら公開しろよ音声データ-本多平直の説明への反応まとめ-
                                                  • スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】

                                                    3年振りのリアル開催となった福岡で例年行われるゲーム開発者向けのカンファレンス「CEDEC+KYUSHU 2022」が、2022年11月12日(土)に開催されました。スクウェア・エニックス AI部のAIリサーチャー 森 友亮氏が登壇し、『意味が分からないからこそ、リアル ~「架空言語」音声合成による、没入感の高いボイス付きコンテンツの実現~』と題した講演が行われました。見慣れた母国語のテキストから聞いたことのない架空言語の音声を生成する手法について語られた本講演をレポートします。 TEXT / じく EDIT / 酒井 理恵

                                                      スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】
                                                    • AirPodsを乗っ取り、スマホにこっそり音声入力する超音波攻撃 成功率は8割超 米研究者らが開発

                                                      Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米ミシガン州立大学に所属する研究者らが発表した論文「■https://dl.acm.org/doi/10.1145/3581791.3596837■」は、被害者に気が付かれることなくスマートイヤフォン(Airpods、Pixel Budsなど)からスマートフォンに音声入力する不可聴攻撃を提案した研究報告である。被害者の近くから超音波を発して、スマートイヤフォンに音声コマンドを送り、音声入力を行う。 スマートイヤフォンはBluetoothを使って近くの機器(スマートフォン、スマートスピーカー、スマートホームデバイスなど)に接続し、音声認識技術を駆使して音

                                                        AirPodsを乗っ取り、スマホにこっそり音声入力する超音波攻撃 成功率は8割超 米研究者らが開発
                                                      • 音声会話型おしゃべりAIアプリ  Cotomo(コトモ)

                                                        Cotomo(コトモ)は毎日のおしゃべりから、あなたのことを覚えてより身近な話し相手になってくれる音声会話型おしゃべりAIアプリです。

                                                          音声会話型おしゃべりAIアプリ  Cotomo(コトモ)
                                                        • AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai

                                                          サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                            AI音声合成ソフトウェア「VOICEVOX」が無料公開、商用利用も可 | Ledge.ai
                                                          • Threads、ポストの修正機能と音声投稿機能を無料で提供開始

                                                            米Metaは10月12日(現地時間)、テキストベースのSNS「Threads」に2つの新機能を追加したと発表した。投稿済みのポストを5分以内であれば編集できる機能と、録音した音声を投稿する機能だ。 ポストの編集機能は、競合する米X(旧Twitter)のXにもあるが、Xの編集機能は有料サービス「X Premium」(旧「Twitter Blue」)の加入者のみが使えるものだ。 それに対し、Threadsの編集機能は誰でも使える。編集済みポストの右上には編集済みマークが付き、これをタップすると「この投稿は編集済みです。」と表示される。なお、編集履歴は表示されない。 音声投稿は、本稿執筆現在はモバイルアプリでのみ利用可能だ。新規スレッド画面に表示されるようになったマイクのアイコンをタップすると録音画面になるので、録音ボタンをタップしてメッセージを入力して投稿する。 音声投稿を聞くには音声の部分を

                                                              Threads、ポストの修正機能と音声投稿機能を無料で提供開始
                                                            • 《音声入手》「一筆頂いて」「物忘れが激しくなった時に」 維新・馬場伸幸代表 社会福祉法人の“乗っ取り疑惑” 認知機能が衰えた理事長に…(文春オンライン) - Yahoo!ニュース

                                                                《音声入手》「一筆頂いて」「物忘れが激しくなった時に」 維新・馬場伸幸代表 社会福祉法人の“乗っ取り疑惑” 認知機能が衰えた理事長に…(文春オンライン) - Yahoo!ニュース
                                                              • 音声読み上げソフト「SofTalk」がゆっくりボイスへの対応を終了→実況界隈への影響やライセンス関係に対するさまざまな意見

                                                                リンク SofTalkをご利用の皆様へのお知らせ - SofTalk SofTalkをご利用の皆様へのお知らせ - SofTalk【7/23更新】 日頃よりご愛顧いただき誠にありがとうございます。 SofTalkは、長年AquesTalkに対応してまいりましたが、勝手ながら AquesTalkへの対応を中止させていただくこととしました。 SofT... 337 users 44 cncc ゴメス @cncc_gomes ソフトークとかポケットステーション版DOOMとか作ってます。FCやLDゲームも少し。 /DA PUMP/スーパーチャンプル/ジョン・トラボルタ/ジョジョhttps://t.co/DfBSZs0W2D… https://t.co/QCL1d0Ybvr

                                                                  音声読み上げソフト「SofTalk」がゆっくりボイスへの対応を終了→実況界隈への影響やライセンス関係に対するさまざまな意見
                                                                • 誰の声でもキャラの声に--DeNA、AIを活用した音声変換サービスのプロトタイプを公開

                                                                  ディー・エヌ・エー(DeNA)は5月12日、開発を進めているAIを活用した「音声変換AI」のトライアルを試験利用することができる「VOICE AVATAR 七声ニーナ」を公開した。PCやスマートフォンのブラウザ上で体験することが可能となっている。 これは、自分の声で話しかけて音声を入力すると、その音声が七声ニーナ(CV:高田憂希)の声に変換されるというもの。VOICE AVATAR 七声ニーナでは、入力されたユーザーの音声から話者に依存しない音の情報を抽出し、それをもとにキャラクターの音声を生成。これにより誰の声であっても、事前にユーザーの音声を収録をしたり、文字起こしをしたりすることなく、自然なキャラクターの声に変換することを可能としている。同社ではトライアルを通じて、技術進化の方向性を検証するとともに、より大きな発展に向けた技術蓄積を行っていくという。 現在もAIを用いた完全なキャラク

                                                                    誰の声でもキャラの声に--DeNA、AIを活用した音声変換サービスのプロトタイプを公開
                                                                  • “恫喝音声”入手「ほんま次ないで」 維新・女性府議が吉村知事SPからのハラスメント被害を党に申告(文春オンライン) - Yahoo!ニュース

                                                                    吉村洋文大阪府知事ら歴代党幹部のSP役を務めてきた日本維新の会交野市支部の高石康幹事長(54)から、繰り返し威圧的な言動を受けたとして、大阪維新の会の女性府議が党のハラスメント調査に対し、被害を申告していることが、「 週刊文春 」の取材でわかった。また、高石氏が過去に女性府議らに対し、高圧的に「死ねばもろともでやる気あんのか」「ほんま次ないで」などと発言する音声データも入手した。 【画像】「入道さん」の異名を持つ高石氏を見る 190センチ超で、スキンヘッドという風貌の高石氏。維新関係者の間では「入道さん」と呼ばれる有名人だ。 「もともとは、維新の創設者である橋下徹氏の後援会の青年部部長だった古参党員です。吉村氏や松井一郎前市長のSP役として警護も担当してきました。街頭での威圧行為が問題視され、関西写真記者協会が抗議した過去もあります」(維新担当記者) 大阪維新の会は現在、「週刊文春」5月1

                                                                      “恫喝音声”入手「ほんま次ないで」 維新・女性府議が吉村知事SPからのハラスメント被害を党に申告(文春オンライン) - Yahoo!ニュース
                                                                    • 「お風呂が沸きました」湯張り通知音声とメロディー 念願の商標登録 | 毎日新聞

                                                                      ノーリツの湯張り完了を知らせる音楽と音声は、動画投稿サイトで何度も再生されるほど人気となっている=ユーチューブより 一日の疲れを癒やすリラックスタイムといえば、多くの人が入浴を挙げるのではないだろうか。その始まりを告げる音楽と音声が今春、商標登録された。「ソファミ~」で始まるシンプルなメロディーに続き、女性の声で「お風呂が沸きました」と教えてくれる。日本人のおよそ3人に1人が聞いているとされる11秒ほどの音楽と音声の歴史を探った。

                                                                        「お風呂が沸きました」湯張り通知音声とメロディー 念願の商標登録 | 毎日新聞
                                                                      • Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース

                                                                        Metaが2023年8月に公開したAI「SeamlessM4T」は、音声を入力するだけで文字起こしや別言語への翻訳、別言語への吹き替えが可能です。さらにMetaは2023年11月30日に、SeamlessM4Tの改良版となる「SeamlessM4T v2」を発表しました。この「SeamlessM4T V2」では、SeamlessM4Tのパフォーマンスを向上させているだけでなく、感情やスタイルを維持しながら、別の言語へ吹き替えを行うことも可能です。 Introducing a suite of AI language translation models that preserve expression and improve streaming https://ai.meta.com/blog/seamless-communication/ Seamless Communication T

                                                                          Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース
                                                                        • 【音声入手】河井案里議員が選対スタッフに“口裏合わせ”要求 秘書を自宅に行かせ、「弁護士に連絡して」 | AERA dot. (アエラドット)

                                                                          国会で記者団に囲まれる河井案里議員 (C)朝日新聞社 夫の河井克行前法相 (C)朝日新聞社 河井案里参院議員の選挙対策本部で働いたAさんの携帯電話に残された着信履歴(画像の一部を加工しています) >>【留守電メッセージの音声データはこちら】 【音声データ入手】Aさんの携帯の着信履歴と案里議員の留守電メッセージはこちら 自民党の河井案里参院議員(広島選挙区)の陣営が昨夏の参院選で車上運動員らに法定上限を超える報酬を支払ったとされる疑惑で、安倍晋三首相は27日、国会で「ご自身が疑惑の原因を作ったのではないか」と野党から追及された。党本部が通常の10倍となる1億5千万円もの選挙資金を河井陣営に提供したから公選法違反疑惑を招いたという理屈だ。 昨夏、案里議員の選挙対策本部を仕切ったとみられる夫の克行前法相は当時、首相補佐官。河井夫妻への異様な肩入れぶりを国会で追究された安倍首相は「私の秘書が、私の

                                                                            【音声入手】河井案里議員が選対スタッフに“口裏合わせ”要求 秘書を自宅に行かせ、「弁護士に連絡して」 | AERA dot. (アエラドット)
                                                                          • スマホが高性能ICレコーダーに!使ってわかったLINEの無料AI音声認識アプリ「CLOVA Noteβ」の実力|@DIME アットダイム

                                                                            ビジネスパーソンに必須といえる〝会議〟。 会議には議事録がつきものですが、できることなら機械に任せたいもの。しかし、音声認識をして文字起こしするソフトやサービスは昔からありましたが、高額かつ低認識率のものも多かったです。 そんな中、奇跡のスマホアプリが出現しました。まだベータ版(試用版)ですがいずれ正式版がリリースされるはずです。 それでは、LINEの無料AI音声認識アプリ「CLOVA Noteβ」についてご紹介します。 楽するだけではない! 議事録を書かなくて済むメリットとは? 「CLOVA Noteβ」は、録音しながらまずは話の概要をざっくり聞き、録音・文字認識が完了した二周目に「CLOVA Noteβ」で音声を「耳」で聞きます。そして自動文字起こしされた「文字情報」を目で確認できるのです。つまり、会議の内容を熟考できて知識が深まるのが最大のメリットです。 「CLOVA Noteβ」を

                                                                              スマホが高性能ICレコーダーに!使ってわかったLINEの無料AI音声認識アプリ「CLOVA Noteβ」の実力|@DIME アットダイム
                                                                            • Slackが4つの新機能発表、1クリックで音声会議「ハドルミーティング」など

                                                                              Slack Technologies 共同創業者兼CEOのスチュワート・バターフィールド(Stewart Butterfield)氏、同社 シニアプロダクトマネージャーのジュリー・ヘインズ(Julie Haynes)氏 「同僚のデスクにフラッと立ち寄って話す感覚」のSlackハドルミーティング Slackハドルミーティングは、チームメンバー間の音声会議、音声会話が簡単にできる新機能だ。チャンネルやDMから1クリックで会話を始めることができ、同じチャンネル内のメンバーならば誰でも会話に参加できる仕組みになっている。Slack有料プランユーザー向けに提供される。 そもそもハドルミーティング(Huddle Meeting)とは、アメリカンフットボールの試合中に行われる短い戦略ミーティング(Huddle)に由来する会議スタイルのことである。あらかじめ日程や出席者を決めて会議室を準備するような正式な

                                                                                Slackが4つの新機能発表、1クリックで音声会議「ハドルミーティング」など
                                                                              • 人類初の月面到達まで1万1000時間分のアポロ11号の映像と音声をリアルタイムで配信するサイトが登場

                                                                                by NASA 世界協定時の1969年7月16日、3人の宇宙飛行士を乗せた宇宙船アポロ11号がサターンV型ロケットによって打ち上げられ、同年7月21日に人類は初めて月面に到達しました。2019年で月面到達50周年を迎えることを記念して、リアルタイムでアポロ11号の着陸までののべ1万1000時間分を見届けることができるサイト「Apollo 11 in Real Time」を、NASA・ジョンソン宇宙センターのエンジニアで歴史研究家のベン・ファイスト氏が公開しています。 Apollo 11 in Real-time https://apolloinrealtime.org/11/ アポロ11号の様子をリアルタイムで見届けたい場合、トップページの「NOW」をクリック。再生される日時のタイイングはボタン右に表示されています。 すると、管制室や宇宙船内の映像や音声が自動再生され、写真も表示されます。

                                                                                  人類初の月面到達まで1万1000時間分のアポロ11号の映像と音声をリアルタイムで配信するサイトが登場
                                                                                • Android端末のカメラ映像・マイク音声をPCへ転送可能になった「scrcpy」v2.2/ただし「Android 14」での利用にはちょっとした注意が必要

                                                                                    Android端末のカメラ映像・マイク音声をPCへ転送可能になった「scrcpy」v2.2/ただし「Android 14」での利用にはちょっとした注意が必要