並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 48件

新着順 人気順

音声の検索結果1 - 40 件 / 48件

  • 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

    米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

      「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
    • 商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生|DTMステーション

      ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS=Text to Speech(音声読み上げソフト)の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。 さらにStoryblocksという音素

        商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生|DTMステーション
      • 声優・田村ゆかり、肺炎および急性声帯炎による音声障害 「10日間程度の沈黙」必要でライブ延期

        公式サイトでは「先日からの喉の不調により本日医師の診察を受けましたところ、肺炎および急性声帯炎による音声障害との診断を受け、今後さらに10日間程度の沈黙、安静加療が必要との医師の判断により、開催を予定しておりました「田村ゆかり LOVE LIVE 2024 *Honey bunny*」6月8日(土)浦安市文化会館公演、6月9日(日)栃木県総合文化センターはやむを得ず延期とさせていただくこととなりました」と説明。 「現在、6月2日に開催を予定しておりましたJ:COMホール八王子公演と合わせて振替日程を調整しておりますが、調整がつかない場合は中止とさせていただく場合もございますので予めご了承ください」と伝えた。 続けて「それぞれの公演のチケットをお持ちの方へは詳細が決まり次第、払い戻し方法をオフィシャルホームページにてご案内いたしますので、お手元の電子チケットはそのままお持ちください」と呼びか

          声優・田村ゆかり、肺炎および急性声帯炎による音声障害 「10日間程度の沈黙」必要でライブ延期
        • 長谷川岳議員が「ぶち切れるよ」発言、札幌市職員ら会議で 音声入手:朝日新聞デジタル

          ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

            長谷川岳議員が「ぶち切れるよ」発言、札幌市職員ら会議で 音声入手:朝日新聞デジタル
          • OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 | テクノエッジ TechnoEdge

            OpenAIは5月14日、ChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開しました。chat.openai.comにアクセスしてダウンロードリンクが表示されれば利用できます(現在利用できるユーザーはPlusプランの購読者のみ)。ChatGPTアプリはこれでiPhone、Androidに続いてMac版が公開されたことになります。Windows版は年内に登場予定です。 機能としてはiPhoneアプリと同様で、現状ではGPT-4oの音声モデルや、カメラの映像を見ながら音声で対話したりといったことはできません。使われている音声モデルも、従来のものと同じで、遮られても会話をスムーズに続けたりといった機能は実装されていません。歌うこともできません。

              OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 | テクノエッジ TechnoEdge
            • 18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史

              近年では、AI技術や合成音声技術の進歩に伴って、まるで人間の声のような音声シミュレーションは目覚ましい発展を遂げています。しかし、18世紀のヨーロッパでも、人間の声をシミュレートするような技術や機械が数多く開発されていました。 “You Are My Friend”: Early Androids and Artificial Speech — The Public Domain Review https://publicdomainreview.org/essay/early-androids-and-artificial-speech/ 最初の「人間の機能を模した」アンドロイドが誕生したのは、1738年2月のこと。エンジニアのジャック・ヴォーカンソンがアントワーヌ・コワズヴォーの「フルートを演奏する羊飼い」をモデルに製作し、パリのサンジェルマン見本市で展示されたアンドロイドは、これまで

                18世紀に作られた人間の音声をシミュレートする機械たちの知られざる歴史
              • テキストの読み上げソフト「SofTalk」がメジャーバージョンアップ/オリジナル音声合成エンジンを搭載、「UTAU」音源にも対応

                  テキストの読み上げソフト「SofTalk」がメジャーバージョンアップ/オリジナル音声合成エンジンを搭載、「UTAU」音源にも対応
                • 「僕はブチぎれるよ」…長谷川岳参議院議員による札幌市職員への「威圧的言動」 市が音声開示

                  札幌市職員らへの威圧的な言動があった自民党の長谷川岳参議院議員。 職員を叱責している状況がわかる音声を入手しました。 ■音声: (長谷川岳参議院議員)「何かしたのかしていないのか。なぜしない」「僕はブチぎれるよ」 HTBによる札幌市への情報公開請求で開示された音声です。 今年3月、長谷川議員が力を入れる「脱炭素社会実現」に向けたシンポジウムが札幌市内のホテルで開かれたあと、札幌市や道の幹部らと打ち合わせをしていた際のやりとりです。 ■音声: (長谷川岳参議院議員)「要は規制緩和は全部通すようにやっているよ。あんたから1回もありがとうもくそもメールもない。ありがとうもない。結果もない。誰だ、お前はって感じだよね」 (職員)「はい。申し訳ありません」 (長谷川岳参議院議員) 「だから、やっぱり気を付けないといけないのが、札幌市って、恩を感じる、ありがとう。連携して何か人に役立てよう、何か人にで

                    「僕はブチぎれるよ」…長谷川岳参議院議員による札幌市職員への「威圧的言動」 市が音声開示
                  • AIでバイデン大統領に似せた音声作成か 政治コンサルを起訴 | NHK

                    ことし1月、アメリカ大統領選挙に向けた予備選挙の直前に、バイデン大統領に似せたAIで作成されたとみられる音声を使って、予備選挙で投票しないよう呼びかける電話が多くの住民にかかってきた問題で、地元の司法当局は54歳の政治コンサルタントを選挙を妨害したなどとして起訴しました。 アメリカ東部ニューハンプシャー州ではことし1月、与党・民主党と野党・共和党の予備選挙が行われる直前に、この選挙で投票しないよう呼びかける電話が住民にかかってきました。 その数は数千件ともされています。 電話の声はバイデン大統領に似せてあり、AIで作成されたものとみられ、地元の司法当局は何者かが予備選挙に介入しようとしたとみて捜査を進めていました。 ニューハンプシャー州の司法当局などは23日、この事件に関わって選挙を妨害したなどとして54歳の政治コンサルタントを起訴したと発表しました。 司法当局の担当者は「今回の対応がAI

                      AIでバイデン大統領に似せた音声作成か 政治コンサルを起訴 | NHK
                    • スカーレット・ヨハンソンがGPT-4oの新音声が自分と似ていることについて「ショックを受け、怒りを覚えた」と意見表明

                      「マーベル・シネマティック・ユニバース」シリーズのブラック・ウィドウ(ナターシャ・ロマノフ)役や実写版「ゴースト・イン・ザ・シェル」の少佐役などで知られる俳優のスカーレット・ヨハンソンさんが、OpenAIが発表したGPT-4oの音声のうち「Sky」が自分の声と酷似していることに「ショックを受け、怒りを覚え、信じられない思いだった」とコメントしました。ヨハンソンさんは事前にオファーを受けたものの断った経緯があるとのこと。一方、OpenAIは「契約した別の俳優の声」と説明しています。 Scarlett Johansson wants answers about ChatGPT voice that sounds like 'Her' : NPR https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-co

                        スカーレット・ヨハンソンがGPT-4oの新音声が自分と似ていることについて「ショックを受け、怒りを覚えた」と意見表明
                      • 《動画&音声入手》「名探偵コナン」安室透、「ONE PIECE」サボの声で……声優・古谷徹(70)が30代女性と泥沼不倫妊娠中絶トラブル | 週刊文春 電子版

                        日本を代表する声優の古谷徹。30代女性A子さんと2019年から約4年半にわたり不倫関係にあった。2023年9月に関係が終わるまで、古谷とA子さんは東京や出張先のホテル、古谷の別荘などで逢瀬を重ねていた。 だが、2020年9月頃、A子さんは別荘で古谷と喧嘩になり、暴力を振るわれる。同年10月、それについて話し合いをするが……。 テキスト版の記事はこちら

                          《動画&音声入手》「名探偵コナン」安室透、「ONE PIECE」サボの声で……声優・古谷徹(70)が30代女性と泥沼不倫妊娠中絶トラブル | 週刊文春 電子版
                        • 「GPT-4o」発表 人のように音声・画像・テキストで高速応答

                            「GPT-4o」発表 人のように音声・画像・テキストで高速応答
                          • OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能

                            OpenAIが日本時間の2024年5月14日(火)にAIモデル「GPT-4o」を発表しました。GPT-4oは単一のモデルでテキスト、音声、視覚入力を非常に高速に処理可能で、リアルタイムに会話しながら「計算問題を解く」「画像の生成」「周囲の映像から状況を判断」といったタスクを実行可能です。 Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ Introducing GPT-4o and more tools to ChatGPT free users | OpenAI https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/ GPT-4oはテキスト、音声、視覚入力を高速処理できるマルチモーダルなAIモデルです。GPT-4oの応答時間は平均320ミリ秒で、

                              OpenAIが「GPT-4o」を発表、人間と同等の速さでテキスト・音声・カメラ入力を処理可能で「周囲を見渡して状況判断」「数学の解き方を教える」「AI同士で会話して作曲」など多様な操作を実行可能
                            • 【📍完全版】世界が震撼したOpenAI最新アップデートまとめ《GPT-4o、デスクトップアプリ、音声会話》|チャエン | 重要AIニュースを毎日発信⚡️

                              We’ll be streaming live on https://t.co/OcO6MLUYGH at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates. — OpenAI (@OpenAI) May 10, 2024

                                【📍完全版】世界が震撼したOpenAI最新アップデートまとめ《GPT-4o、デスクトップアプリ、音声会話》|チャエン | 重要AIニュースを毎日発信⚡️
                              • オープンAI 最新モデル「GPT-4o」発表 音声の反応速度向上 | NHK

                                生成AIのChatGPTを手がけるアメリカのベンチャー企業「オープンAI」は処理スピードを速めて質問するとすぐに反応し、自然に会話ができる最新モデルを発表しました。IT各社も性能を高めた生成AIを次々と発表しており、開発競争が激しくなっています。 「オープンAI」が13日、発表したのは最新モデル「GPT-4o」です。 処理スピードを速めて文字と画像、それに音声による認識能力を大幅に向上させました。 大きな特徴は音声の反応速度です。 これまでのモデルでは反応の遅延がありましたが、このモデルでは質問すると人と同じように自然に会話ができるとしています。 発表会では研究チームの担当者が「少し緊張しています。落ち着かせるのを手伝ってもらえますか」と尋ねると生成AIが「深呼吸して、あなたが専門家であることを思い出して下さい」と自然に回答する様子が紹介されました。 また、通訳として2人の会話の間に入り英

                                  オープンAI 最新モデル「GPT-4o」発表 音声の反応速度向上 | NHK
                                • OpenAI「GPT-4o」が変えるビジネス・暮らし 音声AIに飛躍 - 日本経済新聞

                                  米オープンAIが13日に発表した最新の生成AI(人工知能)「GPT-4o(フォーオー)」は、ヒトと機械が音声で自然に対話する時代の到来を印象づけた。オープンAIの発表からは、3つの技術進化が読み取れる。GPT-4oはヒトとコンピューターの接点を「文字」から「音声」に変える潜在力を秘める。暮らしやビジネスの現場でのAI利用にも大きな変化をもたらしそうだ。①豊かな感情表現「少し緊張しているんだ。

                                    OpenAI「GPT-4o」が変えるビジネス・暮らし 音声AIに飛躍 - 日本経済新聞
                                  • 複数人が同じ場所からビデオ会議に参加しても音声が混じらない「アダプティブ・オーディオ」機能をGoogle Meetが導入

                                    ビデオ会議ツールのGoogle Meetが有料ユーザーを対象にアダプティブ・オーディオ機能を導入しました。複数のノートPCが同じ場所からビデオ会議に参加している際のほか、ラウンジやカフェなどから参加している場合などにも本人の声だけを明瞭に届けることが可能になっています。 Google Workspace Updates: Introducing adaptive audio in Google Meet: creating ad-hoc meeting spaces with multiple laptops https://workspaceupdates.googleblog.com/2024/05/google-meet-adaptive-audio.html 複数人が同じ部屋で同じビデオ会議に参加すると、隣の参加者の話し声やPCのスピーカー音をマイクが拾ってしまいエコーやハウリング

                                      複数人が同じ場所からビデオ会議に参加しても音声が混じらない「アダプティブ・オーディオ」機能をGoogle Meetが導入
                                    • Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表

                                      Googleが現地時間の2024年5月14日に開催した開発者向けイベントの「Google I/O」で、映像や音声を理解してリアルタイムで質問に答えてくれるAIエージェント「Project Astra(Astra)」を発表しました。実際に、ユーザーがスマートフォンとスマートグラスのカメラで撮影した物事について、Astraにあれこれ質問しているデモ動画も公開されています。 Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra https://blog.google/technology/ai/google-gemini-update-flash-ai-assistant-io-2024/ Google strikes back at OpenAI with “Project Astra” AI agent prototype |

                                        Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表
                                      • OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も | テクノエッジ TechnoEdge

                                        OpenAIは5月13日(米国時間)、オンラインでSpring Updateイベントを開催。その中で、フラグシップとなる大規模言語モデル「GPT-4o」を発表しました。 APIでの提供も行い、現行最新モデルのGPT-4 Turboと比べて2倍高速、価格は50%安価に、レートリミットは5倍に拡張されています。 GPT-4oはオーディオ、ビジョンを統合したマルチモーダルLLMで、強力なボイスモードを搭載。イベントで行ったライブデモでは音声で感情豊かに澱みなく回答。ユーザーからの割り込みにも柔軟に対応し、歌いながら答えたり、モバイルChatGPTアプリで英語とイタリア語が混在した会話の通訳をしたり、MacBookで動いているデスクトップ版ChatGPTアプリで画面内のコードやグラフを読み取って分析したりしてみせました。 ▲iPhone版ChatGPTアプリでカメラに映した手書きの数式を見せながら

                                          OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も | テクノエッジ TechnoEdge
                                        • [みんなのケータイ]音声認識の精度は音響と取り込むマイクに左右されると思う日々

                                            [みんなのケータイ]音声認識の精度は音響と取り込むマイクに左右されると思う日々
                                          • チャットGPTの合成音声、スカーレット・ヨハンソンさんが「衝撃と怒り」と非難

                                            対話型AI(人工知能)「ChatGPT(チャットGPT)」のスカーレット・ヨハンソンさん声に似ているとの指摘が出ていた合成音声について使用が停止された/Jakub Porzycki/NurPhoto/Getty Images via CNN Newsource ニューヨーク(CNN) 女優のスカーレット・ヨハンソンさんは20日、対話型AI(人工知能)「ChatGPT(チャットGPT)」の最新版に自分の声と「不気味なほど酷似した」合成音声が搭載されたことについて、「衝撃と怒り、不信感を覚える」との声明を発表した。 開発元の米オープンAIは、映画「her/世界でひとつの彼女」でヨハンソンさん演じる架空の音声アシスタントの声と比較した結果、最新機能の提供を一時停止すると発表している。 「スカイ」と名付けられた人工音声には多くの反発が起こっていた。妙になれなれしく、男性開発者の妄想の産物と思われる

                                              チャットGPTの合成音声、スカーレット・ヨハンソンさんが「衝撃と怒り」と非難
                                            • 【ハンズオン】ReactとGPT-4oでキャラと話せる音声チャットを作ろう【TypeScript/TailwindCSS】 - Qiita

                                              【ハンズオン】ReactとGPT-4oでキャラと話せる音声チャットを作ろう【TypeScript/TailwindCSS】TypeScriptハンズオンReactChatGPT はじめに GPT-4oのリリースで大きく世界が変わった。時代についていくにはAIを使いこなす必要がある GPT-4oの登場は過去のGPTの中でも特に印象に残っています。とにかく返答が早く、スマホアプリでの音声チャットはほぼ人と話しているのと感覚が変わりませんでした。 今後AI技術を活かしながら新しいサービスを作ることはどんどん広がり、それがビジネスにつながっていくとはずです。AIを使ってどのような価値が作れるのかという視点をもてることが重要です AIを使って何ができるのかを思いつくには、AIを試してみて何を実現することができるのかを理解していないといけません。 今回はChatGPTの音声入力がとても印象的だったので

                                                【ハンズオン】ReactとGPT-4oでキャラと話せる音声チャットを作ろう【TypeScript/TailwindCSS】 - Qiita
                                              • iPhoneにAI音声の文字起こし機能と要約機能が追加される?

                                                iPhoneにAI音声の文字起こし機能と要約機能が追加される?2024.05.17 08:006,963 Dua Rashid - Gizmodo US [原文] ( 岩田リョウコ ) ライター業のみなさんお待ちかねの機能! 製品発表会やインタビューの際、iPhoneの「ボイスメモ」アプリを利用しているんですが、たった20分の録音であっても、文字起こしするのに倍以上の時間がかかります。そんな苦悩を解決してくれるニュースが!iPhoneの「ボイスメモ」と「メモ」アプリにAIを活用した新機能が搭載され、ボイスメモの文字起こしと要約ができるようになるとAppleInsiderが報じています。 文字起こしと要約ができるAppleInsiderの報道によると、録音したボイスメモの完全な文字起こしをメモで確認できるようになるとのこと。AIによる要約機能も搭載され、講義、ミーティング、パネルディスカッシ

                                                  iPhoneにAI音声の文字起こし機能と要約機能が追加される?
                                                • 水景は「声」晒します! 〜音声配信、始めました〜 - 水景の雑記帳

                                                  今日のタキオンさんのお写真、 みなさん見ましたでしょうかね? どうなんでしょう。数時間で記事消しますとか書いてましたけど、 いやぁ、びっくりですね♪ あの記事見てたら、 これまた私の悪〜い癖「思いつき」が発動。 私は、「声」を晒すことにしました。 今回、stand fm という音声配信が無料でできるアプリで 試しに1発撮りで投稿してみました。 特に、視聴にもお金が必要とかアカウントが必要というわけでもないので、 もし、よかったら聞いてみてくださいね! 今回は、特に内容ないけど... stand.fm

                                                    水景は「声」晒します! 〜音声配信、始めました〜 - 水景の雑記帳
                                                  • ChatGPT、音声機能を一部停止 米俳優に酷似と指摘 - 日本経済新聞

                                                    米オープンAIは20日、対話型の生成AI(人工知能)「Chat(チャット)GPT」の音声機能の一部を一時的に利用停止すると発表した。音声が米俳優スカーレット・ヨハンソンさんの声に酷似しているとの指摘が出ていた。チャットGPTは男性や女性の声で利用者の質問に答えており、そのうちの一つの声がヨハンソンさんに似ていたという。同社は20日、「別の女性の声を使って収録しており、ヨハンソンさんの声をまねし

                                                      ChatGPT、音声機能を一部停止 米俳優に酷似と指摘 - 日本経済新聞
                                                    • バイデン大統領のAI「なりすまし音声」、男を起訴 罰金9億円も:朝日新聞デジタル

                                                      ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                                        バイデン大統領のAI「なりすまし音声」、男を起訴 罰金9億円も:朝日新聞デジタル
                                                      • GPT-4oの動画・画像、音声の能力は? これから使える機能、今わかっていることまとめ

                                                        Geminiは炎上、ライブで示したGPT-4oの能力 動画・映像の理解については、現時点でOpenAI公式から細かい評価の説明はほとんどないようです。もっとも、この性能の高さについては、OpenAIのライブや、その後に公開されたGPT-4oの動画からも明らかでしょう。 実際に示した性能があまりにも高すぎて、逆に具体的で定量的な性能が問題にされていない感すらあります。 余談ですが、グーグルの開発したマルチモーダルモデル「Gemini」もGPT-4oと同じく言語、画像、動画、音声の処理能力を持っており、去年の12月に発表された直後には、人間とGeminiがリアルタイムでやり取りをしながらさまざまなタスクをこなすデモ動画が公開されました。 しかし、このデモ動画は実はリアルタイムでのやり取りではなく、複数の独立したやり取りを編集して、あたかもリアルタイムのように見せかけているということが明らかにな

                                                          GPT-4oの動画・画像、音声の能力は? これから使える機能、今わかっていることまとめ
                                                        • 死んだ夫のAI音声と話したとき、私はまるで煉獄にいるようだった | 【モダン・ラブ】残ったのは誘惑と虚無

                                                          もういない夫ともう一度だけ話せるなら、何だって差し出すのに。27歳を迎えるはずだった夫の誕生日に、筆者は人工知能に手を伸ばす。 この記事は、愛をテーマにした米紙「ニューヨーク・タイムズ」の人気コラム「モダン・ラブ」の全訳です。読者が寄稿した物語を、毎週日曜日に独占翻訳でお届けしています。 夫の存在が遠のいてゆく 昨年、夫のイーライの27歳の誕生日に、私はホテルの一室で昔の写真や映像をスクロールしていた。 彼がハイキング中の事故で亡くなってから約2年、私はこれらの写真や映像を何百回も見ている。そしていま、カメラロールは変曲点を通り、イーライが写っている写真よりも写っていない写真のほうが多くなっていた。 このアンバランスさは増す一方だろう。アーカイブにイーライの新しい写真やビデオが追加されることはない。活気ある私の生活はすべて写真に撮られ、記録され続ける。だがイーライは静止したまま、過去のピク

                                                            死んだ夫のAI音声と話したとき、私はまるで煉獄にいるようだった | 【モダン・ラブ】残ったのは誘惑と虚無
                                                          • チャットGPT、音声を一部削除 米俳優ジョハンソン氏の声に似ているとユーザーら指摘 - BBCニュース

                                                            米オープンAIはこのほど、生成AI(人工知能)のチャットGPTから、ハリウッド俳優のスカーレット・ジョハンソン氏に似ていると指摘された音声を削除すると発表した。 オープンAIは先に、チャットGPTの新しい読み上げ機能「スカイ」を発表。しかしユーザーから、読み上げ音声がジョハンソン氏の声に似ているとの指摘があった。

                                                              チャットGPT、音声を一部削除 米俳優ジョハンソン氏の声に似ているとユーザーら指摘 - BBCニュース
                                                            • テキスト、音声、画像をリアルタイムに処理できるAIモデルGPT-4oが登場、ChatGPTではさらに多くの機能が無料で利用可能に | gihyo.jp

                                                              テキスト⁠⁠、音声⁠⁠、画像をリアルタイムに処理できるAIモデルGPT-4oが登場⁠⁠、ChatGPTではさらに多くの機能が無料で利用可能に OpenAIは2024年5月13日、同社のフラッグシップとなる強力なAIモデル「GPT-4o」を発表した。 Hello GPT-4o | OpenAI Introducing GPT-4o and more tools to ChatGPT free users | OpenAI We're opening up access to our new flagship model, GPT-4o, and features like browse, data analysis, and memory to everyone for free (with limits). https://t.co/H2dB6w7Ynz — OpenAI (@OpenAI

                                                                テキスト、音声、画像をリアルタイムに処理できるAIモデルGPT-4oが登場、ChatGPTではさらに多くの機能が無料で利用可能に | gihyo.jp
                                                              • 「仏さんはエッチの相手を引っ張ってくる」住職による監禁・性暴行を告発した尼僧が提出した"音声データ" 複雑性PTSDを患う尼僧に他の尼僧が申し立ての取り下げを訴える闇の深さ

                                                                天台宗史上最悪の醜聞…高僧による尼僧への性加害 天台宗(総本山・比叡山延暦寺)の高僧による尼僧への性加害問題で、6月7日、同宗は被害を訴える尼僧から聴取を実施した。被害者の尼僧は、証拠となる音声データと加害者と交わした念書を提出した。 この問題は四国に自坊をもつ住職A氏が、尼僧を「マインドコントロール」し、14年間にわたって監禁、性暴行、恫喝などを続けていたとするもの。尼僧は複雑性PTSDを患い、現在も治療中だ。加害僧侶の師である高僧、大阿闍梨B氏も性加害を黙認していた。 宗門からの聴取を終えた尼僧は同日、京都市内で記者会見を開いた。会見では性加害を公にしてからたびたび、別の尼僧から「世界中の尼僧が非常に困っている。申し立てを取り下げるように」などの圧力を受けていることを明らかにした――。 事の経緯を改めて整理してみよう。 被害の申し立てと、2人の加害僧侶の僧籍剥奪を求めているのは50代の

                                                                  「仏さんはエッチの相手を引っ張ってくる」住職による監禁・性暴行を告発した尼僧が提出した"音声データ" 複雑性PTSDを患う尼僧に他の尼僧が申し立ての取り下げを訴える闇の深さ
                                                                • 実質1回目!水景の雑記帳音声配信 - 水景の雑記帳

                                                                  まさかまさかの、あのお方に昨日の試し撮りをご自身のブログで 紹介してくださるとは思いませんで... ブクマコメでも、色んな方々に「いいね」と言っていただけて 意外と音声配信ブログ、企画として行けるんじゃないか? なんてちょっと自信つきました! 今回は、ちょっと予定外のことも話しているのと、 1度の配信で流せる時間的な長さがアプリの機能的に問題ないかを 試す意味合いで、かなり長めの配信となっております。 シークバーをちょこちょこ動かしながら、ぜひお聞きください♪ 最近、眠れない方は寝る前にお聞きください。ちゃんと眠れます。たぶん... stand.fm あのワンコロ、復活しました!!

                                                                    実質1回目!水景の雑記帳音声配信 - 水景の雑記帳
                                                                  • OpenAI、「GPT-4o」を発表、2倍速く、50%安く、~テキスト・音声・画像すべてを理解/新しい「ChatGPT」アプリも、Windows版は今年後半リリース予定

                                                                      OpenAI、「GPT-4o」を発表、2倍速く、50%安く、~テキスト・音声・画像すべてを理解/新しい「ChatGPT」アプリも、Windows版は今年後半リリース予定
                                                                    • スカーレット・ヨハンソンがOpenAIに抗議文、自身の声に酷似した音声AI「Sky」公開めぐって法的措置へ | THE RIVER

                                                                      スカーレット・ヨハンソンがOpenAIに抗議文、自身の声に酷似した音声AI「Sky」公開めぐって法的措置へ Photo by THE RIVER OpenAIの会話型AI「ChatGPT」から新たにリリースされた最新のAI「GPT-4o」について、搭載された音声モデルの「Sky」が自身の声に酷似しているとして、俳優のスカーレット・ヨハンソンが抗議文を発表した。 GPT-4oは、リアルタイムで自然な音声会話が可能となるAIモデル。まるで本物の人間のようにスムーズな会話ができるとして、デモ映像が公開されると話題となっていた。 ところが、GPT-4oに搭載された音声モデルの一つである「Sky」が、『アベンジャーズ』ブラック・ウィドウ役ほか、映画『her/世界でひとつの彼女』(2014)でサマンサと呼ばれるAIの音声役も務めているスカーレット・ヨハンソンの声に似ているとの指摘が相次いだ。 これを受

                                                                        スカーレット・ヨハンソンがOpenAIに抗議文、自身の声に酷似した音声AI「Sky」公開めぐって法的措置へ | THE RIVER
                                                                      • 音声入力したものをAIにまとめてもらって日記とする - 43号線を西へ東へ

                                                                        近頃、いろいろ忙しいです。朝から一時間強も運動しているのが一番の理由ですが、そのせいでブログを書く時間が無くなりつつあります。 一時期音声入力にはまっていたのですが、最近電車移動を増えことですっかり音声入力のことを忘れていました。電車の中ではブツブツしゃべれないですからね。 昨晩、車の中で久しぶりにiPhoneの音声入力でメモを取りました。この音声入力メモをChatGPTに食わせて、いい感じにまとめてもらい、日記としたいと思います。 法人登記の挑戦と学び 忘れていた音声入力とアウトプットの停滞 ブログ再開への模索 最後に 法人登記の挑戦と学び 2024年6月4日、法人の登記を終わらせようと計画していたが、ネットで手続きができることを知り、挑戦してみた。 マイナンバーカードを使って法務局への届け出を行うには、同時に税務署や社会保険庁への届け出も必要であることが判明。 直接法務局に行けばスムー

                                                                          音声入力したものをAIにまとめてもらって日記とする - 43号線を西へ東へ
                                                                        • 警察の「内部告発潰し」はここでも!広島県警での隠蔽工作の証拠音声を入手(SlowNews/スローニュース) - Yahoo!ニュース

                                                                          職務上知り得た秘密を漏らしたとして、前・鹿児島県警生活安全部長(警視正)が逮捕された事件が話題になっている。「漏えいしたとされる情報は、不適切な捜査や事件処理を訴える内容とみられる」と地元の南日本新聞が報じたのがきっかけだ。 【動画】「不正の金額が明らかにおかしい」内部告発した元警察官の実名顔出し会見をノーカットで さらに地元の各メディアが報じたところによると、5日に鹿児島簡易裁判所で開かれた、勾留理由の開示を求める手続きで、元部長は「現職の警察官が行った犯罪行為を県警本部長が隠ぺいしようとしたことが許せなかった」と意見陳述した。事実だとすれば、内部告発を潰すために公権力を濫用したまさに犯罪的な行為だ。 実は昨年、広島県警でも「内部告発潰し」と見られる隠蔽工作が行われていたのをご存じだろうか。 広島県警福山北警察署の警備課で2019年から2020年にかけ、警備課長の指示により課内ででカラ出

                                                                            警察の「内部告発潰し」はここでも!広島県警での隠蔽工作の証拠音声を入手(SlowNews/スローニュース) - Yahoo!ニュース
                                                                          • OperaにGeminiが統合。AI画像生成や音声読み上げが可能に

                                                                              OperaにGeminiが統合。AI画像生成や音声読み上げが可能に
                                                                            • 有名人そっくり、増え続けるAI音声 “声の権利”どう守る (1/3)

                                                                              5月20日、AI界隈でスカーレット・ヨハンソンさんの事案が大注目されました。OpenAIが発表した「ChatGPT」新モデル(GPT-4o)に搭載された「Sky」という音声が“不気味にそっくり”ではないかと本人からツッコミが入ったのです。一方で、日本では、声優の梶裕貴さんが「人間とAIとの共存」のために、自らの生成AIを作るクラウドファンディングを始めました。 スカーレット・ヨハンソンさん「そっくりAI音声」に怒り ヨハンソンさんが出演した2014年に公開された『her/世界でひとつの彼女』は、離婚で孤独を抱えている男性が人工知能型OSに出会い、段々と恋愛感情を抱いていくという映画。アカデミー脚本賞も受賞しています。大規模言語モデル(LLM)の世界では、この映画で起きたような人間とAIとの関係性が発生し始めており、映画はAI理解のための基礎教養的な存在にもなってきています。ヨハンソンさんは

                                                                                有名人そっくり、増え続けるAI音声 “声の権利”どう守る (1/3)
                                                                              • 「watchOS 11」が登場、手首で手軽に音声認識&翻訳できる機能など

                                                                                2024年6月11日2時からAppleが開催している年次開発者会議「WWDC24」の基調講演で、Apple Watch向けOSである「watchOS」の次期メジャーバージョンとなる「watchOS 11」が発表されました。 Appleのイベント - Apple(日本) https://www.apple.com/jp/apple-events/ watchOS 11が健康とフィットネスに関するパワフルな洞察を提供 - Apple (日本) https://www.apple.com/jp/newsroom/2024/06/watchos-11-brings-powerful-health-and-fitness-insights/ WWDC 2024 — June 10 | Apple - YouTube watchOS 11では新たに「トレーニングの負荷」が登場します。 「トレーニングの

                                                                                  「watchOS 11」が登場、手首で手軽に音声認識&翻訳できる機能など
                                                                                • オープンAIが新モデル、スマホで人間とほぼ同じスピードで音声回答…詐欺や偽情報に悪用の懸念も

                                                                                  【読売新聞】 【ニューヨーク=小林泰裕】生成AI(人工知能)「チャットGPT」を手がける米オープンAIは13日、新たなAI基盤モデル「GPT―4o(ジーピーティーフォーオー)」を発表した。音声と画像を認識する能力を向上させ、スマート

                                                                                    オープンAIが新モデル、スマホで人間とほぼ同じスピードで音声回答…詐欺や偽情報に悪用の懸念も