音声の人気記事 127件 - はてなブックマーク

1 - 40 件 / 127件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声の検索結果1 - 40 件 / 127件

「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました｜カレーちゃん
- 1827 users
- note.com/currypurin
- テクノロジー
- 2024/02/19
Youtubeで配信しながら全プロンプトを実行しましたので、各節へのリンクを整理しました。時間のところにYoutubeへのリンクになっています。もしずれていたら、その時間まで移動して視聴ください。はじめに (4:00) 1章 ChatGPTの基礎知識 (5:50) 2章 ChatGPTの基本的な使い方 (6:28) 3章 ChatGPT Plusのセットアップ (7:32) 4章ファイルのアップロードとダウンロード (12:40)4.1 アップロード・ダウンロード (13:03) 4.2 扱うことができるファイル (16:02) 5章繰り返し作業を一瞬で (16:55)5.1 文字列操作 (17:20) 5.2 正規表現でのパターンマッチ (25:36) →54ページの正規表現でできることの例の説明 (29:09) 5.3 ファイルの一括操作 (46:20) 5.4 QRコード作成
- ChatGPT
- あとで読む
- AI
- プロンプト
- データ
- excel
- 仕事
- GPT
- LLM
- webサービス
ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」
- 896 users
- togetter.com
- テクノロジー
- 2023/09/28
チキン＠ライター @HeroofChickens フリーランスのライター4年目。リストラがきっかけ。Kindle出版1位、Kindleプロデュースで1位・ベストセラー取得。商業出版のブックライティング中（2024年の5月ごろ出版かな？） webwhiter-skill.com/job/
- ChatGPT
- AI
- あとで読む
- togetter
- 人工知能
- 技術
- 音声
- technology
- 文章生成AI
- 文章
3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した（CloseBox） | テクノエッジ TechnoEdge
- 737 users
- www.techno-edge.net
- テクノロジー
- 2023/08/28
わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。
- AI
- あとで読む
- 技術
- 音声合成
- voice
- 機械学習
- 英語
- 音声
- 人工知能
- oss
ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料｜DTMステーション
- 554 users
- www.dtmstation.com
- テクノロジー
- 2023/12/25
自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC（パラキート・ブイシー）が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して
- AI
- あとで読む
- 音声合成
- 技術
- DTM
- ソフトウェア
- 音声
- ツール
- 人工知能
- 無料
「パパ、ママ、会いに来たよ」AIで死者を“復活” 中国で新ビジネスが論争に「冒とく」か「心の救済」か | TBS NEWS DIG
- 524 users
- newsdig.tbs.co.jp
- テクノロジー
- 2024/04/18
世界では今、インプットされたデータから文章や画像などを自動で作り出す「生成AI」の技術が急速に進化しています。こうした中、中国では「生成AI」を使って亡くなった人を「復活」させるビジネスが登場し、論争を…
- AI
- あとで読む
- ビジネス
- 人工知能
- 中国
- 技術
- 倫理
- technology
- 人生
- 宗教
AIが架空の女性やセクシーな写真、ストーリーや音声まで作成する「ハイパーポルノ」
- 524 users
- gigazine.net
- テクノロジー
- 2023/08/12
非常に高度なレベルで文章を生成できる対話型AIのChatGPTや、画像生成モデルのDALL・Eなどを始めとした画像生成AIの発達により、誰でもクオリティの高い文章やイラスト、画像を作成できるようになりました。これらの生成AIを用いることで、存在しない女性のセクシーな自撮りやセリフの吹き込みがある官能的なストーリーなどを全てAIで作成した「ハイパーポルノ」に注目が集まっています。 Mindy https://thisgirlnextdoordoesnotexist.net/mindy/ 生成AIはジャンルや種類を問わず文章や画像を作成できますが、ChatGPTに用いられている言語モデル「GPT-4」には不適切な質問をブロックするコンテンツフィルターが設定されていたり、画像生成AIの「Stable Diffusion」には成人向け表現を含む画像を黒塗りするセーフティーフィルターがあったりと、コ
- AI
- あとで読む
- 人工知能
- 写真
- 画像
- 女性
- 創作
- 画像生成
- ポルノ
- IT
【2023年ベスト】無料で使えるすごい神AIツール27個まとめ
- 438 users
- photoshopvip.net
- テクノロジー
- 2023/12/25
AIツールはビジネスやクリエイティブなど、あらゆる分野で活用され、業務効率化や生産性向上に貢献しています。２０２３年は、コストをかけずにAIを最大限に活用できる無料AIツールが、たくさん登場した年となりました。この記事では、無料で利用できるAIツール28個をご紹介します。チャットボット、テキストエディティング、画像生成、音楽生成、音声生成など、さまざまなカテゴリのツールを厳選しています。
AIボイチェンソフト「Voidol 1」が無償化
- 420 users
- pc.watch.impress.co.jp
- テクノロジー
- 2024/03/19
- AI
- あとで読む
- 音声
- DTM
- tool
- ソフトウェア
- software
- 音声合成
- 人工知能
- voice
インターホンにハーモニカを付けると、急なセールスもハーモニーとともに断れるので便利です→「何食ってたらこんなの思いつくんだ…」
- 399 users
- togetter.com
- エンタメ
- 2023/08/05
ウミノ🍘 @umin00000 @ARuFa_FARu なぜクロネコヤマトでもUber eatsでもなく佐川急便なのかを考えてみたけど、多分熟考の結果拍数と響きが1番おもしろい。という結論に至ったのかなと思いました。 2023-08-05 19:18:22
- togetter
- ネタ
- ARuFa
- あとで読む
- 生活
- twitter
- 音楽
- インターホン
- ハーモニカ
- おもしろい
女の子になれる。変幻自在のAIボイスチェンジャー「Voidol3」
- 384 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/09/08
- AI
- あとで読む
- software
- 音声合成
- 技術
- voice
- app
- 音声
- vocaloid
AI作曲サービスの新星「Udio」が誰でも利用可能に。Sunoを超えたか、試してみた（CloseBox） | テクノエッジ TechnoEdge
- 363 users
- www.techno-edge.net
- テクノロジー
- 2024/04/11
Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
- AI
- あとで読む
- 音楽
- 人工知能
- webサービス
- music
- service
- サービス
- DTM
- これはすごい
まるで人間と会話「ChatGPT with voice」が無償公開　「語尾に“にゃん”と付けて」とお願いしたら気まずくなった
- 341 users
- www.itmedia.co.jp
- テクノロジー
- 2023/11/24
米OpenAIが提供する対話型AI「ChatGPT」のアプリ版（Android、iOS）で、まるで人間と会話しているように受け答えする音声対話機能「ChatGPT with voice」が無償の一般ユーザーでも使えるようになった。 ChatGPTのアプリを開き、右下にあるヘッドフォンのアイコンをタップすると音声による対話を始められる。初期設定時は5種類の声から任意に選べ、後から変更も可能だ。画面を見ずにハンズフリーで会話できる他、ユーザーが発した言語を自動認識して返答する。設定で主な言語を設定すると、より認識精度が高まる。やりとりした内容はテキストで後から確認できる。 ChatGPTはもともと人間と対話しているような返答をする。これに声が付くことで、より一層に人と会話しているような感覚を覚えるだろう。実際に試してみたところ、独特なイントネーションがある日本語が達者な外国人と話しているよう
- ChatGPT
- AI
- あとで読む
- 人工知能
- アプリ
- これはすごい
- 音声
- 技術
- language
- こころ
「iPhoneとPCを連携させて、無料で通話を録音・文字起こしする方法」――急遽テレワークを導入した中小企業の顛末記(181)【急遽テレワーク導入！の顛末記】
- 315 users
- internet.watch.impress.co.jp
- テクノロジー
- 2024/04/01
- 文字起こし
- あとで読む
- iphone
- PC
- zoom
- 仕事
OpenAI DevDay で発表された新モデルと新開発ツールまとめ｜npaka
- 270 users
- note.com/npaka
- テクノロジー
- 2023/11/07
以下の記事が面白かったので、かるくまとめました。・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造
- ChatGPT
- あとで読む
- AI
- OpenAI
- GPT
- 開発
- 人工知能
- API
- LLM
- まとめ
ESET社員、生成AIで自社CEOの声を作って不正送金させる実験に成功
- 242 users
- news.mynavi.jp
- テクノロジー
- 2023/11/27
ESETは11月22日(現地時間)、「Your voice is my password – the risks of AI-driven voice cloning」において、生成AIにより合成した音声を悪用したソーシャルエンジニアリング攻撃の実験に成功したと伝えた。この実験では、従業員が自社の最高経営責任者(CEO: Chief Executive Officer)になりすまして、財務責任者から自分宛てに送金させることに成功しており、生成AIの危険性について注意喚起している。 Your voice is my password – the risks of AI-driven voice cloning これは事前にCEOの許可を得て行っ実験であり、ここで解説する手法をまねることは犯罪となる可能性があることに注意。この実験と同様の攻撃が今後増加する可能性があると懸念されており、企業や組
他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム　明治大が開発
- 238 users
- www.itmedia.co.jp
- テクノロジー
- 2024/01/09
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 明治大学の渡邊研究室に所属する研究者らが発表した論文「WhisperCast: ヘッドフォン装着者だけが聴取可能な音を再生する磁気誘導を利用した手法の検討」は、ヘッドフォンやイヤフォンを装着している人のみが聞こえる音声や音楽を外部から挿入するシステムを提案した研究報告である。このシステムは、磁気誘導を用いて、ヘッドフォンやイヤフォン内の振動板を直接鳴動させ、装着者だけが聴取できる音を生成する。WhisperCastのハードウェア構成には、空芯コイルとアンプを含んでいる。具体的なプロセスとして、コンピュータが任意の波形（通知音や好きな音楽
ChatGPT×Whisperで履歴書と職務経歴書づくりを効率化　開発してみてわかった、生成AIの活かし方
- 230 users
- logmi.jp
- テクノロジー
- 2023/06/13
大規模言語モデル（LLM）を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。株式会社ROXXからは、CTOの松本宏太氏が登壇。「ChatGPT×Whisper」で作ったプロトタイプを紹介しました。 ROXX社・CTO松本宏太氏松本宏太氏：弊社は「ChatGPT×Whisper」でいろいろプロトタイプを作っているので、その中の事例を1つ紹介して、そこで学んだ内容をもとに、今後の展望をお話できればなと思っています。（スライドを示して）今日は、こういう感じで話していこうかなと思っています。まず、自己紹介をさせていただきます。あらためて、株式会社ROXXでCTOをやっている松本と申します。「kotamat」という名前でいろいろやっているのですが、もとも
- AI
- あとで読む
- ChatGPT
- 転職
- キャリア
- 開発
- 人工知能
- データ
- techfeed
ヨーロッパ映画の日本版DVDは音程が変わっちゃってる！！ | Jazz Maffia BLOG
- 207 users
- jazzmaffia.exblog.jp
- エンタメ
- 2024/01/14
ブログでの記述にPAL方式は1秒25コマとありますが、実際は1コマ内に奇数列と偶数列で違う2枚分の絵が存在するので、秒50枚の絵を表示しています。専門用語を使うと25フレーム、50フィールドと言います。詳しくはググってください。日本のNTSC方式では秒30フレーム、60フィールドとなります。 60コマの絵が使えるので、フィルム24枚の絵を60コマに振り分けていくことでテレビ放送に対応させています。具体的には11/222/33/444…と、フィルムのコマを2フィールドと3フィールドずつ順番に振り分けます。そうすることで、視覚上さほど気にならないレベルで24コマのフィルムを60フィールドに振り分けることが出来ます。ではPAL方式ではどうかというと、50フィールドでは違和感無くフィルムの24コマを振り分けることが出来ません。この問題を解決するには2つの方法があり、ひとつはブログでもご指摘され
- 映画
- 音楽
- あとで読む
- 映像
- movie
- music
- ヨーロッパ
- audio
- トラブル
自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO
- 206 users
- dev.classmethod.jp
- テクノロジー
- 2023/10/20
自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみたはじめに今回は、OpenAIのWhisper APIとAmazon Transcribeという2つの音声文字起こしサービスを試し、それぞれの精度を比較してみました。 Amazon Transcribeは、音声をテキストに変換する自動音声認識サービスです。ストリーミングとバッチ処理のどちらでも文字起こしが可能です。攻撃的な言葉を指定すると、Amazon Transcribeがそれらの言葉を文字起こしから自動的に削除する語彙フィルタリングなどの機能もあります。 Amazon Transcribeの詳細は、下記の記事をご参考ください。 OpenAIには音声をテキストに変換する「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び
- AI
- あとで読む
- aws
- API
- 人工知能
- OpenAI
- APIエコノミー
- Amazon Web Services
- techfeed
YouTubeで言葉のカベが消えそう。アドビの｢多言語化｣技術には夢がある
- 183 users
- www.gizmodo.jp
- テクノロジー
- 2023/10/13
YouTubeで言葉のカベが消えそう。アドビの｢多言語化｣技術には夢がある2023.10.13 12:0012,096 山本勇磨現在LAで開かれているAdobe（アドビ）のカンファレンス｢Adobe MAX｣を取材中なのですが、現地でとても面白い技術が発表されました。その技術の名は｢Project Dub Dub Dub｣。dubは｢吹き替える｣という意味なのですが、AIを使って動画クリップを本人の声で、多言語に吹き替える技術なんです。現地で行なわれたデモでは、Adobe MAXの会場にいる数千人がその凄さに歓喜。ぜひデモのようすをご覧ください。これは半端ない…全YouTuberが海外対応できてしまう🤯 日本語の動画クリップから多言語化する｢Project Dub Dub Dub｣#AdobeMAX#MAXSneakspic.twitter.com/Rd6HisOHS3 — ギズ
- AI
- あとで読む
- 技術
- adobe
- 言語
- youtube
- technology
- 動画
- 英語
顔も名前も知らなかったコンビが異例の1万DL達成!? 同人音声作品『カス嘘お姉さんASMR』の嘘じゃない誕生秘話
- 181 users
- togetter.com
- アニメとゲーム
- 2024/03/19
こんにちは。ASMR作品を聴きまくった結果、風間くん※みたいなザコ耳になってしまったライター、シュゴウです。どちらかというと、右耳が弱いです。 ※編集部注：蛇足ですが『クレヨンしんちゃん』の風間くんちなみにASMR（エー・エス・エム・アール。Autonomous Sensory Meridian Responseの略）とは、簡単に言うと「なんかゾワゾワする立体的な音声」のこと。最近はASMR動画がYouTubeにたくさん投稿されていますし、同人作品販売サイト「DLsite」では、同人サークルが制作したASMR作品がいろいろと販売されています。そんな、一部の人は日常的に聴くけど、なじみのない人は全然知らないであろうASMR作品ですが、最近ネットで猛烈に話題になったASMR作品があるのをご存じでしょうか？それがこちら、『ダウナー系お姉さんに毎日カスの嘘を流し込まれる音声』（以下、カス嘘
- 同人
- togetter
- あとで読む
- ネット
- オタク
- ネタ
WhisperとChatGPTで文字起こし | ドクセル
- 177 users
- www.docswell.com
- テクノロジー
- 2023/06/25
闇のエンジニア/変なデジカメ開発中/ディープラーニング芸人/Raspberry Piとからあげ大好き/はてなブログ書いてます
- ChatGPT
- あとで読む
- AI
- 音声
- API
- 学習
- 文章
- 文章生成AI
- 文字
- 勉強
ChatGPT can now see, hear, and speak
- 177 users
- openai.com
- テクノロジー
- 2023/09/25
We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w
- ChatGPT
- AI
- openai
- あとで読む
- 機械学習
- GPT
- LLM
- 音声
- deeplearning
- 画像
商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生｜DTMステーション
- 170 users
- www.dtmstation.com
- テクノロジー
- 2024/05/31
ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS＝Text to Speech（音声読み上げソフト）の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。さらにStoryblocksという音素
- AI
- あとで読む
- DTM
- 音声合成
- sound
- 人工知能
- DAW
- 音声
- tool
- ソフト
効果音・音声・BGM 素材 by プロ生
- 170 users
- sounds.pronama.jp
- テクノロジー
- 2023/09/21
効果音・音声・BGM 素材 by プロ生このサイトでは、無料で使える（諸条件あり）効果音・音声・BGM を試聴・ダウンロードできます。カテゴリーによって利用条件が異なります。随時編集・追加予定です。素材情報も編集途中です。カテゴリー紹介プロ生無料素材プロ生が提供する使用条件のゆるい無料素材です。暮井慧（プロ生ちゃん）プロ生のキャラクター、プロ生ちゃんこと暮井慧（CV: 上坂すみれ）のボイスと楽曲 BGM です。アプリなどに設定して使えるシステムボイスや、条件を守っていただくとご自身のアプリや動画などの作品にも使えます。 HSP3 無料素材「プログラミング言語 HSP3」で提供されている効果音・BMG 素材を許諾を得て転載しています。ソフト作成に使えます。 Adobe Audition Sound Effects 「Adobe Audition Sound Effec
- 素材
- あとで読む
- BGM
- 効果音
- フリー素材
- 音楽
- music
上様が刀を振り回すたびにポップな効果音が流れる動画
- 161 users
- www.nicovideo.jp
- エンタメ
- 2023/08/18
上様が刀を振り回すたびにお色気な効果音が流れる動画→sm41736268上様が刀を振り回すたびにシオンタウンのBGMが流れる動画→sm40870391「ホモと見るCM集」→mylist/73711962
俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ
- 160 users
- www.m3tech.blog
- テクノロジー
- 2023/12/01
こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか？特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ現状の点数計算の練習
老舗音声編集ソフトのAudacityをインストール不要でブラウザでも使える「Wavacity」
- 156 users
- gigazine.net
- テクノロジー
- 2023/09/09
無料で提供されているオープンソースの音声編集ソフトウェア「Audacity」をフォークし、ブラウザ上で動作するようにした「Wavacity」が公開されています。 Wavacity https://wavacity.com/ 上記のリンクにアクセスすると、以下のような画面が表示されます。本家のAudacityは表示言語を日本語に設定する必要がありますが、Wavacityは最初から日本語で表示されるので、日本語ネイティブユーザーにとってかなり取っ付きやすくなっています。記事作成時点で最新バージョンとなる本家Audacity(v3.3.3)の画面が以下。比較するとこんな感じ。スライダーを右に動かすとWavacityが、左に動かすとAudacityが表示されます。楽曲ファイルをインポートするには「ファイル」から「開く」をクリックし、ファイルを選択します。タイムライン上でドラッグすると、編集
Meta、新音声生成AIモデル「Voicebox」短い音声から自在に声を生成
- 150 users
- www.watch.impress.co.jp
- テクノロジー
- 2023/06/18
- AI
- あとで読む
- Meta
- 音声処理
- 技術
- 人工知能
スマホでの録音を無効化するツール、中・米の研究者らが開発　部屋内での会話を収録不可に
- 138 users
- www.itmedia.co.jp
- テクノロジー
- 2023/10/10
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 中国の浙江大学や米マサチューセッツ大学アマースト校などに所属する研究者らが発表した論文「Cancelling Speech Signals for Speech Privacy Protection against Microphone Eavesdropping」は、マイクによる録音を無効化する手法についての研究報告である。この手法を用いると、隠し持ったスマートフォンや録音機で録音しても、その部屋での会話を収録することはできなくなる。スマートフォンや音声アシスタントのようなデバイスは、盗聴のリスクを増加させている。この問題への対策として
- 技術
- 研究
- あとで読む
- セキュリティ
- スマホ
- ツール
- 開発
- technology
- 会話
- 論文
【Python】プログラムでフーリエ変換を理解しよう！【FFT, 標本化定理, ナイキスト周波数】 | Raccoon Tech Blog [株式会社ラクーンホールディングス技術戦略部ブログ]
- 132 users
- techblog.raccoon.ne.jp
- テクノロジー
- 2023/11/30
こんにちは。早く業務に慣れたい開発チーム入社１年目の髙垣です。急ですが皆さん。ふと、音をフーリエ変換したい時ってありませんか？ありますよね。でも、「フーリエ変換って学校で計算式で習ったけど、結局は何をしているんだ？」となることありませんか？そこで今回は計算式なんてほっといて、Pythonを使ってフーリエ変換が何をやっているのか体験してみましょう！環境構築下記リポジトリをクローンしてください https://github.com/takaT6/fft-tutorial クローンができたら下記のライブラリをインストールしてください↓ pip install numpy matplotlib japanize_matplotlib japanize_matplotlib はmatplotlibに日本語を書き込めるようにするライブラリです。日本語化をするにはフォントを入れたり、設定フ
- python
- 数学
- あとで読む
- Mathematics
- sound
- 技術
- ブログ
GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
- 131 users
- www.gizmodo.jp
- テクノロジー
- 2023/11/08
GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:009,334 Maxwell Zeff・Gizmodo US ［原文］（ mayumine ）これは嬉しい進化です。 OpenAIの開発者向けカンファレンス｢DevDay｣で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました（こちらの記事もどうぞ）。いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。本をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。さらにGPT-4 Turboでは、JSONモードが実装され、JS
- AI
- あとで読む
- ChatGPT
- 人工知能
- 文章
- techfeed
AVマニアが「PS5」を“AV機器”として使ってみたら - 価格.comマガジン
- 130 users
- kakakumag.com
- アニメとゲーム
- 2024/02/10
新「PS5」はスリムなサイズとなったことが最大の特徴で、サイズは約358×216×96mm（横置き時の幅×奥行×高さ）と従来モデルと比較して30％以上小型化。重量も約3.2kg（ディスクドライブ搭載モデル）と18％も軽量となっている。採用する技術や機能はそのままで、内蔵するSSDストレージは1TBだ。希望小売価格はディスクドライブ搭載モデルの「CFI-2000A01」が66,980円（税込）、ディスクドライブなしのデジタル・エディション「CFI-2000B01」が59,980円（税込）。昨今の物価高騰などの影響もありSSDストレージが増量されているとはいえ、従来よりも価格が高くなっているのは少し残念。ただし、ディスクドライブの着脱が可能になり、デジタル・エディションを購入した後でもディスクドライブを購入して増設できるようになっているなど、改善が図られた点もある。なお、1台付属するDua
- PS5
- あとで読む
- game
- av
ニッポン放送、AMステレオ放送をモノラルに。「保守・維持が困難」
- 112 users
- av.watch.impress.co.jp
- テクノロジー
- 2024/03/27
面倒で難しい「私はロボットではありません」をワンクリックで突破できるCAPTCHA自動回答ツール「Buster」レビュー
- 111 users
- gigazine.net
- テクノロジー
- 2024/02/25
ウェブサイトにログインしたり問い合わせフォームを送信したりすると、「私はロボットではありません」といった文言のボット排除システム「CAPTCHA」に遭遇しがちです。CAPTCHAでは「バスを含む画像をクリック」などの問題が出題されますが、「バスの画像を正しく選択しているはずなのに人間と認めてもらえない！」という事態が頻繁に発生します。無料のブラウザ拡張機能「Buster」を使えば、ワンクリックでCAPTCHAを突破できるとのことなので、実際に使ってみました。 GitHub - dessant/buster: Captcha solver extension for humans, available for Chrome, Edge and Firefox https://github.com/dessant/buster BusterはChromeやFirefox、Edge、Operaな
- CAPTCHA
- セキュリティ
- ロボット
- ツール
- AI
- あとで読む
- chrome
- 人工知能
- アプリ
｢お尻洗って｣と、ウォシュレットに話しかける時代が来た #CES2024
- 103 users
- www.gizmodo.jp
- テクノロジー
- 2024/01/19
｢お尻洗って｣と、ウォシュレットに話しかける時代が来た2024.01.19 08:006,460 Florence Ion - Gizmodo US ［原文］（湯木進悟）これぞベスト機能では？ウォシュレットが登場したとき、その新感覚に驚いたことを覚えている人もいるでしょう。いまではすっかりトイレの標準機能になっていますけど、今年の｢CES 2024｣では、意外なる新機能がデビューを果たしていましたよ。音声認識でコントロール可能にそもそも当たり前のように、ウォシュレットのボタンを指でタッチしていますけど、もし一切なににも触れずコントロールできたら、衛生面でも最高だったり？ Kohlerは、そんな願いをかなえる｢PureWash Bidet Seat｣を発表しました。 Image: Kohlerなんと音声認識アシスタントとなる、AmazonのAlexaまたはGoogle Assis
AI Webcam - ゆーすけべー日記
- 94 users
- yusukebe.com
- テクノロジー
- 2024/02/11
AI Webcamについて紹介します。 AI Webcam AI WebcamはWebcamでとった写真についてAIが音声で返答してくれるというものです。AIのキャラクターというか音声は指定可能です。また文章のプロンプトでどのように返答するかも指定できます。例えば、アメリカの若い女性「レイチェル」に自分の容姿を褒めてもらった時の大爆笑映像はこちらです。元ネタ実は元ネタがあって、Wes Bosというポドキャスターがやってたのを真似てます。コードも公開されているので、それを使わせてもらってます。みなさんもできます。 YAPCでLT あまりにも面白いので、先日のYAPC::HiroshimaのLTでこれを応用したものをデモしました。レイチェルだけを流しても尺が余るしインパクトにかけるので、YAPCっぽく「dankogai」さんと「papix」をAIにしました。 UIはこんな感じです。例え
- AI
- OpenAI
- yapchiroshima2024
- あとで読む
- ネタ
- 人工知能
- イベント
- 写真
Feedly + ChatGPTで、毎朝自分専用のポッドキャストを自動生成する仕組みを作った｜鈴木慎吾 / TSUMIKI INC.
- 94 users
- note.com/shingo2000
- テクノロジー
- 2024/01/18
毎朝、デザイン系の英語記事を10件ほどおすすめしてくれるSlackボットです。このボットは現在も問題なく稼働し続けていますが、毎朝のニュースは文字で読むよりも音声として聞いたほうが負担が少なく続けられそうです。そこで、このSlackボットを拡張して、毎朝デザインニュースのポッドキャストを自動生成する仕組みを作ることにしました。成果物はじめに成果物について。完成したポッドキャストは毎朝SpotifyとApple Podcastで配信しています。おおまかな処理の流れ開発前に想定した処理の流れは以下の通りです。毎朝ポッドキャストが自動で配信される理想的なフロー自分はコンテンツ制作者ではなく、あくまでリスナーというスタンスを取りたいため、ワークフローに自分が介在しない完全自動化が理想です。ところが、Sound Cloud APIの利用に必要なアプリケーション登録の受付が現在停止しているこ
- AI
- あとで読む
- 人工知能
- API
ChatGPTと“声”で会話する方法解説書が発売～ブラウザーやAlexaにも組み込める！／『ChatGPTと音声で会話する3つの方法』発売【Book Watch/ニュース】
- 92 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/04/26
- ChatGPT
- あとで読む
- AI
- ブラウザ
- 本
- *あとで読む
- あとでみる
- book
オーディオ超解像技術 AudioSR を試す｜はまち
- 84 users
- note.com/hamachi_jp
- テクノロジー
- 2023/09/15
低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。インストール!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution実行！GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。 !audiosr -i /content/kurumi.wav変換例変換前（サンプリングレート8kHz）
- 機械学習
- 音声
- オーディオ
- あとで読む
- 技術
- 音楽
- !!
- HotEntry