[7ページ] 音声認識の人気記事 2137件

241 - 280 件 / 2137件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声認識の検索結果241 - 280 件 / 2137件

Speech API - 音声認識 | Google Cloud Platform
- 102 users
- cloud.google.com
- テクノロジー
- 2016/03/24
Try Gemini 1.5 models, our newest multimodal models in Vertex AI, and see what you can build with a 1M token context window Convert audio into text transcriptions and integrate speech recognition into applications with easy-to-use APIs. Get up to 60 minutes for transcribing and analyzing audio free per month.* New customers also get up to $300 in free credits to try Speech-to-Text and other Google
- API
- GCP
- 音声認識
- speech
- Google
- recognition
- cloud
- machine learning
- audio
- BASE
Haskellで作る超コンパクト音声認識システム
- 101 users
- www.furui.cs.titech.ac.jp/~shinot
- 暮らし
- 2011/04/27
音声認識は人工知能の分野の中でも独自の進化をとげた分野で，良くも悪くもガラパゴス的と言われたりします．特に大語彙連続音声認識を実現する既存のソフトウエアは大規模かつ複雑で，音声認識の専門家でさえも全体を理解して改良を加えることは必ずしも容易ではありません．このことは近隣分野と音声認識コミュニティを分断する障壁ともなっています．しかし音声認識を実現するアルゴリズム自体は，基本的には実はそれほど難解なものではありません．ソフトウエアが複雑なのは，多分に計算量やメモリ量削減のための様々な工夫やCに代表される手続き型プログラミング言語の抽象化能力の限界に起因しています．他方，ソフトウエア工学の分野では複雑な処理をコンパクトに記述可能な次世代プログラミングパラダイムとして，純粋関数型言語が研究されています．純粋関数型言語は長らく研究段階に留まっていましたが，近年はHaskellなど実用性の高
- haskell
- 音声認識
- sound
- speech recognition
- 研究
- 開発
- プログラミング
- programming
- speech
- nlp
音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
- 101 users
- ysdyt.hatenablog.jp
- テクノロジー
- 2022/10/13
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。配信中のpodcast番組白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。最初に結論インストール実行方法結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果まとめ追記カタカナ英語完全制覇 whisperくんせんでんせんでん最初に結論 whisperは異なるモデルサイズが5種が利用可能であ
ペットのヨウムがネットで買い物飼い主の声まねてAIスピーカーで注文
- 101 users
- www.afpbb.com
- テクノロジー
- 2017/09/21
【9月21日 AFP】英国の首都ロンドン（London）で、ペットのヨウムが飼い主の声をまね、音声認識機能が搭載された人工知能（AI）スピーカーを使ってインターネットで商品を注文するという珍事が起こった。英大衆紙サン（The Sun）が20日に伝えた。同紙によると、ロンドン南東部に住むコリエンヌ・プレトリアス（Corienne Pretorius）さんが飼っているヨウムの「バディ（Buddy）」が、インターネット通販最大手の米アマゾン・ドットコム（Amazon.com）のAI音声アシスタント「アレクサ（Alexa）」を通じて10ポンド（約1500円）のギフトボックスを1セット注文したという。プレトリアスさんの家族には身に覚えのない注文が発覚して調べていたところ、バディがスピーカーとやり取りしているのを耳にして「犯人」が分かったという。プレトリアスさんは「バディがアマゾンで注文したとわ
- 動物
- bird
- ネタ
- Amazon
- AI
- あとで読む
FutureHomeController
- 101 users
- rti-giken.jp
- テクノロジー
- 2012/08/10
声だけで家電を操作するフューチャーホームコントローラーは、音声で家中の家電を操作できるようになるガジェットです。今のお持ちのエアコンやテレビを声だけで操作できるようになります。
- 音声認識
- ガジェット
- 家電
- gadget
- これは欲しい
- device
- UI
テープ起こしの必要がなくなる?音声データを即時にテキスト化できる「Trint」はかなりの正確さ | Techable(テッカブル)
- 101 users
- techable.jp
- テクノロジー
- 2016/06/13
インタビューや講演、会議などで録音したヒトの言葉を文章にする“テープ起こし”は、音声データを聴きなおし、キーボードで文字を入力するというマニュアルな作業。多くのジャーナリストは、日常的に、記事執筆に着手する前、取材活動を通じて収集した音声データを聴き、手作業でテキスト化している。このように旧態依然とした非効率な作業を自然言語処理（NLP）のテクノロジーによって革新しようとしているのが、英ロンドンで開発された「Trint（トリント）」だ。・音声からテキストに自動変換「Trint」は、音声ファイルや動画ファイルをアップロードすると、90％以上の正確性で、音声をテキストに自動変換できるソリューションだ。テキスト化によって、長時間にわたるインタビューやスピーチも、瞬時にキーワードで検索できるようになる。また、「Trint」では、自動変換されたテキストが、単語ごとに音声とリンクされる仕組
Engadget | Technology News & Reviews
- 100 users
- www.engadget.com
- テクノロジー
- 2016/07/06
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
- 音声入力
- iPhone
- あとで読む
- Siri
- メモ
- Android
ケータイのマイクを検索の“耳”に　Google音声検索、日本語に対応
- 99 users
- www.itmedia.co.jp
- 暮らし
- 2009/12/07
Google日本法人は12月7日、音声入力でネット検索できる「Google音声検索」を日本語に対応させた。まずAndroid端末とiPhoneで利用できる。日本語音声認識エンジンを独自開発し、実用的な精度の高さと速度を両立させているという。 Androidでは「Google音声検索」アプリをインストール、iPhoneでは「Google Mobile App」の設定から音声検索をオンにすることで利用できる（iPhoneでは「音声検索は英語のみ」と表示されるが、問題なく利用可能になっている）。検索窓の右横のマイクアイコンをタップすると音声認識がスタート。電話で話すように口元のマイクで検索したい単語などを発音すれば、テキストに変換してGoogle検索を実行する。 GPSと連動し、現在地に合わせた地域情報を表示する。東京・渋谷にいる場合に「映画館」で検索すれば、渋谷駅周辺の映画館リストを表示すると
- google
- iphone
- 音声認識
- Android
- mobile
- 検索
- 音声検索
- 技術
- これはすごい
- 音声
Google.com Mobile
- 98 users
- shopping.google.com
- テクノロジー
- 2005/03/03
ALIENTECH DUO 3 antenna signal booster range extender for DJI/Autel/Parrot/FPV drones DJI-N1 | DJI Mavic 3/Air 2/Air 2s/Mini 3 pro/mini 2 ALIENTECH DUO 3 antenna signal booster range extender for DJI/Autel/Parrot/FPV drones Autel EVO II RC V2 |EVO II Pro 6K/Dual 640T/
- google
- android
- ショッピング
- search
- 検索
- モバイル
- software
Engadget | Technology News & Reviews
- 97 users
- www.engadget.com
- テクノロジー
- 2017/06/06
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
- apple
- WWDC
- iPad
- mac
- iOS
- macOS
自分のコンピュータの性別を簡単に見分ける方法｜| ＾＾ |秒刊SUNDAY
- 95 users
- www.yukawanet.com
- 暮らし
- 2011/02/12
人間にも性別があるように、コンピュータにも性別があるようです。今回紹介する方法でコンピュータの性別を判別することが可能だというのです。当方のコンピュータで試したところ、女性らしき声がコンピュータから聞こえてきた。音声ファイルを再生させているわけではないのだが、いったいどのような仕組みなのだろうか。方法としては以下であるメモ帳、およびテキストエディタに以下のテキストを入力。 CreateObject("SAPI.SpVoice").Speak"I love you" これを『computer_sex.vbs』という名前で保存し、実行。（Windows限定）男性の声が聞こえてきたら、コンピュータは男性。女性の声が聞こえてきたら、コンピュータは女性。当方のコンピュータは女性の声だった。いったいなぜこんなことが起こるのだろうか。もちろんコンピュータに性別が本当にあるわけではない実
- windows
- ネタ
- PC
- コンピュータ
- voice
- programming
- api
ミクさんがSiriみたいになってくれる！？　初音ミクとおしゃべりできるアプリを開発した人が現れたぞ
- 94 users
- nlab.itmedia.co.jp
- テクノロジー
- 2014/08/12
「こんばんは」「こんばんは、マスター！」――単なる音声認識サービスではなく、認識した言葉に反応して、ユーザーが求めるアプリを起動したり、会話したりできる機能がスマートフォンにあったらいいのになあ。しかもキャラクターがミクさんだったらもっとうれしいなぁ……。そんな夢を現実のものにした動画が投稿されていました。アプリ「MikuMikuNow」の爆誕です。起動すると「マスター、ミクですよー！」との音声が！　おおっ、画面の中にミクさんが生きておる。スマホを持つ手が小刻みに震えそう。この「MikuMikuNow」は自分の話した言葉に応じて初音ミクが返事をしてくれるアプリ。Android向けに開発しているものです。今日の天気は？　明後日の沖縄の天気は？　のような質問にも的確に答えてくれます。会話内に地域が含まれていればその地域の天気をとってきてくれるのだとか。さらにWeb検索機能も充実。検索したい
- 初音ミク
- Android
- アプリ
- vocaloid
- 音声合成
- 音声認識
- ソフトウェア
- *Android
- 後で読む
- app
Raspberry Pi にGoogle Assistant SDKを搭載して「OK Google」してみる。 - Qiita
- 93 users
- qiita.com/PonDad
- テクノロジー
- 2017/04/30
Raspberry Pi にGoogle Assistant SDKを搭載して「OK Google」してみる。RaspberryPigooglecloud つい先日、Google Assistant SDK がサードパーティーに公開され、RaspberryPiでも利用できる様になったので、早速試してみました。 RaspberryPi GoogleAssistant - YouTube おなじみ「OK Google」から音声コマンドを使って、天気情報やGoogle音声検索などが行えます。今回公開されたSDKはIFTTTとの連携が簡単に行えます。試しに音声で照明の点灯・消灯などを試してみました。残念ながら今のところ日本語対応はしていないのですが、相変わらずGoogleの音声認識精度はとても高いと感じました。 SDKはpipでインストール出来、手軽に使う事が出来ます。簡単にまとめてみます。環
Juliusで連続音声認識 - 人工知能に関する断創録
- 92 users
- aidiary.hatenablog.com
- テクノロジー
- 2013/07/06
大語彙連続音声認識エンジンJuliusで遊んでみました。動作環境はMac OS X Mountain Lionです。準備コンパイラはXcodeでインストールしたgcc（2013/1/13）を使用しました。また、Macで動かす場合はPortAudioというライブラリも必要みたいなので、macportsであらかじめインストールしておきました（というか何か別のプロジェクトでインストール済みだった）。 % port installed portaudio The following ports are currently installed: portaudio @19.20111121_4 (active) julius本体のインストール Juliusのプロジェクトページからjulius-4.2.3.tar.gzをダウンロードします。サイトの右の方のQUICK DOWNLOADからダウンロ
- Julius
- 音声認識
- 言語
- mac
- プログラミング
- audio
｢話す方が4倍速い｣生産性アップに音声入力。本執筆、おかず1品、英語授業の字幕も
- 90 users
- www.businessinsider.jp
- テクノロジー
- 2018/01/23
1日のうち、スマホやパソコンでタイピングをしている時間は、どれくらいありますか。音声認識の精度が格段に上がったのが、この2、3年。徐々に音声認識を仕事に生かす人たちが増えている。タイピングを音声入力に置き換えると、仕事の生産性を上げられるだけでなく、会議の仕方、子どもとの接し方、学び方まで変化している。音声入力で誕生したヒット本ほぼ声だけでできあがった本がある。シリコンバレー在住のシバタナオキさん（36）の著書『MBAより簡単で英語より大切な決算を読む習慣』。300ページ近い情報量で、2017年7月の予約開始直後に3万部を増刷した話題作だ。シバタさんは、2016年ごろから、原稿の執筆に音声入力を導入した。著書のもととなったウェブ（note）上の連載は、1本3000〜5000字。週2本のペースで新作をアップしている。 1本の原稿は1時間ほどで仕上げる。30分でテーマを決めてデータなど
- 音声認識
- writing
音声検索 API を使った Android アプリ開発
- 90 users
- japan.googleblog.com
- 暮らし
- 2009/12/25
メディア関係者向けお問い合わせ先メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
- google
- android
- api
- 音声認識
- 音声検索
- voice
- 開発
- dev
音声で Google 検索
- 90 users
- japan.googleblog.com
- 暮らし
- 2009/12/07
メディア関係者向けお問い合わせ先メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
- google
- iPhone
- 音声入力
- Android
- search
- これはすごい
- 音声検索
- *google
- 検索
- ldr
「5年後、言葉の壁は消える」、グーグルが検索技術への取り組みを披露
- 90 users
- xtech.nikkei.com
- 暮らし
- 2010/06/09
米グーグルは2010年6月8日、「検索の科学」と題したイベントを開催した。エンジニアリングリサーチ担当の上級副社長アラン・ユースタス氏をはじめ、検索の技術研究や製品開発を担当するエンジニアが登壇。現在までの検索技術の進化と、今後のビジョンを語った。「かつて、Web検索で得た情報の中身は、古いのが当たり前だった。今では1分前に更新された情報ですら、検索できるようになった」。ユースタス上級副社長は、Web検索技術の進化の一端を、こう説明する（写真1）。リアルタイム検索に加えて、グーグルがここ数年かけて取り組んできたテーマが、個人ごとに最適な検索を可能にする「パーソナライズド検索」、音声による検索や動画検索などだ。「検索は本来、とてもパーソナルなものだ。同じ『膝』という単語でも、医者の場合と患者の女性の場合とでは、求める結果の種類もレベルも違う。医者などに向けて学術論文検索を提供しているのは
- google
- 検索
- 技術
- 検索エンジン
- search
- 言語
- translation
- web
Vistaの音声機能で悪質コマンド実行の恐れ
- 90 users
- www.itmedia.co.jp
- 暮らし
- 2007/02/01
Vistaの音声機能を悪用すると、MP3などの音声ファイルをWebページで再生し、コマンドを実行させることができてしまうとの指摘。 Windows Vistaの音声コマンド機能を悪用し、Webページに仕掛けた音声ファイルを使ってコマンドを実行できてしまう問題がセキュリティメーリングリストで報告された。セキュリティソフトメーカーのMcAfeeが1月31日のブログに掲載した解説によると、コマンドを付けて作成したMP3などの音声ファイルをWebページでホスティングしておくと、そのページを開いたユーザーのVista上で音声ファイルが再生され、コマンドが実行される可能性がある。例えば「Start, execute, CMD, shutdown-r」というコマンド付きのMP3ファイルを作成し、このMP3を再生するWebページをユーザーが訪れると、コンピュータが再起動させられてしまうという。メーリ
- security
- windows
- vista
- セキュリティ
- windows vista
- 脆弱性
- WindowsVista
- microsoft
- ネタ
- ITmedia
携帯に向ってレシートを読み上げるだけでデータ入力できる家計簿サイト『Expense』 | 100SHIKI.COM
- 89 users
- www.100shiki.com
- 暮らし
- 2008/01/04
携帯に向ってレシートを読み上げるだけでデータ入力できる家計簿サイト『Xpenser』 January 4th, 2008 Posted in 便利ツール（ウェブ） Write comment お小遣い帳なるものが使えたためしがない。どうにも入力が面倒だからだ。最近は携帯からメールでちょこちょこと、といったツールもあるが、それでもなんだか億劫である。そう考えるとXpenserの入力方法にはちょっと惹かれる。このサイト、いわゆる家計簿サイトであるが、データの入力にはメールやPC、IM以外にも音声まで使うことができる。電話をかけて「牛乳 2ドル」といった具合にしゃべれば自動的に認識してデータを突っ込んでくれるというお手軽さだ。メールやウェブは面倒だが、帰宅後に携帯に向ってレシートを読み上げるぐらいならできそうである。この音声認識にはJottというサイトの技術を使っているようだ。実際に使っ
- 家計簿
- webサービス
- 携帯
- mobile
- money
- これはすごい
- webservice
- tool
- サービス
- web
TechCrunch
- 88 users
- jp.techcrunch.com
- テクノロジー
- 2017/04/04
Google has expanded its vulnerability rewards program (VRP) to include attack scenarios specific to generative AI. In an announcement shared with TechCrunch ahead of publication, Google said: “We be
studioloupe.com
- 88 users
- studioloupe.com
- 暮らし
- 2011/10/15
studioloupe.com 2024 著作権. 不許複製プライバシーポリシー
- Siri
- iPhone
- 音声アシスタント
- iPhone4S
- 音声認識
- iPhone
- 英語
- iOS
- あとで読む
“美人”で人間そっくりのアンドロイド「ERICA」、JSTや阪大など開発　人間との自然な対話、実現へ
- 87 users
- www.itmedia.co.jp
- テクノロジー
- 2015/08/03
JSTと阪大などが、人間そっくりで“美人”なアンドロイド「ERICA」を開発した。ERICAをプラットフォームに研究を進め、人間と自然な対話を行える自律対話型アンドロイドの実現を目指す。科学技術振興機構（JST）と大阪大学、国際電気通信基礎技術研究所（ATR）、京都大学は8月3日、人間そっくりで“美人”なアンドロイド「ERICA」（エリカ）を開発したと発表した。人間の話を正確に理解し、相づちを打つなど、音声と動作が結びついた自然な対話をアンドロイドで実現するための研究プラットフォームとして活用する。人型ロボットが人間との対話を行う際には、音声認識や発話、視線の動きやしぐさ、表情などさまざまな面で違和感がない応答が必要だが、各技術を寄せ集めるだけでは違和感なく対話できるとは限らない。すべての要素技術を調和・統合させ、自然な対話を実現する技術は研究されてこなかったという。 ERICAはこれ
- ロボット
- 技術
- robot
- 開発
- CogLing
- JST
- android
- ICT
- AI
TechCrunch
- 86 users
- jp.techcrunch.com
- テクノロジー
- 2014/02/18
Developer community site Stack Overflow has laid off 28% of its staff, the Prosus-owned company announced Monday. In a blog post, Stack Overflow’s CEO, Prashanth Chandrasekar indicated that the
Siriをはるかに越えるAIを備えたSiri開発者らによる新音声認識システム「Viv」がまもなく公開へ
- 86 users
- gigazine.net
- テクノロジー
- 2016/05/06
Appleの音声アシスタント機能「Siri」の誕生に関わった開発者らにより、かねてより開発されていた新しい音声認識システム「Viv」がようやく完成し、まもなく発表されるものと見られています。Vivは「複合的な質問を理解する」「多くのアプリを実行可能」など、Siriをはるかに越えるAIを備えているとのこと。 Siri’s creators say they’ve made something better that will take care of everything for you - The Washington Post https://www.washingtonpost.com/news/the-switch/wp/2016/05/04/siris-creators-say-theyve-made-something-better-that-will-take-care-of-
- 音声認識
- siri
- Apple
- AI
- あとで読む
- WIRED
- GIGAZINE
- SmartNews
Macの音声入力機能で「ながら」の口述筆記をすると捗る - 太陽がまぶしかったから
- 86 users
- www.du-soleil.com
- テクノロジー
- 2015/02/08
photo by M. Keefe 喋りは「ながら」を許容する歩きながらであったり、『モンスターハンター4G - 3DS』や『黒猫のウィズ』などをしながらツイキャス配信をする事がある。何かをしながら喋るという事は意外にできるものだ。道を間違えたり、話す内容が雑になってしまう事もあるのだけど、80%+80%で通常の1.6倍ぐらいの効率になっている気がする。喋る事もモンハンをすることも生産活動ではないのだけどね。クイズRPG 魔法使いと黒猫のウィズ COLOPL, Inc.ゲーム無料その一方で、キーボードで文章を書く場合だとかなり排他的となる。歩きながら文章を入力できない事もないが、「喋りながら」と比較して事故になる可能性が格段に高くなるし、ゲームをしたり、絵を描きながらになると物理的に不可能である。つまり何かをしながら文章を書くのは結構難しくて、「モード」を明確に分ける必要があるのだ。
- mac
- 音声入力
- あとで読む
- tool
- 考え方
- キーボード
- *あとで読む
- apple
TechCrunch | Startup and Technology News
- 85 users
- jp.techcrunch.com
- テクノロジー
- 2020/04/29
To give AI-focused women academics and others their well-deserved — and overdue — time in the spotlight, TechCrunch has been publishing a series of interviews focused on remarkable women who’ve contributed to…
- Zoom
- translate
- あとで読む
- AI
- ツール
- 人工知能
- techfeed
- Webサービス
音声認識テキスト入力Javascriptライブラリ w3voiceIM.js
- 85 users
- w3voice.jp
- 暮らし
- 2007/07/03
たった一行追加するだけで、あなたのサイトに音声認識機能を付けられます！ w3voiceIM.jsは、Webページの上のテキスト入力フォームに音声認識機能を追加するJavascriptライブラリです。手軽に音声認識を利用できることが特徴になっています。また、http://w3voice.jp/でサービスする共有型音声認識エンジンを利用するために、利用者やWeb開発者は、音声認識プログラムのインストールや設定作業を必要としません。 JavaおよびJavascriptが動作するPC及びWebブラウザからの利用をサポートしています。現在のバージョン最新のw3voiceIM.jsのバージョンは0.02です。とりあえず動くようになった開発途上バージョンです。使い方音声入力を開始するには、テキストの入力欄をマウスでダブルクリックします。音声入力パネルが出現したら、「Push here」と
- javascript
- 音声認識
- library
- voice
- java
- ajax
- web
- sound
- recognition
- cool
［脳に挑む人工知能5］Watsonテクノロジーの全貌、IBMはなぜAIと呼ばないのか
- 85 users
- xtech.nikkei.com
- 学び
- 2015/03/03
あるときは銀行の窓口業務をこなし、あるときはがん患者の治療方針を提案し、あるときは独創的な料理を作る――。米IBMの「Watson」が提供するアプリケーションはあまりに多彩で、捉えどころがない。 Watsonとは、いったい何を指す言葉なのか。IBMは、クイズ王を破ったこのコグニティブ（認知）システムを、どうビジネスに結びつけるつもりなのか。英語向けのWatsonを日本語に対応させることは、本当に可能なのか。これらの問いに最も適切な答えを返せるのは、Watson Groupの指揮を執るIBMシニア・バイス・プレジデントのマイク・ローディン氏だろう。ローディン氏は、Software Solutions Groupの責任者だった2011年半ば、クイズ番組「ジョパディ！」でWatsonがクイズ王を破ったシーンをテレビで見て、思わず「I want that！（これが欲しい！）」と叫んだという。翌
- IBM
- watson
- 人工知能
- AI
- technology
- 音声認識
- 機械学習
- ソフトウェア
- Computer Vision
- 開発
デスクトップ版Chromeブラウザで「Ok Google」終了（あまり使われていないので）
- 84 users
- www.itmedia.co.jp
- テクノロジー
- 2015/10/17
米Googleが、Windows、Mac、Linux向けのChromeブラウザのバージョン46へのアップデートで、端末のマイクに向かって「Ok Google」と発声することで音声検索を起動する機能を削除した。米VentureBeatが10月16日（現地時間）に最初に報じた。この機能は2013年11月に拡張機能として使えるようになり、2014年5月リリースのChrome 35から標準機能として提供されてきた。Chromeの［設定］→「検索」で有効／無効を設定できた。 Googleは14日のアップデートの際、リリースノートにはこの機能削除について触れていなかったが、Chromeのヘルプフォーラムで16日に、「これらのプラットフォームでは多くのユーザーがこの機能を有効にしていなかったから」削除したと説明した。 Chromebook（Chrome OS搭載のPC）のブラウザおよびAndroid端
苗字の最初の文字と名前の最初の文字を入れ替えてみました
- 84 users
- homepage2.nifty.com
- 暮らし
- 2005/02/13
あなたが1960年代生まれなら、必ず一度はポケットに手を入れて「まさーかりーくさおーです」って言ったことがあるでしょう。僕は1970年代生まれなのでそんなことを言ったことはありません。それはさておき、そんなあなたに送る苗字の最初の文字と名前の最初の文字を入れ替えてみるコーナーです。
- 名前
- ネタ
- 笑
- ことば
- neta
- おもしろ
- joke
- これはひどい
ディープラーニングで人間と同じトーン・スピード・抑揚を再現して自然な音声を出力する「WaveNet」をDeepMindが開発
- 84 users
- gigazine.net
- テクノロジー
- 2016/09/12
Googleの人工知能開発部門の「DeepMind」が、状況や感情に応じてトーンや「間」などを使い分けて、まるで人間が話しているかのような自然な音声を出力する技術「WaveNet」を開発しました。すでに英語と中国語で、既存のテキストトゥスピーチ(TTS)技術を圧倒する品質を実現しています。 WaveNet: A Generative Model for Raw Audio | DeepMind https://deepmind.com/blog/wavenet-generative-model-raw-audio/ Google's DeepMind learns to reproduce human speech, tricks us into starting robot apocalypse http://www.neowin.net/news/googles-deepmind-le
Googleの音声認識エンジンを使って音声ファイルから文字起こししてみた
- 83 users
- gigazine.net
- テクノロジー
- 2018/08/24
Googleがクラウドサービスとして提供している「Google Cloud Platform」の中に、「Cloud Speech-to-Text」というサービスがあります。このサービスは音声ファイルをAIが認識して文字にしてくれるというものなのですが、一体AIはどれくらい正確に文字起こししてくれるものなのか実際に使って試してみました。 Cloud Speech-to-Text - Speech Recognition | Cloud Speech-to-Text API | Google Cloud https://cloud.google.com/speech-to-text/ まず、GoogleのクラウドサービスであるGoogle Cloud Platformの登録を済ませておきます。まだ登録していないという人は以下の記事の冒頭部分を参考に登録しておいてください。無料でGoo
- 音声認識
- google
- あとで読む
- 文章
- 音声
- Cloud
- js
石井裕の“デジタルの感触” - 多重マシン生活者の環境シンクロ技法
- 82 users
- ascii.jp
- 暮らし
- 2007/12/29
スクリーン裏側のデバイスは何か前回も紹介したとおり、2007年1月18日に渋谷のNHKスタジオで「プロフェッショナル仕事の流儀」の収録をし（参考記事）た。そのとき、キャスターの住吉美紀さんのリクエストで仕事道具をカバンから取り出し、テーブルに並べて説明するというシーンがあった。最初に取り出したのは、もちろんPowerBook G4である。 2月8日の番組放映後、日本の視聴者からたくさんの反響が電子メールで寄せられたが、その中の数通は、このカバンの中身に関する質問だった。PowerBook G4のスクリーン裏側に装着されている「デバイス」は何か、また「そろばん」のように見えたものは何だったのか。どちらも放送時には説明が省かれていたため、こうした質問が届いたのだろう。後者は、そろばんそのものだ。本連載の読者であればご存じのとおり、タンジブルビットの原点を説明する際の講演用小道具である。
- mac
- tips
- pc
- gadget
- 石井裕
- 仕事術
- it
- PowerBook
- storage
YouTubeを即席・無料のテキスト書き起こしツールにしてしまう方法 | ライフハッカー・ジャパン
- 81 users
- www.lifehacker.jp
- テクノロジー
- 2014/02/02
サンディスクのmicroSDカード 512GBが40%OFF。写真や動画のデータ置き場はこれで良くない?【Amazonセール】
- 便利サイト
- YouTube
- 音声認識
- webサービス
- share
- lifehack
- 動画
- Google
［速報］Google、家庭用の音声認識デバイス「Google Home」発表。スピーカーで音楽再生、テレビで動画再生も可能。Google I/O 2016
- 81 users
- www.publickey1.jp
- テクノロジー
- 2016/05/19
［速報］Google、家庭用の音声認識デバイス「Google Home」発表。スピーカーで音楽再生、テレビで動画再生も可能。Google I/O 2016 Googleはサンフランシスコで開催中のイベント「Google I/O 2016」で、音声認識デバイス「Google Home」を発表しました。 Google Assistantを使ってGoogleと会話ができるほか、内蔵のスピーカーから音楽を再生したり、Chromecastを利用してテレビでYouTubeなどの動画再生も可能です。
- google
- ai
- Publickey
- 音声認識
- IoT
- あとで読む
- 家電
TechCrunch | Startup and Technology News
- 81 users
- jp.techcrunch.com
- 暮らし
- 2011/08/05
Yellow, an asset financier for solar energy and digital devices in Africa has raised $14 million series B funding in a round led by Convergence Partners with participation from the Energy Entrepreneur Fisker, the electric carmaker founded by the Danish auto designer Henrik Fisker, is gearing up to enter the Chinese market where competition is increasingly cut-throat, following in the footsteps of
- Android
- sdk
- 音声認識
- iOS
- iPhone
- api
- スマートフォン
- 無料
世界最速！　「リアルタイム文字おこしサービス」で日本の未来が変わる？
- 81 users
- www.itmedia.co.jp
- テクノロジー
- 2014/11/11
窪田順生氏のプロフィール： 1974年生まれ、学習院大学文学部卒業。在学中から、テレビ情報番組の制作に携わり、『フライデー』の取材記者として3年間活動。その後、朝日新聞、漫画誌編集長、実話紙編集長などを経て、現在はノンフィクションライターとして週刊誌や月刊誌でルポを発表するかたわらで、報道対策アドバイザーとしても活動している。『14階段――検証新潟少女9年2カ月監禁事件』（小学館）で第12回小学館ノンフィクション大賞優秀賞を受賞。近著に『死体の経済学』（小学館101新書）、『スピンドクター “モミ消しのプロ”が駆使する「情報操作」の技術』（講談社α文庫）がある。先日、ひょんなことから「これは日本の未来を大きく変えるんじゃないの？」と思ってしまうほどのサービスを目にする機会があった。沖縄県うるま市にある株式会社アイセック・ジャパンのモバイル型情報保障サービス「e-ミミ」である。いったい
長文日記
- 81 users
- d.hatena.ne.jp/shi3z
- 暮らし
- 2010/01/15
- android
- nexusone
- google
- Nexus One
- iphone
- ブラウザ
- ケータイ
- 携帯
- レビュー
- インターフェース
マイクロソフトのリアルタイム音声翻訳機能｢Skype Translator｣がすごい
- 81 users
- www.gizmodo.jp
- テクノロジー
- 2014/12/16
マイクロソフトのリアルタイム音声翻訳機能｢Skype Translator｣がすごい2014.12.16 17:00 塚本直樹これこそ、むかし夢見ていた未来。マイクロソフトはリアルタイム音声翻訳機能｢Skype Translator｣をプレビューとして公開しました。現時点で翻訳できるのは英語とスペイン語だとのことです。上の動画を見てみると、英語とスペイン語を話す少女が異なる言語で自由に会話をしていますね。 Skype TranslatorはWindows 8.1やWindows 10 プレビュー版で動作します。相手の話した言語を翻訳し、テキストとして画面に表示すると同時に音声として出力することが可能です。この機能、今すぐSkypeに標準搭載して欲しいくらい良くできています。マイクロソフトは以前、英語とドイツ語のリアルタイム翻訳機能をデモしたことがあります。今回発表されたのは英語とスペ
- 翻訳
- skype
- Microsoft
- これはすごい
- マイクロソフト
- ms
- 科学
- 技術