並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 170件

新着順 人気順

文字起こしの検索結果1 - 40 件 / 170件

  • Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania

    Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 2021 3/16 Microsoftは3月上旬、対面での会議や会話のためのリアルタイムのテープ起こしと翻訳を提供する「Group Transcrib‪e‬(グループ転写)」のiOSアプリをリリースしました。会議の参加者がそれぞれのデバイスで使用することができます。 メモを取らずに会議に集中できる優れもの 最先端のAI音声・言語技術を搭載したGroup Transcribeで、会話の参加者は共有セッションを開始し、それぞれが携帯電話のマイクを使用して、リアルタイムで誰が何を言ったかを示す、非常に正確なトランスクリプトをキャプチャできます。 会話の高品質な記録に自信を持つことで、ユーザーはメモを取る必要がなくなり、会話そのものに注意を集中させることができます。トランスクリプトは、共有したり、再配置も簡単に行う

      Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania
    • 【全文】「勝ちっ放しはないでしょう、安倍さん」野田元首相から安倍元首相への追悼演説|日テレNEWS NNN

      2022年10月25日、衆議院本会議。選挙演説中に銃撃され死去した安倍元首相に向けた追悼演説が行われた。演説に臨んだのは、立憲民主党の野田元首相。かつて野党時代の自民党総裁だった安倍氏と、首相だった野田氏は、党首討論の場で、衆議院の解散をめぐる“真剣勝負”に臨んだ間柄だ。追悼演説の中で野田氏は「再びこの議場で、あなたと真剣勝負を戦いたかった」「勝ちっ放しはないでしょう、安倍さん」と天上の故人に語りかけた。演説の全文は以下の通り。 本院議員、安倍晋三元内閣総理大臣は、去る7月8日、参院選候補者の応援に訪れた奈良県内で、演説中に背後から銃撃されました。搬送先の病院で全力の救命措置が施され、日本中の回復を願う痛切な祈りもむなしく、あなたは不帰の客となられました。享年67歳。あまりにも突然の悲劇でした。 政治家としてやり残した仕事。次の世代へと伝えたかった想い。そして、いつか引退後に昭恵夫人と共に

        【全文】「勝ちっ放しはないでしょう、安倍さん」野田元首相から安倍元首相への追悼演説|日テレNEWS NNN
      • 「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化

        Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. 「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化2月にβ版がリリースされたGoogle製の音声文字変換(Live Transcribe)アプリ。もともと聴覚障害者のために作られたアクセシビリティ機能だが、精度の高さから文字起こしとしても使えるのではないかと話題だ。来日中のプロダクトマネージャー、ブライアン・ケムラー氏に話を聞いた。

          「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化
        • 「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)【急遽テレワーク導入!の顛末記】

            「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)【急遽テレワーク導入!の顛末記】
          • iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)

            アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日本語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/

              iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
            • KAJI | 梶谷健人 on Twitter: "GlaspっていうChrome拡張機能使うと、YouTube動画からボタン一発でChatGPTにサマリー文章を作ってもらえてとても便利。 DeepLと組み合わせて海外のカンファレンス動画やレクチャー動画も高速で学習できる。 https://t.co/FHSapesC0K"

                KAJI | 梶谷健人 on Twitter: "GlaspっていうChrome拡張機能使うと、YouTube動画からボタン一発でChatGPTにサマリー文章を作ってもらえてとても便利。 DeepLと組み合わせて海外のカンファレンス動画やレクチャー動画も高速で学習できる。 https://t.co/FHSapesC0K"
              • 文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK

                会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインを求められます

                  文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
                • 1991年の山下達郎インタビューに見る根深い孤立感と不信感 - YAMDAS現更新履歴

                  少し前に、以下のツイートを目にした。 For You がリリースされた頃、山下達郎は今のようにリスペクトされる存在ではなく、一般リスナーにとっては「流行り物」で、頭でっかちの音楽好きにとっては「チャラチャラした音楽」と捉えられていたことは、ポップミュージックの受容の歴史としてきちんと記録に残しておいた方がいいと思う。— Andy@音楽観察者 (@andymusicwatch) May 14, 2023 当時のミュージックマガジンのレビューでの評価が典型的ですよね。 https://t.co/Rvj2l5r2pE— Andy@音楽観察者 (@andymusicwatch) May 14, 2023 このあたりについて参考になる山下達郎のインタビューを参照してみたいと思う。 というわけで、1989年から2004年まで読者だった rockin' on のバックナンバーを引っ張り出す「ロック問はず

                    1991年の山下達郎インタビューに見る根深い孤立感と不信感 - YAMDAS現更新履歴
                  • Gakushi Fujiwara / 藤原学思 on Twitter: "ウクライナ危機、安保理10回目の会合が始まります。ロシアの要請です。このスレッドで速報していきます。 フランス大使の言葉が、会合の異質さを物語ります。 「ロシアがまた偽情報、情報操作、フェイクニュースを戦略として使っている。会… https://t.co/1LAaq577Xc"

                    ウクライナ危機、安保理10回目の会合が始まります。ロシアの要請です。このスレッドで速報していきます。 フランス大使の言葉が、会合の異質さを物語ります。 「ロシアがまた偽情報、情報操作、フェイクニュースを戦略として使っている。会… https://t.co/1LAaq577Xc

                      Gakushi Fujiwara / 藤原学思 on Twitter: "ウクライナ危機、安保理10回目の会合が始まります。ロシアの要請です。このスレッドで速報していきます。 フランス大使の言葉が、会合の異質さを物語ります。 「ロシアがまた偽情報、情報操作、フェイクニュースを戦略として使っている。会… https://t.co/1LAaq577Xc"
                    • 文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉

                      どうもこんにちは、あんどう(@t_andou)です。 前回宣言した通りに誰でも簡単にYoutubeの字幕ファイルを作る方法を書きます。 「Youtubeの」と書いていますが、実際はどの動画でも対応してます。 前回の記事 blog.takuya-andou.com まずはGoogleColabの共有 colab.research.google.com 使い方 GoogleColabに記載していますが 1.GPUを使用するように切り替え 上の「ランタイム」→「ランタイムのタイプを変更」からからGPUを選択 2.右上の接続 下のセルを実行すると自動的に接続されるので省略可能です 3.動画をアップロード ここにドラッグ&ドロップでアップできます 大容量のデータの場合、GoogleDriveと連携した方が効率的です 4.入出力のパスの変更 ファイル名に合わせて変更してください 5.全セルを実行 あと

                        文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉
                      • 「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記(173)【急遽テレワーク導入!の顛末記】

                          「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記(173)【急遽テレワーク導入!の顛末記】
                        • 全国霊感商法対策弁護士連絡会記者会見 文字起こし① : 統一教会(世界平和統一家庭連合)って何?合同結婚式や安倍元総理との関係についても

                          ①は全国霊感商法対策弁護士連絡会の声明とコメント ②はAさんのコメント及びAさんに対する質疑応答 ③は弁護士に対する質疑応答 黙祷部分は省略 敬称略 恐らく誤字脱字誤変換あり 「あの」「えー」などは省略 司会進行、事務的な会話等は省略した部分もあり 聞き取れなかった部分は○○○で表記 発言者が不明の場合は???で表記 川井「最初に私の方から、本日の会見の趣旨が記載されている声明文の方読み上げさせていただきたいと思います。 声明1、山上被疑者が安倍晋三元首相を死に至らしめた今般の卑劣極まりない行為は、いかなる理由があろうとも決して許されないことです。当会は安倍元首相のご冥福を心からお祈り申し上げます。 2、山上被疑者の母親が統一教会に多額の献金をし、仮定を崩壊させたことへの恨みが、今回の事件の動機であるという報道が事実であるとすればですが、同被疑者母親の常軌を逸した統一教会への献金をはじめと

                            全国霊感商法対策弁護士連絡会記者会見 文字起こし① : 統一教会(世界平和統一家庭連合)って何?合同結婚式や安倍元総理との関係についても
                          • iPhone・Androidで高速に日本語音声入力するためのベストプラクティス

                            先日Twitterで「大学生がスマートフォンでレポートを書いている」というツイートが話題になっており、それに対して反応している方達もほぼ全員が「スマートフォンでレポートを書くのは効率が悪い」という前提で話をしていることに大変違和感を覚えました。 なぜなら私はこのブログはもちろん、技術書を執筆するときでさえ主にスマートフォンで下書きをしているからです。 PCを使うのは、ほぼスクリーンショットの撮影と最後の仕上げだけです。 その方が、最初からPCで文字入力するのに比べて圧倒的に効率が良いです。 この記事では、iPhoneとAndroidそれぞれで音声入力を効率よくおこなう方法について解説します。 iPhone・iPadの場合 先に結論から申し上げると、iPhone・iPad・Macの日本語音声入力は、AndroidのGoogle音声入力に比べて認識精度が低く、認識できる単語が少ないです。 仕事

                              iPhone・Androidで高速に日本語音声入力するためのベストプラクティス
                            • OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能

                              画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性能の高さが示されています。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper Whisperはインターネット上から収集された合計68万時間におよぶ音声データでトレーニングされた文字起こしAIです。OpenAIのブログ記事には「早口のセールストーク」「K-POPの曲」「フランス語」「独特なアクセン

                                OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
                              • 「iPhoneとPCを連携させて、無料で通話を録音・文字起こしする方法」――急遽テレワークを導入した中小企業の顛末記(181)【急遽テレワーク導入!の顛末記】

                                  「iPhoneとPCを連携させて、無料で通話を録音・文字起こしする方法」――急遽テレワークを導入した中小企業の顛末記(181)【急遽テレワーク導入!の顛末記】
                                • 録音の文字起こし超ラクで仕事のやり方に変化。私生活はひたすら運動した【私の2023】 - 家電 Watch

                                    録音の文字起こし超ラクで仕事のやり方に変化。私生活はひたすら運動した【私の2023】 - 家電 Watch
                                  • 自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告

                                    AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステムを試した結果について報告しています。 I record myself on audio 24x7 and use an AI to process the information. Is this the future? https://roberdam.com/en/wisper.html ダム氏が全自動口述日記を思いついたのは、以前から「1TB超えのストレージを内蔵したスマートフォンが登場すれば、24時間365日録音し続けることが可能なのではないか」と考えていたことから

                                      自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告
                                    • https://twitter.com/buffett_code/status/1605488460659392514

                                        https://twitter.com/buffett_code/status/1605488460659392514
                                      • ダイヤモンド・プリンセスはCOVID-19製造機 なぜ船に入って一日で追い出されたのか(岩田健太郎先生の動画から文字起こし)|チョコレートサイダー通信|note

                                        ▼2020年2月18日に公開された神戸大学教授の岩田健太郎先生(Twitter)による「ダイヤモンド・プリンセスはCOVID-19製造機 なぜ船に入って一日で追い出されたのか」と題した動画についての文字起こしを行いました。 ▼結論から言えばとても深刻な内容です。テキストのコンテンツもぜひツイッターやFacebook等SNSでシェアをお願い致します(筆者) ▼Here's English Ver.(英語版はコチラ) Translation of what he said in Japanese on YouTube. ダイヤモンド・プリンセスはCOVID-19製造機。なぜ船に入って一日で追い出されたのか。 https://t.co/g2d1C5HSuI @YouTubeさんから ダイヤモンド・プリンセスに入りましたが、何者かによって1日で追い出されました。感染対策は飛散な状態で、アフリカのそ

                                          ダイヤモンド・プリンセスはCOVID-19製造機 なぜ船に入って一日で追い出されたのか(岩田健太郎先生の動画から文字起こし)|チョコレートサイダー通信|note
                                        • PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記

                                          PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。 ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan

                                            PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
                                          • 「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)【急遽テレワーク導入!の顛末記】

                                              「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)【急遽テレワーク導入!の顛末記】
                                            • 自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO

                                              自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた はじめに 今回は、OpenAIのWhisper APIとAmazon Transcribeという2つの音声文字起こしサービスを試し、それぞれの精度を比較してみました。 Amazon Transcribeは、音声をテキストに変換する自動音声認識サービスです。 ストリーミングとバッチ処理のどちらでも文字起こしが可能です。 攻撃的な言葉を指定すると、Amazon Transcribeがそれらの言葉を文字起こしから自動的に削除する語彙フィルタリングなどの機能もあります。 Amazon Transcribeの詳細は、下記の記事をご参考ください。 OpenAIには音声をテキストに変換する「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び

                                                自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO
                                              • 音声文字起こしサービス徹底検証 ベストな選択はこれだ!

                                                話した言葉をテキストデータに変換できる「音声文字起こしサービス」。テレワーク時代の情報共有ツールとして大いに役立つものの、気になるのはその実用性だ。発言の認識精度に加え、大まかな流れや会話の文脈を後から振り返るのに使えるのかどうか。主要な7つのサービスを使用し、比較した。 ※日経トレンディ2021年5月号の記事を再構成 ディープラーニングやビッグデータの活用が進み、音声認識の精度が大きく向上。話した言葉をテキストデータに変換できる「音声文字起こしサービス」が相次いで登場している。 会議の内容を振り返ったり、他の人にシェアしたりなど、テレワーク時代の情報共有ツールとして注目されているこれらのサービスは、どこまで実用的なのか。主要な7つのサービスを実際に使い、比較してみた。

                                                  音声文字起こしサービス徹底検証 ベストな選択はこれだ!
                                                • 新・必須ガジェット。テレワークのストレスを全部解決してくれました

                                                  新・必須ガジェット。テレワークのストレスを全部解決してくれました2024.03.28 17:00Sponsored by HiDock 三浦一紀 もう手放せない。 最近毎日のように行なっているオンライン会議。自宅にいながら、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。 たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返したりすることがストレスになります。また、オンライン会議が増えてきたことで、議事録作成の時間が膨大になってきているのも辛い。 さらに、自宅で仕事をする時間が増えると、机の上もごちゃごちゃになりがち。Webカメラにマイク、外付けディスプレイに外付けHDD、その他スマートフォン類の充電などなど、机の上はありとあらゆるケーブル類が這い回っています。作業スペースが狭

                                                    新・必須ガジェット。テレワークのストレスを全部解決してくれました
                                                  • Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。|Sangmin Ahn

                                                    【主要なアップデート】 (2020.02.04)「7  関連ノート」のセクションを追加 (2020. 01.30)図にImageの番号を追加 こんにちは、Choimirai School のサンミンです。 0  はじめに機械学習を使って文字起こしを行なっているサービスはいくつかありますが、Amazon Transcribe もその一つです。11月21日から日本語も対象となりましたので、使い方を簡単に紹介します。 文字起こしは、業者に頼むと1時間に1万円はすると思う。納期も最低2〜3日はかかる。ところが、Amazon Transcribe を使えば1時間で150円。そして、20分もあれば終わる!会話の場合、10人までだと参加者毎に文字起こしすることも可。言語に関する仕事をされてる方は技術の変化に注目すべき。 https://t.co/G7bJaMin6M — Sangmin @Choimir

                                                      Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。|Sangmin Ahn
                                                    • 音声から文字起こし、AWSのAIサービス「Amazon Transcribe」が日本語に対応

                                                      米アマゾン・ウェブ・サービス(Amazon Web Services)は2019年11月21日(米国時間)、音声からの文字起こしAI(人工知能)サービス「Amazon Transcribe(トランスクライブ)」の対応言語に、日本語など7言語を追加したと発表した。Amazon Transcribeを利用すると、コールセンターや動画配信などのシステムに日本語の文字起こし機能を組み込みやすくなる。 Amazon Transcribeは保存された音声・動画ファイルからの文字起こしに加え、音声・動画のストリームデータを基にした即時の文字起こしも可能だ。今回はこれらのうち音声・動画ファイルからの文字起こしで日本語に対応した。

                                                        音声から文字起こし、AWSのAIサービス「Amazon Transcribe」が日本語に対応
                                                      • ポッドキャストをAIで書き起こし「LISTEN」 近藤淳也氏が立ち上げ

                                                        AIを使ってポッドキャスト番組を自動で文字起こしするサービス「LISTEN」β版を、はてな創業者の近藤淳也氏が公開した。 OpenAIが提供する書き起こしAPI「Whisper」を使い、配信済みのポッドキャストの内容を文字起こしして公開する。テキストを指定してその部分から音声を再生することもできる。 番組にコメントを書き込んだり星を付けて出演者と交流する機能も備えた。 約20人のポッドキャスターが既に登録しており、徐々に拡大していく。 Discordコミュニティでユーザーからのフィードバックなどを受け付けている。 関連記事 OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始 「gpt-3.5-turbo」も発表 OpenAIは「ChatGPT API」と「Whisper API」の提供を開始した。ChatGPT APIの価格は1000トークン当たり0.002ドル。A

                                                          ポッドキャストをAIで書き起こし「LISTEN」 近藤淳也氏が立ち上げ
                                                        • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                                                          こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                                                            OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                                                          • OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる

                                                            OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は

                                                              OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
                                                            • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                              画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ

                                                                無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                              • Zoom自動で文字起こし(字幕)

                                                                Zoomで話した内容を自動で文字起こしし、字幕のようにして配信する方法を紹介します。 難聴者などが遠隔授業を受けやすくしたくて考えましたが、記録も残って便利です。 ポイント1 パソコンが2台あれば、あとはすべて無料でできます。 ポイント2 画面共有しても途切れません。 課題1 ホストが話した時しか文字起こしされません。複数で議論する場合には、Google Docsをメンバーと共有するといいでしょう。 ※試行錯誤中のため、もっといい方法があったら教えてください。 1. 用意するもの 以下は、Windows PCを想定しています。 1-1. ハード A. 配信用パソコン B. 文字起こし用パソコン C. マイクやウェブカムなど(必要に応じて) 1-2. ソフト D. Zoomアカウント 配信用 E. Zoomアカウント 文字起こし用 F. Open Broadcaster Software (

                                                                  Zoom自動で文字起こし(字幕)
                                                                • TechCrunch

                                                                  Hyde Park Venture Partners is known for having visibility into more than 90% of mid-continent startups and being early backers of companies like ShipBob, FourKites, G2, LogicGate and Dentologie. When Joanna Strober was around 47, she stopped sleeping. While losing sleep is a common symptom of perimenopause, she first had to go to multiple providers, including driving 45 minutes out of San Fra

                                                                    TechCrunch
                                                                  • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                                                                    OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                                                                      音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                                                                    • 会議の文字起こし、AIで簡単に 各サービスの実力は デジワザNavi - 日本経済新聞

                                                                      人が話した内容を文字に起こす作業は骨が折れる。聞き取れずに何度も繰り返し再生しなければならないなど、録音時間の何倍もかかってしまう場合も。会議の議事録作成を頼まれて、うんざりした経験がある人も多いだろう(図1)。最近は、人工知能(AI)による文字起こしサービスが増えているので、これらを利用するのがお勧めだ。録音データをアップロードすれば、あっという間にテキスト化される。スマホアプリを使って、そ

                                                                        会議の文字起こし、AIで簡単に 各サービスの実力は デジワザNavi - 日本経済新聞
                                                                      • LINEがAI文字起こしアプリを無料提供 話者を聞き分けて記録する「分離機能」も

                                                                        LINEは5月24日、AI文字起こしアプリ「CLOVA Note」(iOS/Android、Webブラウザ)のβ版をリリースした。利用料は無料。複数の参加者の声を聞き分けて別々に記録する話者分離ができるのが特徴。 LINEのAI音声認識技術「CLOVA Speech」を活用し、音声を文字に変換する。アプリ上で録音した音声を文字起こしできる他、録音済みファイルのアップロードによる認識にも対応。変換できる音声は1カ月につき300分まで。 AIの学習のためにLINEに音声データを提供する場合は1カ月600分まで変換可能。変換の際には認識精度向上のため、参加者の人数や「会議」「日常会話」といった形式、話の内容を大まかに指定する。 よく使う単語を登録する機能や音声録音中にブックマークを設定する機能、変換テキストの検索機能も備える。 CLOVA Speechは人間が大量の教師データを用意しなくても学習

                                                                          LINEがAI文字起こしアプリを無料提供 話者を聞き分けて記録する「分離機能」も
                                                                        • 「AIでの音声書き起こし」はどこまで進化したのか【西田宗千佳のイマトミライ】

                                                                            「AIでの音声書き起こし」はどこまで進化したのか【西田宗千佳のイマトミライ】
                                                                          • TechCrunch

                                                                            Kyle Kuzma is a lot of things. He’s a forward for the Washington Wizards NBA team and a 2020 NBA champion. He’s also a style icon — depending on who you ask — and an angel investor. No

                                                                              TechCrunch
                                                                            • 「議事録作成にAIを使った自動文字起こしが便利すぎる!! なので操作をもっと簡単にしてみた」――急遽テレワークを導入した中小企業の顛末記(159)【急遽テレワーク導入!の顛末記】

                                                                                「議事録作成にAIを使った自動文字起こしが便利すぎる!! なので操作をもっと簡単にしてみた」――急遽テレワークを導入した中小企業の顛末記(159)【急遽テレワーク導入!の顛末記】
                                                                              • Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた

                                                                                2021年3月3日にリリースされたデスクトップ版Google Chrome 89の安定版で、ブラウザ上で再生される音声やムービーからリアルタイムで字幕を生成する「自動字幕起こし」機能が追加されたことが明らかになったので、実際にどんな感じなのか使ってみました。 Google's Live Caption feature rolling out for Chrome desktop users https://www.xda-developers.com/google-chrome-live-caption-feature-rolls-out-transcribe-speech-videos/ Google's Live Caption is now rolling out to Chrome on desktop | Android Central https://www.androidce

                                                                                  Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた
                                                                                • 【Mac Info】 Macでかんたん文字起こし!「Google ドキュメント」で自動化しよう

                                                                                    【Mac Info】 Macでかんたん文字起こし!「Google ドキュメント」で自動化しよう