Metaが2023年8月に公開したAI「SeamlessM4T」は、音声を入力するだけで文字起こしや別言語への翻訳、別言語への吹き替えが可能です。さらにMetaは2023年11月30日に、SeamlessM4Tの改良版となる「SeamlessM4T v2」を発表しました。この「SeamlessM4T V2」では、SeamlessM4Tのパフォーマンスを向上させているだけでなく、感情やスタイルを維持しながら、別の言語へ吹き替えを行うことも可能です。 Introducing a suite of AI language translation models that preserve expression and improve streaming https://ai.meta.com/blog/seamless-communication/ Seamless Communication T
神アイテム! 録音・文字起こし・要約が一瞬で完了するChatGPT連携AIボイスレコーダー2023.11.06 17:00Sponsored by PLAUD, Nicebuild LLC 中川真知子 「生産性爆上がり」に偽りなし。 打ち合わせや会議の議事録、取材のまとめやインタビューの文字起こし…。私たちの毎日は、インプットして、まとめて、アウトプットしての繰り返しです。 私は、ボイスレコーダーで録音した音声をAI文字起こしサービスに流し込んで、文字起こしまでは自動化しています。そのため、ある程度の効率化を図れていると思いますが、もっともっと楽がしたい。1分でも時短したい…。 そう思っていたとき、応援購入サービス「Makuake」で発見したのが「PLAUD NOTE(プラウドノート)」。「録音→文字起こし→要約作成」を自動で完了させてくれる、ChatGPT連携のボイスレコーダーです。 実
皆さんは、普段からよくメモをとるだろうか。ちょっとしたことでも、すぐにメモをとる習慣というのは、仕事だけでなくプライベートでも意外と役に立つ。とはいえ、日常でメモをとりたいときに、都合よくメモやペンが用意できるかというと、意外と難しいのは皆さんもご存じの通りだ。今はスマホのメモ機能を使う人が多いが、それでもやはり一文字ずつ打ち込むというのは、なかなか面倒なものである。より便利で簡単にメモを記録する方法は、何かないものだろうか。 今日は、30秒で分かるiPhoneの裏技を日々紹介しているインスタグラマー・かずや|知らないと損するiPhone裏技@kazuya_iphoneさんの投稿『iPhoneで音声を簡単に文字起こしする方法』について、皆さんにご紹介しようと思う。 かずや|知らないと損するiPhone裏技さんは先日、下記の文章とともに、あっという間にボイスメモを文字にして保存するiPhon
会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインを求められます
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 音声の書き起こしはライターにとって夢の技術だ。そのまま原稿にできるわけではないが、インタビュー原稿や取材記事を執筆する上での手間が劇的に減る。筆者はもうずっと昔から、書き起こし系の技術が出るたびに試行錯誤を繰り返してきた。 そんな中に、ちょっとびっくりするようなサービスが現れた。正確にいえば「使ってみたらびっくりするようなものだった」というのが正しいだろうか。 それはいわゆるジェネレーティブAIサービスである「Easy-Peasy.AI」だ。このうち、AIによる音声書き起こしサービス「AI Transcription」を日本語で使ってみた。 結果として、「非常に使えるが、面白い性質がある」こともわかってきた。現在のジェネレーテ
インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI(人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AI「Whisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言
おめでとうございますこのプロジェクトは、2022-05-25に募集を開始し、607人の支援により10,255,600円の資金を集め、2022-07-31に募集を終了しました ①ワンプッシュで直ぐに録音!リアルタイムで文字起こし・翻訳もできる3in1AIボイスレコーダー。②文字起こしは97%の高精度。PCと携帯のどちらでも編集OK。議事録作成を徹底的にサポートします。③Wordへのデータ転送。100時間の音声データをクラウド保存可能。あなたの仕事を効率化させます。 ボタンをワンプッシュするかアプリの録音開始ボタンを押すだけで録音開始できるため、いつでも、どこでもすぐに録音できます。 ボイスレコーダー上で録音した音声は専用アプリを介して、Bluetooth接続したスマホに文字起こしを行います。 録音中のリアルタイムでも、録音しておいた音声データを後からでもアプリを介して文字起こしは可能、会議が
「設定」アプリを開いたら、「ボイスメモ」をタップ。この中にある、「位置情報を録音名に使用」というボタンをオフにすればいい。オフにした際には、住所や建物名などの代わりに、「新規録音 #0」(0には連番が入る)というファイル名が記録される。 ボイスメモアプリ内では時系列に並ぶとはいえ、連番で新旧がわかったほうが、ファイルアプリに保存した際などに扱いやすい。とはいえ、「新規録音」のままだと、結局は住所と同じで、ファイルの中身がわからない。ひと手間かかってしまうが、録音後には適切な名前のファイル名に書き換えるようにしておきたい。変更したいファイルをタップしたあと再びファイル名をタップするとキーボードが表れ、ファイル名の編集ができる。 録音時の音質を上げることも可能 「設定」アプリの「ボイスメモ」では、ほかにも録音のファイル形式を変えることが可能だ。標準では、「非可逆圧縮」にチェックがついており、フ
インタビューの記録や会議の議事録を作成する際は録音した音声を聞いて文字起こしする作業が必要ですが、自分の耳で聞いて一から文字起こしするのは非常に手間がかかる作業です。LINE株式会社が開発した音声認識アプリ「CLOVA Note」ならAIの力を利用して文字起こしが可能とのことなので、実際に使って文字起こしの手順や精度を確かめてみました。 CLOVA Note公式サイト https://clovanote.line.me/ CLOVA NoteにはiOS版・Android版・ブラウザ版が存在しており、利用の際にはLINEアカウントが必須です。今回はiOS版とブラウザ版を使ってみます。 ・目次 ◆1:iOS版CLOVA Noteのインストール&初期設定 ◆2:アプリ版CLOVA Noteの使い方 ◆3:ブラウザ版CLOVA Noteの使い方 ◆4:アプリ版CLOVA Noteとブラウザ版CLO
LINEは5月24日、AI文字起こしアプリ「CLOVA Note」(iOS/Android、Webブラウザ)のβ版をリリースした。利用料は無料。複数の参加者の声を聞き分けて別々に記録する話者分離ができるのが特徴。 LINEのAI音声認識技術「CLOVA Speech」を活用し、音声を文字に変換する。アプリ上で録音した音声を文字起こしできる他、録音済みファイルのアップロードによる認識にも対応。変換できる音声は1カ月につき300分まで。 AIの学習のためにLINEに音声データを提供する場合は1カ月600分まで変換可能。変換の際には認識精度向上のため、参加者の人数や「会議」「日常会話」といった形式、話の内容を大まかに指定する。 よく使う単語を登録する機能や音声録音中にブックマークを設定する機能、変換テキストの検索機能も備える。 CLOVA Speechは人間が大量の教師データを用意しなくても学習
アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日本語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/
京セラは10月12日、音声認識技術を活用し、話した内容を字幕としてアクリル板などに表示できる「わかりやすい字幕表示システム」を開発したと発表した。マスク着用時やアクリル板越しでの会話でも意思疎通がしやすくするという。 専用アプリをインストールしたスマートフォンのマイクで発話の内容を取得。アプリの音声認識でテキスト化し、アクリル板に貼り付けた透明なスクリーンに小型プロジェクターで投影する仕組み。スクリーンは透明なビニールシートなどにも貼り付けられる。事前に設定しておけば、特定の言葉を強調表示したり、会話の内容に合わせて図を投影したりすることも可能という。 役所の窓口業務など、接客での活用を見込む。マスクによって口元が隠れることで、口の動きや表情から会話のニュアンスを読み取りづらくなっていた聴覚障害者や高齢者によるコミュニケーションを円滑化する狙いもある。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く