タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

文字起こしに関するnismのブックマーク (2)

  • 生成AIを使って文字起こしテキストを整形、議事録のまとめ直しにも活用できる

    備忘録やメモ程度であれば、文字起こしされたテキストのままでも十分役立つが、議事録やレポートのように第三者の目に触れたり社内外に提出する必要がある場合は、テキストを整形したりまとめ直したりする必要がある。面倒で手間のかかる作業だが、そこで活用したいのがAIツールだ。 生成AIをうまく使えば、ネット検索や文章生成の効率が飛躍的に上がる。特に、「ChatGPT」や「Bing」などのテキスト生成AIは、自然言語が扱えるため、既にさまざまなビジネスシーンで活用されている。 今回は、有料の「ChatGPT Plus」を使って文字起こし情報を整える方法を紹介しよう。手順は、①誤字脱字の修正②無意味な言葉の削除③書き言葉への変更の3ステップだ。 3段階にテキストを整形 まずは、誤字脱字の修正から始めよう。文字起こしをしたテキストを確認すると、誤認識されている用語や誤変換が少なからず見つかるはずだ。特に、専

    生成AIを使って文字起こしテキストを整形、議事録のまとめ直しにも活用できる
  • OpenAIのWhisper APIの25MB制限に合うような調整を検討する | DevelopersIO

    一般的にはAACはMP3より後継ですので、AACの方が高効率で圧縮できると考えられます。 (同等ビットレートで高音質) AACとOpus, Vorbisは比較が難しそうですが、音源ファイルの特性やビットレート設定によっても優劣は変わってきそうです。 今回はffmpegやPydubで安定動作しそうなAAC-LC(M4A)を採用したいと思います。 (ffmpegのOpus対応はexperimentalのようで、設定がうまく反映されないケースがありました) フォーマット : M4A (AAC-LC) なお、HE-AACはSBRありのため原音に無い成分が生成される可能性があるため、今回は検討しないこととします。 設定するビットレート 今回はデータを25MB以下に調整することで目標を達成したいため、以下の流れでビットレート(kbps)を計算します。 データの時間長X [sec]を計算 使えるデータ量

    OpenAIのWhisper APIの25MB制限に合うような調整を検討する | DevelopersIO
  • 1