並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 2980件

新着順 人気順

文字起こしの検索結果321 - 360 件 / 2980件

  • 面倒な文字起こし作業を一瞬で実行可能なLINE製AI音声認識アプリ「CLOVA Note」の使い方まとめ

    インタビューの記録や会議の議事録を作成する際は録音した音声を聞いて文字起こしする作業が必要ですが、自分の耳で聞いて一から文字起こしするのは非常に手間がかかる作業です。LINE株式会社が開発した音声認識アプリ「CLOVA Note」ならAIの力を利用して文字起こしが可能とのことなので、実際に使って文字起こしの手順や精度を確かめてみました。 CLOVA Note公式サイト https://clovanote.line.me/ CLOVA NoteにはiOS版・Android版・ブラウザ版が存在しており、利用の際にはLINEアカウントが必須です。今回はiOS版とブラウザ版を使ってみます。 ・目次 ◆1:iOS版CLOVA Noteのインストール&初期設定 ◆2:アプリ版CLOVA Noteの使い方 ◆3:ブラウザ版CLOVA Noteの使い方 ◆4:アプリ版CLOVA Noteとブラウザ版CLO

      面倒な文字起こし作業を一瞬で実行可能なLINE製AI音声認識アプリ「CLOVA Note」の使い方まとめ
    • 自動文字起こしサービス | Notta

      Nottaは高精度の音声認識とAI要約機能を使って、1時間の音声をわずか5分で文字起こし・要約します。商談やWeb会議の議事録作成を簡易化し、情報共有を効率的に行います。

        自動文字起こしサービス | Notta
      • 出火に関与した疑いの男、事件直前に自宅も燃える 大阪のビル火災:朝日新聞デジタル

        ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

          出火に関与した疑いの男、事件直前に自宅も燃える 大阪のビル火災:朝日新聞デジタル
        • 話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった

          インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI(人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AI「Whisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言

            話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
          • 物語を作る側の視点から『ズートピア』の面白さ、怖さ、凄さを語り尽くす

            物語に夢中になったことはないだろうか? 小説やマンガ、ゲーム、映画や舞台など、素晴らしい作品に出会ったとき、あまりの面白さに、あっという間に時が過ぎる。お話が終わり、我に返った後、あらためて、なぜそれを面白いと思ったのかは、気にならないだろうか。 その物語の「面白さ」はどこから来たのか なぜ、自分が、そこを「面白い」と感じたのか その「面白さ」は一般化/再現できるのか こうしたテーマを視野に入れ、古今東西の「面白い」作品について語り合う。これはという作品を取り上げ、物語を作る人、楽しむ人、広める人など、様々な視点から「面白い」について語り合うオンライン会だ。 「物語の探求」読書会(ネオ高等遊民サークル) タケハルさん(脚本家) スケザネさん(シナリオライター) ネオ高等遊民さん(哲学Youtuber) Dain(ブロガー) 今回の課題作は、『ズートピア』。2016年に公開されたディズニーの

              物語を作る側の視点から『ズートピア』の面白さ、怖さ、凄さを語り尽くす
            • ますます「暗い森」になりつつあるインターネットの中で個人ブログを書くことの意味 - YAMDAS現更新履歴

              yamdas.hatenablog.com 昨年6月に公開した文章だが、先日「パブリッシングの主軸をはてなからnoteに移した/移しつつある人たちをまとめてみた」で紹介したところ、初めて読んだ人が多かったようで、はてなブックマークが増えていた。 この「暗い森」になりつつあるインターネットというトレンドは、これを書いたおよそ一年半前より(Twitter の荒れ度合い、可燃性の高まりと呼応して)はっきりしてきたように思う。 ここで「暗い森」の代表として挙げられていたのはニュースレターやポッドキャストである。 アメリカにおけるニュースレターの盛り上がりについては、以下の市川裕康さんの文章が参考になるだろう。 ニュースレター配信サービス「サブスタック」と静かに広がるパッション・エコノミー|市川裕康 (メディアコンサルタント) 情報収集手段として注目のニュースレターと管理アプリ『Stoop(ストゥー

                ますます「暗い森」になりつつあるインターネットの中で個人ブログを書くことの意味 - YAMDAS現更新履歴
              • 日本「報道の自由度ランキング」70位 ハンガリーやコンゴ共和国より低い理由は?(木村正人) - エキスパート - Yahoo!ニュース

                ■G7の中で最下位[ロンドン発]国際NGO「国境なき記者団」(本部・パリ)英国支部は5月3日、ロンドンで2024年の「報道の自由度ランキング」を発表した。調査対象の180カ国・地域のうち日本は70位と前年68位から2つランクを落とした。主要7カ国(G7)の中で最下位だ。 (1)ノルウェー(昨年同)(2)デンマーク(同3位)(3)スウェーデン(同4位)と上位3カ国は北欧諸国が占めた。 G7ではドイツ10位(同21位)、カナダ14位(同15位)、フランス21位(同24位)、英国23位(同26位)、イタリア46位(同41位)、米国55位(同45位)だった。 欧州連合(EU)内部からロシアのウラジーミル・プーチン大統領を援護するオルバン・ビクトル首相が強権主義を強めるハンガリーでさえ67位(同72位)。アフリカのコンゴ共和国は日本よりランクが1つの上の69位である。 ■特定のテーマについて報道する

                  日本「報道の自由度ランキング」70位 ハンガリーやコンゴ共和国より低い理由は?(木村正人) - エキスパート - Yahoo!ニュース
                • れいわ新選組・プリティ宮城ちえ市議のマルチ商法及びポンジ・スキーム遍歴に関する記録 - OCEP第五電算室

                  要約 プリティちえこと宮城千恵氏は、2020年から"プロトン水"やJENCO(ジュビリーエース)などのマルチ商法に手を出していた 宮城市議から勧誘を受けた彼女の教え子が被害を訴えるも、宮城市議は返金に応じなかったという告発が浮上 これらの訴えに対して、宮城市議やれいわ新選組は沈黙している→山本代表が調査中と回答(9/23)→沖縄タイムスで報道(9/28 朝刊)→この件に関して宮城市議初ツイート(9/28 20:21)→れいわ新選組、違法性なしと判断し処分せず(9/30) 宮城市議のブログやSNSから、宮城市議のマルチ商法履歴を追跡する はじめに 先日の宜野湾市議選において第二位で初当選を果たしたプリティちえこと宮城千恵市議(以下、宮城市議)が、以前に"プロトン水"や"プロトン洗剤"を宣伝・販売、及び会員勧誘を行なっていたことは筆者のTwitterアカウントで指摘を行った通り。 プリティ宮城

                    れいわ新選組・プリティ宮城ちえ市議のマルチ商法及びポンジ・スキーム遍歴に関する記録 - OCEP第五電算室
                  • 西寺郷太と吉田豪 ピエール瀧を語る

                    西寺郷太さんが『猫舌SHOWROOM 豪の部屋』に出演。吉田豪さんとピエール瀧さんについてトーク。宇多丸邸襲撃事件や草野球でのピエール瀧さんの話などをしていました。 (吉田豪)小島慶子キラ☆キラの話でさっきからずっと来ているコメントが「宇多丸邸襲撃事件の話をしてほしい」みたいな。瀧さんとかと一緒にね。 (西寺郷太)ああ、宇多丸邸……あれはもう本当に、僕はなんかの仕事で。番組の打ち上げだか忘年会だかに途中で行ったら、瀧さんと宇多丸さんがケンカをし始めて。というか瀧さんが先輩の……。 (吉田豪)体育会系のノリで絡んで。「宇多丸くーん!」って。 (西寺郷太)そうそう。で、水道橋博士さんと僕と豪さんと宇多丸さんと瀧さん。それで瀧さんとも僕、その頃から草野球はやっていたんですけども。本当に仲良くさせてもらっていたのってここ5、6年で。あの頃はまだそこまでじゃなかったっていうか、草野球はやっていたんだ

                      西寺郷太と吉田豪 ピエール瀧を語る
                    • 内容をメモる必要なし! 電話の内容を録音&文字起こしするAIアプリ「コネクト」

                      内容をメモる必要なし! 電話の内容を録音&文字起こしするAIアプリ「コネクト」2021.05.10 10:0026,541 岡本玄介 後になって「アレ何だっけ?」がなくなりそう。 電話で喋ったやり取りが、テキスト・メッセージのような文字の吹き出しで表示され、その音声も録音されるので後から内容を確認しやすい、AI通話アプリ「コネクト」が開発されました。 作ったのは、ソフト開発を行なう株式会社アトラスコネクト。これがあれば、上司や取引先と話した内容など、大事な情報を失念することがなくなります。 Video: Jay Jang/YouTubeタグ付けもできて管理がラクテキストはAIによりリアルタイムで文字起こしされ、終了後すぐに見返すことができます。そして通話データはタグも付けられ、後から検索や管理ができるというスグレモノ。「電話業務が難しい理由は通話内容が記録されないから」…という原因をこれで

                        内容をメモる必要なし! 電話の内容を録音&文字起こしするAIアプリ「コネクト」
                      • 『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』ができるまで #voyagebook - t-wadaのブログ

                        昨日(2020年8月7日)、書籍『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』(ハッシュタグ #voyagebook)が出版されました。この本は私(@t_wada)がVOYAGE GROUPに在籍する主要なソフトウェアエンジニアにインタビューし、その内容をラムダノートの編集者鹿野さん(@golden_lucky)が本としてまとめたものです。2020年代のウェブにおけるビジネスとソフトウェア開発の在り方を濃縮した1冊に仕上がっています。 書名:Engineers in VOYAGE 事業をエンジニアリングする技術者たち 著者:株式会社VOYAGE GROUP 監修、和田卓人 編 (A5判、224ページ、ISBN:978-4-908686-09-2、本体価格1,800(+税)円、電子版のみ1,000(+税)円) 発行:2020年8月7日 メインタイトルが『

                          『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』ができるまで #voyagebook - t-wadaのブログ
                        • DeepLearningについて、最近作ったもの、書いたもの、勉強したこと

                          こんにちは!逆瀬川 ( @gyakuse ) です。 今日は最近作ったもの、書いたもの、勉強したことを備忘録的にまとめていきたいと思います。 なぜ書くのか、なぜ学ぶのか DeepLearningの普及以降、Attention Is All You Need以降、Hugging Faceでの民主化以降、そしてStable DiffusionやChatGPTの登場以降、どんどんAGIへの距離が短くなってきています。未来は想定より大きく変わりそうです。どったんばったん大騒ぎのときはみんなが分かっておくべきことは効率的に共有すべきで、そのために書いています。書くためには論文等を読む必要があります。そしてそのためには基礎からしっかり学ぶことが大事です。次の一歩をみんなで歩んでいくために、学び、書いています。 間違ったことを言うかもしれませんが、それでも誰かのためになれば嬉しいです。あと、個人的にはこ

                            DeepLearningについて、最近作ったもの、書いたもの、勉強したこと
                          • SEOは2022年からこうなる!?ウェブライダーが考える「ソリューション思考」と「社会的信用の醸成」|松尾茂起(ウェブライダー)

                            この記事は、日々検索集客を目指してコンテンツをつくり続けておられる個人・法人さんに向けて、2022年からのSEOにおいて意識したほうがよいことをまとめた約24,000字の記事です。 本記事は私、ウェブライダー代表の松尾の独自見解を多く含みます。 あくまでもひとつの考え方として、参考にしていただけるとうれしいです。 また、本記事は、先日オンライン開催され、のべ3,000名近い方が視聴された「SEOは2022年からこうなる!?ウェブライダーが考える2022年からのSEOセミナー」の内容の一部を文字起こしし、適宜内容を追加・編集したものです。 本記事では、2021年の検索結果の変化を振り返りながら、2022年からのSEOについて、ウェブライダー代表の松尾なりの見解を語っていきます。 最初にお断りをしておきます。 今回の話は、テクニック論を期待される方には、もしかすると「抽象的な話が多いな」と感じ

                              SEOは2022年からこうなる!?ウェブライダーが考える「ソリューション思考」と「社会的信用の醸成」|松尾茂起(ウェブライダー)
                            • 本気でCSS芸やりたい人のためのbox-shadow講座 / Mastering box-shadow

                              発表内容文字起こし https://kuroeveryday.blogspot.com/2019/07/mastering-box-shadow.html UIT meetup vol.7 集まれ!(タブン)実務では使わないフロントエンド芸発表会 https://uit.connpass.com/event/138084/ NES.css | NES-style CSS Framework https://github.com/nostalgic-css/NES.css CSS Collection(CSS芸) https://bcrikko.github.io/css-collection/ box-shadowを使ってCSSだけでドット絵を描き、アニメーションさせる https://kuroeveryday.blogspot.com/2018/10/draw-and-animate-p

                                本気でCSS芸やりたい人のためのbox-shadow講座 / Mastering box-shadow
                              • 【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】英語に少しでも困っている方向けに、外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。

                                じゅじゅ @jujulife7 【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】 英語に少しでも困っている方向けに、 外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。 2022-10-22 20:50:18 じゅじゅ @jujulife7 【Otter】 ・高精度な英語のリアルタイム文字起こしアプリ(体感で精度80~90%)でマジで使い倒しています ・英語会議時に喋っている内容が即座に文字化されるので、このアプリがあると英語苦手でも安心して会議に望めます otter.ai/jp 2022-10-22 20:51:05 じゅじゅ @jujulife7 【grammarly】 ・スペルや文法ミスを校正してくれる校正ツール ・英語でメールを書くとき、レポート・資料作成する時に重宝しています ・DeepL+grammarly有

                                  【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】英語に少しでも困っている方向けに、外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。
                                • はてな民の樹脂サッシ信仰は異常

                                  日本の家はどれだけ暖房を効かせても肝心な部分の断熱がダメで暖かくならない→海外では使用禁止の国もある代物らしい https://togetter.com/li/2053113 Vol.9 大手はなぜ樹脂サッシを使わないのか? https://www.kosodate-sekkei.co.jp/blog/matsuo-2-vol9/ この2つの記事がトップに来てて、ブコメはほとんどが 「日本は樹脂サッシを義務化しろ」 みたいなことばっかりで朝から本当にバカしかいないのか?と憂鬱になる 1件目のToggetter記事なんかは最後のまとめで 「ガラスを二重→低輻射コーティング→サッシ」 の順でしか効果薄いよ、としっかり書かれてるのに「樹脂サッシにしろ」の大合唱 しかもこの計算はだいぶサッシ寄りで最近はやりの窓が大きめで開放感重視の家だとほとんどガラスの性能になる ガラスを三重とかにすると樹脂部分

                                    はてな民の樹脂サッシ信仰は異常
                                  • Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita

                                    こんにちは!逆瀬川 ( @gyakuse ) です! 今日は最近作った議事録文字起こしアプリに話者分離機能をくっつけたものを作っていきたいと思います。 ChatGPT APIの使い方、Whisper APIの使い方、Hugging Face Spacesへのデプロイ方法等を知りたい場合は以下の記事をぜひ! できたもの openai_keyにOpenAIのAPIキーを入れる メイン音声ファイルに会話音声 (wav, 25MB以内) を入れる 話者 (1) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (1) の名前を入れる 話者 (2) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (2) の名前を入れる 上記を行って送信ボタンを押すと処理が開始されます。なお、参考音声は10秒程度で大丈夫です。実装全体は以下で確認できます。 話者分離 (S

                                      Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita
                                    • ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita

                                      はじめに 現在のデジタル社会では、Teamsなどのオンライン会議が日常的に行われています。 しかし、その議事録を取るのは容易ではありません。そこで、OpenAIのChatGPTとWhisperを使って、動画ファイルから議事録を自動生成する方法をご紹介します。 補足説明:ChatGPTについて ChatGPTは、OpenAIが開発した自然言語処理AIで、人間と自然に会話することが可能です。GPT-3、GPT-4という大規模な言語モデルをベースにしており、様々な文脈での文章生成が得意です。 補足説明:Whisperについて Whisperは、OpenAIが開発した自動音声認識(ASR)システムです。大量の音声とテキストデータで訓練されており、音声をテキストに変換するタスクを効率的に行います。 処理の流れ ここから、具体的に動画ファイルから議事録を生成するための具体的な手順を説明します。 1.

                                        ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita
                                      • 平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital

                                        月間10万人が読んでいるCoral Insightsのニュースレターにご登録いただくと、Coral Capitalメンバーによる国内外のスタートアップ業界の最新動向に関するブログや、特別イベントの情報等について、定期的にお送りさせていただきます。ぜひ、ご登録ください! Coral Capitalのポッドキャストでは、かなりAIに編集作業を頼っています。英語でインタビューしていることから、日本語では未実現の最新技術を使ったサービスに触れる機会があるのですが、ここ1、2年は、その進化には目を見張るものがあります。 収録した音声を文字(テキスト)に変換する「文字起こし」の精度が上がった結果、もはや人間に依頼する意味はなくなりましたし、音声編集についても画期的な機能が登場しています。それは音声から文字起こしされたテキストを編集することで、それに対応する元の音声データも同時に編集可能である、という機

                                          平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital
                                        • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                          無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                            無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                          • オタク世界の◯◯図で見るVTuber【配信書き起こし】 - izumino’s note

                                            前回のエントリでは、 VTuberの岸嶺ミミムさん(Twitter)、思惟かねさん(Twitter)との3人で行った座談会の書き起こしを公開しました。 2021年1月の時点でVTuber業界について語る、全3回の配信でしたが、前回のエントリが「第2回」の配信内容にあたります。 そのエントリも好評だったということで、今度は第3回から長めに書き起こしたいと思います(なお、前回も含めて他のお2人に確認していただいた上で、読みやすく加筆・再構成したテキストになっています)。 どちらも座談会というより、泉がこの配信のために準備した初出のアイディア(他では未発表)をプレゼンしていたパートを切り取っており、「VTuber論」に興味のある人に広まればいいなと思います。 プレゼンのお時間 ~オタクの「好みの構造」とVTuber~ キャラクター論の虚構とリアル VTuber語りと「ぼくら語り」の話 外見と内面

                                              オタク世界の◯◯図で見るVTuber【配信書き起こし】 - izumino’s note
                                            • アニヲタWiki(仮) 閉鎖・新管理人選挙騒動の記録 エピソード項目凍結事件

                                              管理人中心のスレを拾っただけだのでユーザー間の議論部分は見てません。あしからず。 ルール作成議論スレも拾い読み。増田は熱心な利用者でも内情に詳しい人でもないです。 5chのスレ読めばもう少し背景わかるかもしれないがしんどいので。。 まとめ管理人の最終的な考えはwikiトップページだけ読んでもらえればよいと思う。 w.atwiki.jp/aniwotawiki/ 「エピソード項目」という作品の、ある1話を解説する都合上、引用の範囲を超える翻案・盗作のような内容の説明を行う記事が多数あった・ある恐れがあった(管理人が一部盗用認定済み) 管理人がファスト映画、膨大なページ数wikiなどの権利者による摘発・停止による危機感と昇進・結婚の私事からリスク回避的に働き、タイミングよく議案も出たことから予防的な活動(修正or削除)を始める(促す)ことになった したらばでの議論・策定に大きな騒動はおそらくな

                                                アニヲタWiki(仮) 閉鎖・新管理人選挙騒動の記録 エピソード項目凍結事件
                                              • 「永年保存」したデータも書き換え後のもの 統計不正、検証は困難に:朝日新聞デジタル

                                                ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 --><!--株価検索 中⑤企画-->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">

                                                  「永年保存」したデータも書き換え後のもの 統計不正、検証は困難に:朝日新聞デジタル
                                                • 無料で自動文字起こししてくれるMicrosoft製アプリ「Group Transcribe」を使ってみた

                                                  Microsoftが、誰が何を話したのかリアルタイムで文字化して記録してくれる、無料の文字起こしアプリ「Group Transcribe」を公開していたので、実際に使ってみました。 「Group Transcribe」をApp Storeで https://apps.apple.com/jp/app/group-transcribe/id1527145885 iOS端末でApp Storeにアクセスして「Group Transcribe」を入手します。 インストールするとアプリの説明画面が4枚表示されます。「次へ」をタップするか、右へスワイプして進めていきます。 最後の説明画面で「始めましょう。」をタップ。 利用規約が表示されるので「承認」をタップ。 表示名と言語を入力します。 言語はプルダウン式メニューになっていて、かなり多数の言語が用意されています。ここで設定された言語をベースに文字起

                                                    無料で自動文字起こししてくれるMicrosoft製アプリ「Group Transcribe」を使ってみた
                                                  • Google Cloud Speech API vs. Amazon Transcribe - Qiita

                                                    文字起こしAPIガチンコバトル ググってざっと見れた範囲の「文字起こしAPI比較してみた」系記事では、数行(もしくは数分)レベルの非常に短い文字起こしを行いgood/badを述べているものが多いです。もしくはニュース動画のような"クリアすぎる音源"に対して行っているものも多いです。Amazon Transcribeについてバズっていたブログでも、英語での文字起こしで精度が高い話をしています。自然言語処理分野では英語の精度が高いのは知られているところですが日本語だとどうかというところが気になるところです。 自分が知りたいのは、 - 日本語の音源 - Podcastのように素人収録されたある程度ノイズが含まれた音源 - 1hくらいの長尺音源 - 複数人がクロストークしている音源 というような特徴を持った音声データに対してAPIだけでどこまで戦えるか(文字起こしできるか)だったので、いろいろ検証

                                                      Google Cloud Speech API vs. Amazon Transcribe - Qiita
                                                    • PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                                      こんにちは! オフショア開発チームで通訳/翻訳をしているゆまです。 今回は長年の悩みだった「PDFの文字起こし」について、感動する出来事があったのでシェアさせてください。 ※手っ取り早く方法だけ知りたい方は、「Googleドライブで文字起こしする方法」からご覧ください! ある日の出来事 翻訳依頼が入りました。 しかし、原本がPDF…… しかもWordなどから生成されたものではなく、スキャンされた画像…… わかります……最終的に保管したい文書ってサイン済、捺印済の書類ですよね……。 これ、翻訳担当あるあるじゃないですか? 翻訳に限らず、コーポレートあるあるな気がするのですが、皆さんどうですか? けっこう前に締結した契約書をベースにしたい、でもWordファイルどっか行っちゃった、とか……。 原文、どうやって文字起こしする?手打ちする? さて、こういった状況の場合、どうやって文字起こししますか?

                                                        PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                                      • 「テックブログを書くハードルを少しでも下げたい」 OpenAIのAPIを使った「技術記事作成アプリ」の構想と実装

                                                        毎回1つのテーマに絞り、テーマに対してのLTを行うTechDLT。「ChatGPT」をテーマにした「ChatGPTについてLT! TechDLT Vol.10」に登壇したのは、ほりゆう氏。OpenAI APIを用いた、技術ブログ記事作成アプリの開発について発表しました。 登壇者の自己紹介 ほりゆう氏(以下、ほりゆう):みなさま、本日はお時間をいただき、ありがとうございます。主催者のみなさま、参加者のみなさま、どうぞよろしくお願いします。「OpenAI APIを用いた技術ブログ記事作成アプリを開発した話」を紹介いたします。 まずは自己紹介からさせてください。私はエンジニアをしている堀越優希、ほりゆうと申します。もともと文系で、高等学校の国語科の教員をしていました。現在27歳です。エンジニアになったのは2020年の7月なので、今3年目くらいです。 ふだんはRailsやReactで開発をしていま

                                                          「テックブログを書くハードルを少しでも下げたい」 OpenAIのAPIを使った「技術記事作成アプリ」の構想と実装
                                                        • NiziUを開花させたプロデュ―サーJ.Y. Park氏の“イマドキの若者を育てる言葉学”「Goodが先、Mottoが後」 | 文春オンライン

                                                          今秋にデビューを控えているガールズグループ「NiziU(ニジュー)」が人気だ。プレデビュー曲である「Make you happy」のMVは公開後2カ月ほどで1億回再生を突破し、デビュー前にもかかわらず、大きな話題となっている。 彼女たち9名のデビューに至るまでのプロジェクトの軌跡を描いたオーディション番組が「Nizi Project」 だ。日本テレビやHuluでその軌跡が放送され、一人ひとりが夢に向かう懸命な姿がは多くの視聴者たちの心を捉えた。現在も「Nizi Project」は全20話がHuluおよびYouTube公式チャンネルにて無料で視聴できるので、まだ観ていないという方はぜひご視聴いただきたい。 Nizi Projectがここまで人気となった理由はいくつかあるが、そのうちの一つがプロジェクトを統括する「J.Y. Park氏の言葉」である。彼は番組内で参加者たちのパフォーマンスに対す

                                                            NiziUを開花させたプロデュ―サーJ.Y. Park氏の“イマドキの若者を育てる言葉学”「Goodが先、Mottoが後」 | 文春オンライン
                                                          • しずおかハートNet

                                                            文字起こししました。 絶対観て! *シェア、コピペ歓迎 岩田健太郎 神戸大学医学研究科感染症内科教授 ↓ツイート https://twitter.com/georgebest1969/status/1229742057746419713?s=21 以下文字起こし 岩田健太郎です、...

                                                              しずおかハートNet
                                                            • ポッドキャストをAIで文字起こししてくれるサービス「LISTEN」登場 「はてな」創業者の近藤淳也氏が立ち上げ。その狙いをポッドキャスターが聞いてきた

                                                                ポッドキャストをAIで文字起こししてくれるサービス「LISTEN」登場 「はてな」創業者の近藤淳也氏が立ち上げ。その狙いをポッドキャスターが聞いてきた
                                                              • ChatGPT・Whisper・Otter・DeepLのすごい「英語力」、海外取材で効果絶大だった

                                                                米OpenAI(オープンAI)の「ChatGPT」をはじめとする高度な言語AI(人工知能)が国内外で大きな話題となっている。英語、日本語、中国語など多言語を操り、人が話した言葉を聞き取ったり、こなれた文章を書いたり、翻訳したりする。近ごろは毎日のようにテレビやインターネットでニュースを見かけるほどだ。様々な言語AIを試しながら、自分なりの活用法を探っている読者の方は少なくないだろう。 筆者も最近、取材活動にChatGPTなどの言語AIがどれだけ役立つのかを検証する機会があった。スペイン・バルセロナで2023年2月27日から3月2日まで開催されたモバイル業界最大級の展示会「MWC Barcelona 2023」に初めて参加した。世界202の国と地域から8万8500人以上が参加したという同イベントは、基本的に英語が使われる。カンファレンス、メディア向けの展示ブースツアー、1対1のインタビューの

                                                                  ChatGPT・Whisper・Otter・DeepLのすごい「英語力」、海外取材で効果絶大だった
                                                                • 文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                                  2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第19回目は、人気の文字起こしソフト「Whisper」の高速化版、スマホでできるAIボイチェン、プレッシャーをかける感情付きプロンプトをはじめとする、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップOpenAIの文字起こしAI「Whisper」を軽量かつ高速にするモデル「Distil-Whisper」 Hugging Faceが開発 3.2兆以上のトークンで学習された、130億のパラメータを持つオープン大規模言語モデル「Skywork」 テキストや画像から高品質な動画を生成するオープンソースモデル「VideoCrafter1」 中国テンセント含む研

                                                                    文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                                                  • Claude3を使って人間が読むようにパワポ資料を読み込んでみる | DevelopersIO

                                                                    はじめに 新規事業部 生成AIチーム 山本です。 ChatGPT(OpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

                                                                      Claude3を使って人間が読むようにパワポ資料を読み込んでみる | DevelopersIO
                                                                    • VTuberさんの配信内発言をテキスト検索するシステムの試作について - はげあたま.org

                                                                      解決方法の天啓が降りてきてゴリゴリと実装した結果、「通常より塩辛く炒めた豚肉」回がいつなのかを検索できるシステムが完成! 42分頃から20分ぐらいずっとその話題。 副産物で推しの発言.sqlが爆誕しており、UI整えたらWEBサービス公開できそうな勢い😆 #獅堂リオhttps://t.co/RzdL6Ct7Fe — はげあたま (@hageatama) 2020年7月24日 VTuberさんの配信って長いうえに取り留めのない雑談なので、特定の話題をしゃべった時のアーカイブ発掘はかなり難易度高いんですよね。 しかし、「あ、YouTubeくん自身が自動で字幕生成してくれているんだから、それ検索すりゃいいんじゃん」と気付いたのでジェバンニやりました。そんだけです。 経緯 リオぴが通常より塩辛く炒めた豚肉の話してたのってどこじゃったけ…… — きなこおもち (@omochi88v4) 2020年7

                                                                        VTuberさんの配信内発言をテキスト検索するシステムの試作について - はげあたま.org
                                                                      • 文字起こしと日本語入力の未来

                                                                        現在日本語を文字化するという手段は、キーボード入力を変換するためのIM(Input Method)が主力だが、開発できるのはOS提供会社と、ごく少数のサードパーティに限られる。 だが昨今、AI音声認識によるテキスト変換サービスが次々と登場し、テキスト作成にイノベーションをもたらしつつある。IM開発と違い、AI音声認識ではプレイヤーががらりと変わるというのが面白い。特にスマートスピーカーを展開している企業は常に音声データを解析しまくっているため、有利なのだろう。 Googleは直接コンシューマーユーザーにサービス提供しているが、AmazonはAWSの組み込みエンジンとして「Amazon Transcribe」を提供している。Appleは個人情報を持ちたくないだろうから、今のところ直接ビジネスをやるつもりはなさそうだ。 またベンチャーが多く参入しているのも、この世界の特徴である。国外企業もワー

                                                                          文字起こしと日本語入力の未来
                                                                        • 構成のやり方|せしも

                                                                          はじめに構成に取り組むようになったのはいつからだろう。 アマチュアというか同人誌に載せるための作業は2012年から、少しお金をもらうセミプロでの仕事は2014年から、年間で安定して案件をこなすようになったのは2018年からになる。継続してお願いしてくれている人がいるので、一応問題ないクオリティでつくれているのではないかと思う。 ただし、いわゆる専業ライターみたいなキャリアはない。要するに、必要に応じてやる感じで、毎日やっているわけではない。イメージとしては、本業がありながら熱心に同人活動をやってる人と同じくらいの頻度ではないかと思う──実際、そういう感覚の延長で仕事をしている。 そういうわけで、この文書のターゲットは、歴戦の専業ライターではない。もちろん、そういう人が読んでためになるならそれはそれでよいけれども。メインターゲットは、これまで構成の仕事をやったことがない人、駆け出しのライター

                                                                            構成のやり方|せしも
                                                                          • 自己資金のみでSaaSを立ち上げて、メンバー5名でARR2億円を突破した話 | selfree

                                                                            こんにちは、小俣です。 クリスマスも終わって一気に年末ムードですね。 ふとこれまでの振り返りブログを書いてみたくなったので、自社サービス(SaaS)の運営スタンス、ARR 2億円を突破するまでの過程で学んだことなどを簡単にまとめました。 年末年始のお時間ある時に読んでいただけると嬉しいです。 目次 ・selfree LLCとCallConnectについて ・CallConnectはハッカソンから始まった ・黒字化まで ・ARR1億、2億円を達成するまで ・失敗しながら学んだこと ・おわりに selfree LLCとCallConnectについて セルフリーは「愛される企業を増やす」を理念に、いわゆるスタートアップ的な成長志向ではなく、自分たちのペースで着実に成長することを志向している会社です。 経営のコントロール性の観点などから、これまで外部からの資金調達はしておらず、「ブートストラップ経

                                                                              自己資金のみでSaaSを立ち上げて、メンバー5名でARR2億円を突破した話 | selfree
                                                                            • 生成AIの活用事例 10選|masa_kazama

                                                                              「テクノロジーで人々を適切な医療に案内する」をミッションに、医療プラットフォームを提供しているUbie株式会社の@masa_kazamaです。 この記事は#Ubieアドベントカレンダー5日目にエントリーしています。 今年は生成AI一色の1年でした。Ubieでは、生成AIをプロダクト活用と社内生産性向上の観点で取り組んでいます。(取り組みの詳細は、こちらの記事で紹介しています。) この記事では、社内生産性向上観点で、社内の業務プロセスに溶け込んでいて、なくてはならない使い方になっている事例を10個ご紹介します。その中のいくつかは、実際に生産性が倍以上になっていたり、外部委託のコストが半分になったりしています。この記事が、生成AIを活用している人や活用していきたい人のご参考になれば幸いです。 プロダクト活用にもいくつか事例が出ており、問診の内容を大規模言語モデル(LLM)を活用して要約する機能

                                                                                生成AIの活用事例 10選|masa_kazama
                                                                              • コードでデザインをするということ|Hiroki Tani

                                                                                この記事は2022年12月10日開催のSpectrum Tokyo Design Fest 2022で話したセッションの内容を文字起こししたものです。 僕は15年ほどWebに関する業界で働いています。はじめは小さなベンチャーでWebデザイナーとして仕事をはじめ、自分でデザインして自分でコーディングするというキャリアからはじまりました。それからフロントエンドデベロッパー、UXエンジニア、デザインエンジニアと肩書を変えてきています。 その中で、CSS設計の書籍の執筆や、Figmaのプラグイン開発、デザインシステムのリードなどの活動をしてるんですが、基本的にはコードを書くことをメインにしつつも、デザインに近い領域で仕事をしてきています。 Code is a Material僕がデザインとコードの両方についての考えを巡らせるきっかけになったのは、2019年に観たデザインシステムのカンファレンスのい

                                                                                  コードでデザインをするということ|Hiroki Tani
                                                                                • 桃井はること吉田豪 Perfume『アキハバラブ』を語る

                                                                                  桃井はるこさんが2021年8月10日配信のSHOWROOM『豪の部屋』に出演。吉田豪さんとPerfumeの黒歴史と言われがちな楽曲『アキハバラブ』について話していました。 (吉田豪)それで秋葉原で活動をするようになって……すごい「これを聞いてくれ」っていうリクエストもあったんですけども。僕らがみんな大好きだったPerfumeが……基本、「方向性が全くブレてない、すごい」と言われているPerfumeが途中で突然ひらがなになって『アキハバラブ』という伝説の一枚があり。ものすごいレア化している……それがまあ、モモーイ仕事なわけじゃないですか。 (桃井はるこ)はい。でもさ、「ブレてない」っていうか、ブレてないんですよ。だってひらがなにしているんだから。 (吉田豪)そうですよね。初期の、要は広島ローカルアイドル時代の名称、ひらがなの「ぱふゅーむ」っていうことですよね。 (桃井はるこ)いや……ひらがな

                                                                                    桃井はること吉田豪 Perfume『アキハバラブ』を語る