YouTubeにアップされている何十億もの動画のうち、あなたが一生に目にするのはごく一部でしょう。 重要なポイントだけを知りたいのに、そこにたどり着くまでにたくさんのことに目を通さなければならない動画もあります。それは無駄な時間です。 もし、視聴する動画の重要な情報を要約することで、視聴時間を短縮できるとしたらどうでしょう? 幸いなことに、GoogleのAIチャットボットであるGeminiには、YouTubeの拡張機能が組み込まれており、デフォルトで有効になっています。
こんにちは、株式会社シグマアイのエンジニアの@k_muroです。 今回の記事は最近導入した「技術blogを良い感じに共有してくれるSlack bot」のご紹介を。 はじめに 技術の進化は止まらない。(真面目な話、AI系の進捗がマジですごいて全然追えない) 毎日のように新しい技術、フレームワーク、ライブラリ、ツールが生まれています。そんな中でエンジニアとして働いていると、この情報の波に疲れを感じること、ありませんか? ありますよね?(脅迫) 実際私もその一人で、この小さな疲れが積み重なって大きなストレスとなることに気づきました。 「新しい技術情報、追いつけるかな?」 「あのブログ記事、後で読もうと思ってたのに、どこいったっけ?」 「チーム全員が同じ情報を持ってるか心配だな。」 そんな日常の疑問や不安から逃れるための一歩として、私はあるSlack botを開発しました。このbotは、送られた技
エンジニアの間では発売から瞬く間に広まった本書ですが、まだ読んでない方々向けに本記事を書いてみました。要約なので、ここは重要だなと感じたポイントに絞って本記事に記載します✏️ 概要 まず結論からいうと、仕事の進めかたや捉え方という点でとても学びのある良書です。すでに多くのエンジニアには知れ渡っていますが、もっともっと知れ渡って欲しい本です。 内容としては、著者の牛尾さんがアメリカのMicrosoft社(Azure開発)で得た経験がそのままに書かれています。最初はアメリカのエンジニアに劣等感を感じていたようですが、その理由を言語化して、実際にどうすれば彼らと肩を並べるエンジニアになれるかが書かれています。 また全体的にアメリカのエンジニア思想を爆推ししているので、こっち系の思想が好きな人は一瞬でハマると思います。私もどちらかと言えば圧倒的にこっちのタイプですが、読むときには偏らないように中立
Googleは、生成AIチャット「Bard」がYouTube動画について理解する能力が上がったと発表した。例えばレシピ動画を見ずに材料や作り方を確認できる。 米Googleは11月21日(現地時間)、生成AIチャット「Bard」が「YouTube動画を理解する能力の第一歩を踏み出した」と発表した。 同社は9月に、YouTubeからリアルタイム情報を取得できるようにしているが、今回のアップデートで、動画の概要や、長い動画のどの当たりで目的の情報が得られるかなどを答えられるようになったようだ。 Googleは例として、ケーキのレシピ動画を探している場合、そのレシピに必要な卵の数を尋ねられるようになるとしている。 「美味しいミルクティーの入れ方を紹介するYouTube動画から、手順を教えてください」と尋ねたところ、複数の画像入りの説明が表示された。最初の手順に「ティーポットに水と紅茶を入れ」とあ
はじめに 5月からTuringに中途入社した棚橋です。リクルートで広告配信システムの開発や量子アニーリングに関する研究開発に関わっていました。現在、Turingのリサーチチームで完全自動運転システムの研究開発に取り組んでいます。 3行でまとめ 今月開催されるCVPR2023では約2400本もの論文が発表されるため、見るべき論文を事前に検索しておきたい。 社内で行われた大規模言語モデル(LLM)ハッカソンをきっかけに、LLMのEmbeddingを用いて論文の「検索・推薦・要約」システムを作成し公開した。 検索クエリに文章を使った曖昧な検索が行えたり、類似論文の推薦ができる。6/13にアップデートされたGPT3.5の新機能であるファンクション機能を使うことで、複数観点に分けて研究内容の要約を出力させた。 ↓ 今回作成した、LLMを使ったCVPR論文検索システム 事の発端 Turingは、ハンド
はじめに この記事では、3日間でテック記事のAI要約・翻訳メディアをつくる個人開発で利用した OpenAI API LangChain の具体的な実装と利用コストについて触れていきます。 OpenAI APIとLangChainとは... OpenAI API OpenAI APIは、OpenAIという人工知能の研究・開発・普及を目的とした団体が提供するAPIです。このAPI は、自然言語とコードの理解または生成を必要とするタスクに利用することができます。 LangChain OpenAIが提供するGPT-3のような大規模言語モデル(Large Language Model: LLM)を利用してサービスの開発をしたいときに、「あるとうれしい機能」が集まったライブラリです。 この記事の目的 OpenAI API を使った記事の要約とFunction Callingの紹介 LangChain
3/30 に X で Terraform がトレンド入りしていて何事かと思ったら Terraform が公式ドキュメントとしてスタイルガイドを出したようです。 Terraform Style Guide いままで Terraform のスタイルに関して信頼できるドキュメントといえば Google Cloud の Terraform を使用するためのベスト プラクティス ぐらいしか知らなかったのですが、 Terraform 公式がようやく出してくれてありがたい限りです。 これでわざわざ社内の Terraform 規約を設けずとも「公式ドキュメントに従いましょう。」の一言で済みます。 ということで一通り読んだのでまとめました。 原文だと構文の簡単な使い方なども書いてありますが以下の要約ではだいたい省略しています。 詳細は原文を読んで確認してください。 要約 スタイルガイドについて コードのスタ
Next.js に対する Kent C. Dodds の批判と、Lee Robinson のアンサーの要約 はじめに 10 月 26 日に Next.js Conf が開催されましたが、それと前後して Kent C. Dodds (以下 kentcdodds と呼びます) と Lee Robinson (以下 leerob と呼びます) がそれぞれ という記事を公開しました。前者はタイトルの通り、Testing Library の作者であり、Remix の共同創業者の一人でもある開発者兼教育者 kentcdodds が、Next.js を使わない理由について述べたものです。そして後者は、Vercel の VP of Developer Experience である leerob が、主に前者に対する反論を述べたものです。筆者は両方の記事を公開後すぐに面白く読み、そしてどちらにも頷けるところ
講義や会議の様子がまるごとYouTubeにアップロードしてあっても、ムービーが数時間にも及ぶような場合内容を確認するのはかなり気が引けるものです。「summarize.tech」はChatGPTを利用して5分単位で内容をまとめてくれるツールとのことなので、実際に使って試してみました。 summarize.tech: AI-powered video summaries https://www.summarize.tech/ 最初に要約してもらうのは下記のムービーです。 This is Financial Advice - YouTube 再生数・評価ともに高く、おそらく何かいい内容なのだとは思うのですが、いかんせんムービーの長さが2時間半以上もあり見始める前から心が折られそうです。というわけでsummarize.techの出番というわけ。まずはURLをコピーします。 summarize.t
Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) はじめに Amazon Connectを使用して、お問い合わせ内容をOpenAIのWhisper APIで文字起こしとChatGPTで要約し、通話中に音声出力する方法をまとめました。 Connectで無人対応の場合、顧客からの発話を聞き取る方法としては、チャットボットサービスであるAmazon Lexもしくは、Kinesis Video Stream(KVS)で音声のストリーミングなどがあります。 Amazon Lexを利用する場合は、1度に15秒以上は聞き取ることができない点や文字起こしにはAmazon Transcribeを利用する制約があります。 今回は、文字起こしにWhisper APIを利用し、ChatGPTで要約した内容をConne
こんにちは、安部です。 最近急に、暖かさを通り越して暑いぐらいになってきましたが、皆さまいかがお過ごしでしょうか。 季節外れかなとも思いつつ、もう半袖で過ごしたいくらいの気候ですね。 さて、今回は、OpenAIのAssistants APIの使い方を紹介していきます。 題材は「PDFを和訳して要約してもらう」としました。 これはWeb版のChatGPTでも単にPDFファイルを添付して依頼すればできますが、APIの使い方を示すサンプルとしてはちょうどよいと思います。 最新情報については以下の公式ドキュメントをご覧ください。 https://platform.openai.com/docs/assistants/overview https://platform.openai.com/docs/api-reference/assistants それでは早速、Assistants APIの使い方
「コーディングだけじゃない!Github Copilot の活用法」 というタイトルで登壇したのは、コミューン株式会社の池田将氏。タイミー社主催の「GitHub Copilotで拓く開発生産性」で、「GitHub Copilot」における、さまざまな活用法について発表しました。 登壇者の自己紹介 池田将氏:コミューン株式会社の池田将と申します。めちゃくちゃ緊張しています(笑)。登壇は初めてで、GitHubの方もいて、今「すごいな」と思っている感じです。コーディングの話を先に紹介していただいたので、順番に恵まれたなと思います。 軽く自己紹介をして、コミューンがどうやって「GitHub Copilot」を導入したのかを説明した後、活用事例を紹介させてもらえればと思います。 コミューンは、2つのプロダクトを作っています。ビジョンは「あらゆる組織とひとが融け合う未来をつくる」で、コミュニティ作りに
AI(人工知能)・ビッグデータ分析技術開発のユーザーローカルは、手軽で高速に文章の要約が可能な「ユーザーローカルAI自動要約ツール」の提供を始めた、と3月21日に発表した。利用者は複数の生成AIの大規模言語モデル(LLM)から選択して文章要約でき、文書の種類や、要約結果の長さも指定できる。ログインは不要で無料で利用できる。 米国OpenAIの「ChatGPT」で「GPT-3.5」と「GPT-4」だけでなく、米国Anthropic(アンスロピック)の「Claude」で最近発表されて話題の「Claude 3」にも対応した。「日報」、「レポート」、「ニュース記事」、「コールセンターなどの会話ログ」、「議事録」、「物語」など文章の種別を指定すると、より高品質な要約結果が得られる。 AI自動要約ツールに入力されたテキストは、ChatGPTやClaude、ユーザーローカルのAIトレーニングに利用される
神アイテム! 録音・文字起こし・要約が一瞬で完了するChatGPT連携AIボイスレコーダー2023.11.06 17:00Sponsored by PLAUD, Nicebuild LLC 中川真知子 「生産性爆上がり」に偽りなし。 打ち合わせや会議の議事録、取材のまとめやインタビューの文字起こし…。私たちの毎日は、インプットして、まとめて、アウトプットしての繰り返しです。 私は、ボイスレコーダーで録音した音声をAI文字起こしサービスに流し込んで、文字起こしまでは自動化しています。そのため、ある程度の効率化を図れていると思いますが、もっともっと楽がしたい。1分でも時短したい…。 そう思っていたとき、応援購入サービス「Makuake」で発見したのが「PLAUD NOTE(プラウドノート)」。「録音→文字起こし→要約作成」を自動で完了させてくれる、ChatGPT連携のボイスレコーダーです。 実
こんにちは、AIソリューショングループの太田です。 昨年から引き続き生成AIブームが止まらない中、自主的に進めていた取り組みを紹介します。それは海外AIニュースの要約を、社内で使用しているTemasのチャネルに投稿する取り組みです。 投稿自体はPower AutomateやAzure Function、Azure OpenAI Serviceなどを活用することで自動的に投稿しており、数ヶ月運用した結果を踏まえて最近アルゴリズムの改善をおこなったので、改めて方法とノウハウをまとめたいと思います。 はじめに アーキテクチャ紹介 Power Automate Azure Functions Bing Search Azure OpenAI Service(AOAI) Log Analytics 海外ニュース要約 APIの処理フロー 検索ワードの翻訳 Bing 検索 HTMLの読み込み ニュース記
ヤフーは10月25日、「Yahoo!ニュース」Web版に掲載された記事で、一定数以上のコメントが投稿されている場合、コメントをAIで要約して表示する新機能「コメントAI要約 β版」の試験提供を始めた。OpenAIのGPT-4を活用した。 コメント投稿フォーム下の「要約」ボタンを押すと、GPT-4が「おすすめ順」の上位に掲載されるコメントを要約。コメントの注目ポイントと、ユーザーに気づきを与えるコメントの要約、コメント欄の話題と関連の高いワードを表示する。配信から24時間以内の記事が対象。 試験的な導入のため、コメント全文とあわせて確認するよう求めている。 関連記事 ヤフコメ、上位に多様な意見を表示する独自AI導入 エコーチェンバー現象の軽減に期待 ヤフーは18日、「Yahoo!ニュース」のコメント欄により多様な意見が上位に表示されやすくなる独自AIを導入すると発表した。 新規悪質ヤフコメユ
はじめに この記事では私が作成した文書要約のWebアプリの使用方法とコードを解説しています。 コードはGitHubにリポジトリを作成しておりますので、使用されたい方はCloneしてお使いください。 https://github.com/YusukeOhnishi/document_summarize このWebアプリは文書(英語論文)を読む際に、 さっとまとめてくれるWebアプリがあれば便利そう 自身で必要な機能を追加していけたら楽しそう というモチベーションから作成しました。実際に使用してみて、不便だなと感じる点やこういう機能が欲しいなと思えば、コメント及び連絡いただけると助かります。できる限り機能追加して対応していきます。 Webアプリの使用方法 Webアプリの起動 作成したアプリケーションはローカル環境及びDockerコンテナ上で起動することができます。 以下のコマンドを実行してクロ
iOS18の新機能として、iPhone純正の「ボイスメモ」アプリで、人工知能(AI)を活用した文字起こしと内容の要約機能が追加される、と米メディアAppleInsiderが報じています。クラウドにデータを送信せずデバイス上で動作するので、機密情報を含む会議も安心して要約できそうです。 iOS18の「ボイスメモ」で録音、文字起こし、要約が可能に iOS18の「ボイスメモ」アプリで、録音した音声の文字起こしと、その内容の要約が可能になる、とAppleInsiderが事情に詳しい複数の関係者から得た情報として伝えています。 AIによる文字起こしと要約機能は、6月の世界開発者会議(WWDC24)で発表予定のiOS18のほか、iPadOS18、macOS15でも使用可能になる見込みとのことです。 iOS18の「ボイスメモ」アプリでは、画面配置が既存のものから大きく変更され、文字起こし結果が画面の中央
こんにちは。メディア研究開発センター(M研)の田口です。 最近、大規模言語モデル(以下、LLM)に関するニュースが毎日のように出ています。直近約1ヶ月の間にもOpenAIのAPIのアップデートが発表されたり、日本語のLLMが公開されたりしました。 少し前(といっても4月末)に「ChatGPT/OpenAI API/LLM活用事例~NewsPicksと朝日新聞の合同勉強会を公開」でLTをしました。このときはChatGPTの見出し生成の簡単な性能検証をしただけなので、この記事では最近公開されたLLMモデルの検証をしてみました。 ※この記事では社内データでなく公開データされているデータセットで実験しています LTの資料はこちらになります。 日本語LLMを要約タスクで検証するさっそく本題に入りましょう。今回は5月以降に発表された以下の日本語LLMを要約タスクで評価してみようと思います。 cyber
大手通販サイトのAmazonが2023年6月頃からテストを行っていることが報じられていた「ユーザーが書いたレビューの文章をAIが要約してまとめる機能」が、2023年8月14日、アメリカの一部のユーザーを対象に正式サービスを開始しました。 Amazon improves the customer reviews experience with AI https://www.aboutamazon.com/news/amazon-ai/amazon-improves-customer-reviews-with-generative-ai Amazon adds AI-generated review summaries so you don’t have to read the comments - The Verge https://www.theverge.com/2023/8/14/23
昨年10月に「OpenAIのエンジン採用で話者認識もできる超高性能なAIボイスレコーダー、AutoMemoはどこまで進化するのか?」という記事で開発者インタビューも行ったソースネクストが展開するAutoMemo。会議を録音すれば簡単に議事録を作ることができるし、われわれライターや編集にとってはインタビューした内容をそのまま文字起こししてくれるという意味で、まさに長年の夢が叶ったシステムであり、もはや手放すことが不可能なほど重要なアイテムになっています。 文字起こし正解率98.9%(※)を誇るという、このAutoMemoは昨年10月以降もアップデートを繰り返し、性能改善を行うとともに、いくつかの新機能を実装してきています。そのひとつがWebアプリ版のAutoMemoに録音機能が搭載されたこと。これによりZoomやTeams、Google Meetなどを使ったオンライン会議の文字起こしも、ハー
OpenAI aims to restrict harmful uses of AI like misinformation while enabling beneficial ones.Demand for AI compute power will drive breakthroughs in fusion, solar and energy storage.AI will augment and enhance human productivity more than replace jobs.OpenAI seeks partnerships with news publishers to properly attribute content.Advanced AI may discover new scientific knowledge and even do AI resea
あなたがチーズケーキの作り方を学びたいが、30分もあるYouTubeの料理動画を見るほどの時間はないとしよう。そんな場合に、グーグルのBardの新機能を使えば、わずか数秒で重要なポイントだけを把握して、貴重な時間を節約できるかもしれない。 YouTubeには、料理やDIY、教育などの多様なジャンルにまたがる実用的な動画が掲載されている。しかし動画が長かったり、コンテンツ内の重要な詳細が不明瞭であったりすることが、それを利用する上での課題になっている。 グーグルによって共有された最近のアップデートで、人工知能(AI)のBardはYouTube動画の内容を理解できるようになった。グーグルの生成AIツールは、動画の内容に関連する質問に対応できるように進化した。また、YouTube動画のURLを入力するだけで、内容を要約することができる。この動きは、最初にニュースサイトAndroid Author
多くの人が日々使う、パソコンのブラウザー。拡張機能(アドオン)と呼ぶプログラムを加えれば、効率が大幅にアップ。主要なものからあっと驚くものまで、専門家がおすすめのアドオンを選んだ。今週の専門家▽阿部香織(ITライター)▽池田朋弘(Workstyle Evolution社長)▽井上健語(テクニカルライター)▽金子晃之(パソコンスキル解説YouTuber)▽川島玲子(いなわくTV)▽田中拓也(フリーライター)▽徳本昌大(情報経営イノベーション専門職大学特任教授)▽森田圭美(ビジネスプラスサポート人財育成プロデューサー)▽守屋恵一(ライター)▽横山隆(DX人材育成サービス「MENTER」事業責任者)=敬称略、五十音順
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits Shuming Ma∗ Hongyu Wang∗ Lingxiao Ma Lei Wang Wenhui Wang Shaohan Huang Li Dong Ruiping Wang Jilong Xue Furu Wei⋄ arxiv.org このページの図面・表の権利は全て論文の著者らに帰属があります。 The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits この論文を一行でいうと Abstract The Era of 1-bit LLMs BitNet b1.58 LLaMA-alike Components. Result Memory and Latency Energy
ロバート・パリー氏(調査報道ジャーナリスト)の連作記事のChatGPT要約です。 内容がよく理解され、岸田政権は統一教会に解散命令を出すことを希望します。 題名:文鮮明の暗黒面 著者:ロバート・パリー https://consortiumnews.com/archive/moon.html Dark Side of Rev. Moon: Hooking George Bush(https://www.consortiumnews.com/archive/moon1.html)この記事は、文鮮明(文中では単に" 文"と呼ばれています)と元アメリカ大統領ジョージ・ブッシュとの関係に焦点を当てています。記事の内容を要約すると以下のようになります: 文鮮明は、韓国に本拠を置く統一教会の創設者で、高価なメディアと政治の世界への進出を試みていました。彼は南米で新聞「Tiempos del Mundo」
近年では、Googleが医療面接に特化したAI「Articulate Medical Intelligence Explorer(AMIE)」を開発するなど、医療分野でのAI利用が急速に拡大しています。医療の質や安全性の向上を推進する非営利団体Healthcare Information and Management Systems Society(HIMSS)が開催したカンファレンス「HIMSS 24」での大きな話題は、医療分野における生成AIに関する技術でした。 HIMSS 2024: Ambient clinical documentation steals the show https://www.cnbc.com/2024/03/16/himss-2024-ambient-clinical-documentation-steals-the-show.html 2024年3月11日
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く