タグ

AIに関するreboot_inのブックマーク (81)

  • 「こんな使い方が!?」 ChatGPTに“スーパーのチラシ”を読ませる→毎日の献立を考えてもらう 日常でAIを活用するライフハックが話題

    スーパーのチラシを読ませたChatGPT料理の献立を考えてもらうというライフハックが、X(旧Twitter)で「すごい賢い使い方」などと注目を集めています。 電子チラシとAIを活用 ライフハックを紹介しているのは、Xユーザーのイモンヌ(@immonnu)さん。「chatgpt4oに近所のスーパーの電子チラシを読ませて1番安く仕上がる献立を作らせてみた」と、無課金ユーザーも使える最新モデル「GPT-4o(GPT-4 Omni)」に献立を考えてもらった結果を共有しています。 イモンヌさんはスーパーの電子チラシ2枚分をGPT-4oをアップし、「チラシを見て、3日分の夕の献立作ってほしい」と指示。「可能な限り安く済ませて欲しい」「男性1人、女性1人、幼児1人分作って欲しい」「可能な限り統一感(和中華といった)が欲しい」「レシピの試算金額を出して欲しい」「主は家に在庫あり」など具体的な条件

    「こんな使い方が!?」 ChatGPTに“スーパーのチラシ”を読ませる→毎日の献立を考えてもらう 日常でAIを活用するライフハックが話題
  • 高木浩光@自宅の日記 - 難解な研究成果の普及広報活動は対話型LLMに任せるようになるのかもしれない

    ■ 難解な研究成果の普及広報活動は対話型LLMに任せるようになるのかもしれない 分野による話かもしれないが、研究が論述によってのみ成り立つ分野では、理解されてナンボであるため、その普及広報活動に悩まされることになる。ここの日記でも何度か自分の成果を紹介するエントリを書いた*1が、反応が薄くて徒労感がある。先月も書いたように、解説というものは、読み手の理解状況に合わせてカスタマイズする必要があるのだが、人が解説しようとすると、どうしても全部を説明しようとしてしまって、結局原文を読むのと違わなくなってしまうので、第三者からの「一部を切り取った解説」が求められるのである。 そこで対話型LLMである。究極的には、自分が書いてきた文章の全てをLLMに「理解」させて、あらゆる質問に答えるbotを提供することを目指すことになる。「自分の能力をそんなbotに安売りさせてどうすんだ」という声もあるかもしれ

    reboot_in
    reboot_in 2024/04/09
    “今年のClaude 3の登場で一変した。Claude 3 Opusが長文の内容を「理解」して解説してくれることは先月も書いたが、論文を与えた場合にもほぼ的確に解説をしてくれるのである。”
  • Kaedim | Generate 3D Models from 2D Images with AI

    Game-readyon-demand3D assetsKaedim's machine learning and in-house art team combine to deliver production-quality assets in minutes.

    Kaedim | Generate 3D Models from 2D Images with AI
  • 伊藤園「おーいお茶」CMに生成したAIタレントを起用

    伊藤園が「お~いお茶 カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日初になるという。 同社は発表に際して「AI技術で生成したAI model(AIモデル)を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。 「お~いお茶 カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

    伊藤園「おーいお茶」CMに生成したAIタレントを起用
  • Cloudflare + AI

    Run fast, low-latency inference tasks Use curated, pre-trained, and verified machine learning models or, train and upload your own with Constellation. See it in action in the following demos.

    Cloudflare + AI
    reboot_in
    reboot_in 2023/08/10
    “Use curated, pre-trained, and verified machine learning models or, train and upload your own with Constellation.”
  • AI研修【MIXI 23新卒技術研修】

    23新卒技術研修で実施したAI研修の講義資料です。 ハンズオン用リポジトリ:https://github.com/nami73b/machine-learning-notebooks-2023 資料の利用について 公開している資料は勉強会や企業の研修などで自由にご利用頂いて大丈夫ですが、以下の形での利用だけご遠慮ください。 ・受講者から参加費や授業料などを集める形での利用(会場費や飲費など勉強会運営に必要な実費を集めるのは問題ありません) ・出典を削除または改変しての利用

    AI研修【MIXI 23新卒技術研修】
    reboot_in
    reboot_in 2023/08/08
    良き
  • 顕微鏡画像向け、リアルタイム物体検出AIシステム 病理画像の自動解析に活用

    デジタル病理画像の解析は、組織パターンや細胞形態を調べることで診断結論を導き出すために必要である。しかし、手作業による評価には時間と費用がかかり、観察者間と観察者内のばらつきが生じやすい。 近年、医療やデジタル病理学において、いくつかの技術的進歩が見られる。病理医を支援するためには、自動化された組織構造の検出とセグメンテーションを求められる。 デジタル病理画像の自動セグメンテーションとピクセル解析は、診断パターンと視覚的手掛かりを特定し、より信頼性が高く一貫性のある診断分類につながる可能性がある。これは当然、時間の短縮につながる。 特に糸球体の検出は、異なる腎臓病の診断に続く糸球体疾患の分類の第一歩として、デジタル病理学において不可欠かつ重要である。球体検出により、コンピュータによる定量化が可能となり、病理医が時間を大幅に節約できる。 今回は、WSI(Whole Slide Imaging

    顕微鏡画像向け、リアルタイム物体検出AIシステム 病理画像の自動解析に活用
    reboot_in
    reboot_in 2023/08/07
    “これらの結果により、最新のAIモデルを用いれば、ヒト腎臓画像における糸球体の自動検出が可能だと分かった。”
  • Bardのようなimage2textAIを構築して動画検索システムを作る

    Turing株式会社の自動運転MLチームでインターンをしている東大B4の中村です。 突然ですが、web検索のように簡単に、ストレージ内に保存されている、日時以外のメタ情報のない動画が検索出来るようになったら幸せになれると思いませんか? 例えば「赤信号で車が停止している」という検索クエリに対して、実際に赤信号で停止している動画が返ってきたら、簡単にそれを信号検知+停止のモデル学習に使えるようになります。 今回私が開発した動画検索システムはこれをAIの力を借りて実現しました。これにより、格段に動画検索の利便性が増し、より多様な動画を簡単に使用できるようになりました。今回はそのシステムについて紹介します。 ワンパンで動画を探せると嬉しい 課題 Turingでは、走行パートナーの方々と共に大量の走行データを収集してきました。車両にカメラ・データ収集キットを載せて、文字通り毎日朝から晩までデータを取

    Bardのようなimage2textAIを構築して動画検索システムを作る
    reboot_in
    reboot_in 2023/07/24
    “今回は以下のフローチャートを参考に、faiss-cpuとnmslibを使用してみます。”
  • Wonder Dynamics

    Wonder Studio An AI tool that automatically animates, lights and composes CG characters into a live-action scene

    Wonder Dynamics
  • 全日警、銃犯罪やレジ・両替機破壊などを早期発見するAIソリューションを提供開始 | Techable(テッカブル)

    近年ニュースで取り上げられている、銃を用いた犯罪や強盗事件やレジ・両替機を破壊するなどの犯罪行為。これに対し、犯罪被害拡大の防止と迅速な対応が喫緊の課題となっています。 そんな中、株式会社全日警(以下、全日警)は、銃犯罪やレジ・両替機を破壊する強盗の早期発見ソリューションの提供を開始しました。 AI画像解析「SCYLLA」全日警は、2022年7月に米国のScylla Technologies社とパートナー契約を締結したと発表。同社が開発するAI画像解析ソフトウェア「SCYLLA(スカイラ)」の取り扱いを開始しました。 「SCYLLA」には、危険物検知・侵入検知・人物検索・人流分析などを実行する複数のAIが搭載されています。そのため、安全管理はもとより、顧客満足度向上に寄与するデータを取得することも可能です。 また、既存の防犯カメラなどに導入可能。犯罪発生後の事実確認のために用いられがちな防

    全日警、銃犯罪やレジ・両替機破壊などを早期発見するAIソリューションを提供開始 | Techable(テッカブル)
    reboot_in
    reboot_in 2023/06/19
    “価格は、小型エッジサーバーが60万円~、ソフトウェアライセンスが年額6万円~となっています。”
  • Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能

    Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能 米Metaは6月16日(現地時間)、新たな音声生成AIモデル「Voicebox」を開発したと発表した。音声の編集、サンプリング、スタイルの設定などを行える。 音声とテキストを入力することで、以下のような音声を出力できる。 入力した声で入力したテキストを読み上げる音声クリップを作成する 録音した音声から犬の鳴き声やブザー音などのノイズを除去する 録音した音声の言い間違いを修正する 1つの言語のスピーチを同じ声のまま別の言語に変換する(英語の音声を仏語に、など) 1つのテキストを多様な声で読み上げる Metaは、Voiceboxで将来的にはメタバース内のバーチャルアシスタントやNPC(ノンプレイヤーキャラクター)が自然な声で話せるようになるとしている。また、自分の声のまま(来は話せない)外

    Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能
    reboot_in
    reboot_in 2023/06/18
    “自分の声のまま(本来は話せない)外国語で会話したり、映画の吹き替えも声優ではなく本人の声で行えるようになるという。”
  • 「画像生成AIが新しい創作ツールだという感覚」と「QRコード」

    Rootport💰🍹🍑 @rootport 画像生成AIで「LoRAを階層マージして自分の独自checkpointを作る」とか「ControlNetを駆使して実写映像をアニメ化する」とかやっているレベルの人なら、AIはPhotoshopやblenderに次ぐ「新しい創作ツール」だ……という感覚に納得できると思う。けれど、 2023-06-07 12:03:47 Rootport💰🍹🍑 @rootport そこまでAI沼に浸かっていない世間一般の認識は「馬に乗った宇宙飛行士と命じたら馬に乗った宇宙飛行士が描けた」という単純なtxt2imgの技術のレベルで止まっているんじゃないか。AIで画像を生成するのは、海辺で綺麗な流木を探すのと同じようなもの。創作活動とは呼べない……という感覚。 2023-06-07 12:06:02

    「画像生成AIが新しい創作ツールだという感覚」と「QRコード」
    reboot_in
    reboot_in 2023/06/09
    “よく考えてください。「画像生成AI」を「翻訳AI」や「ChatGPT」に置き換えて、「イラスト」を「テキスト」に置き換えたときに、その意見はそれでも説得力がありますか?”
  • すごい時代がきた 「おっさんの映像をリアルタイムで美女に変換する」AI技術が予想のはるか上行くクオリティー

    リアルタイムでおっさんから美女の映像を作り出すAI実験が、「す、すごすぎる!」「ライブでしたらだまされるレベル」と話題になっています。 す、すげーーー! 実験をしているのは、3DアーティストのHirokazu Yokoharaさん(@Yokohara_h)。Twitterに変換前後の映像を並べた動画を投稿しました。 その結果は驚くべきもの。動きが少々カクカクしているものの、Web会議を通じてであれば物と信じてしまいそうなレベルです。 動作はもちろん、表情も追従。さらに顔だけでなく体形まで女性らしくなっています。髪形は、黒いTシャツをかぶることでロングヘアに変換させました。Tシャツの柄などがときどき変わってしまうので、よく見ていればおかしいと思えますが、ボーッと見ていたらわからないでしょう。ましてや、中身がおっさんなんて絶対に思えない! 黒いTシャツをかぶり、ロングヘアーを再現させました

    すごい時代がきた 「おっさんの映像をリアルタイムで美女に変換する」AI技術が予想のはるか上行くクオリティー
    reboot_in
    reboot_in 2023/06/02
  • AI搭載の咽頭内視鏡システム「nodoca」、藤田医科大学総合診療プログラムに導入 | Techable(テッカブル)

    アイリス株式会社(以下・アイリス)は、AI搭載の咽頭(のど)内視鏡システム「nodoca」が、藤田医科大学総合診療プログラム(以下・藤田総診)に2023年5月19日より導入されたと発表しました。導入施設は豊田地域医療センターです。 総合診療においては、年齢や性別、症状を限定せず患者を診療することから、丁寧な身体診察が欠かせないといいます。nodocaの導入により、咽頭をクリアで鮮明に撮影・閲覧することで研修医や若手の医師の視診技術の向上が期待されています。 インフルエンザの診断に活用 nodocaは、咽頭の画像と問診情報などをAI解析し、インフルエンザに特徴的な所見などを検出することでインフルエンザの診断に用いるAI医療機器です。 nodocaのAIアルゴリズムは、のべ100以上の医療機関、10,000人以上の患者の協力のもと収集された、50万枚以上の咽頭画像データベースを元に開発されてい

    AI搭載の咽頭内視鏡システム「nodoca」、藤田医科大学総合診療プログラムに導入 | Techable(テッカブル)
    reboot_in
    reboot_in 2023/05/25
    “nodocaは、咽頭の画像と問診情報などをAI解析し、インフルエンザに特徴的な所見などを検出することでインフルエンザの診断に用いるAI医療機器です。”
  • The vector database to build knowledgeable AI | Pinecone

    Create an account and your first index in 30 seconds, then upload a few vector embeddings from any model… or a few billion. Perform low-latency vector search to retrieve relevant data for search, RAG, recommendation, detection, and other applications. Pinecone is serverless so you never have to worry about managing or scaling the database. from pinecone import Pinecone, ServerlessSpec # Create a s

    The vector database to build knowledgeable AI | Pinecone
    reboot_in
    reboot_in 2023/05/15
    ベクトルデータベース、ってなに
  • GitHub - w-okada/voice-changer: リアルタイムボイスチェンジャー Realtime Voice Changer

    v.1.5.3.18a Bugfix: FCPE v.1.5.3.18 (removed.) New Feature: FCPE Easy-VC (experimental) v.1.5.3.17b bugfix: clear setting improve file sanitizer chage: default input chunk size: 192. decided by this chart.(https://rentry.co/VoiceChangerGuide#gpu-chart-for-known-working-chunkextra) v.1.5.3.17a Bug Fixes: Server mode error RVC Model merger Misc Add RVC Sample Chihaya-Jinja (https://chihaya369.booth.

    GitHub - w-okada/voice-changer: リアルタイムボイスチェンジャー Realtime Voice Changer
  • Anthropicのテキスト生成AI「Claude」がOpenAIのGPT-4の約3万2000トークンの3倍近い10万トークンに対応して長文の入力も可能に

    ChatGPTなどの対話型AIは、高精度なテキストを生成できる一方、入力が可能な言語の最小単位である「トークン」には限度があります。OpenAIのGPT-4は約3万2000トークンまでの入力が可能ですが、AI研究スタートアップのAnthropicがテキスト生成AI「Claude」のトークンを9000から10万へ拡張したことを発表しました。 Anthropic | Introducing 100K Context Windows https://www.anthropic.com/index/100k-context-windows Anthropic’s latest model can take ‘The Great Gatsby’ as input | TechCrunch https://techcrunch.com/2023/05/11/anthropics-latest-mode

    Anthropicのテキスト生成AI「Claude」がOpenAIのGPT-4の約3万2000トークンの3倍近い10万トークンに対応して長文の入力も可能に
    reboot_in
    reboot_in 2023/05/14
    “新たなClaudeでは、数百ページにわたる資料を入力して分析する機能や、複数のドキュメントや本などから情報を取得して、「知識の統合」を必要とする質問に答えることができると説明しています。”
  • Google、開発中の新機能を使用できる「Labs」をリリース ~4種類のAIサービスを試せる/生成AIを使った「Google Workspace」の新機能や新しいノートアプリなどを提供

    Google、開発中の新機能を使用できる「Labs」をリリース ~4種類のAIサービスを試せる/生成AIを使った「Google Workspace」の新機能や新しいノートアプリなどを提供
  • 「ChatGPT」で模擬裁判のイベント 未来の司法考える 東京大学 | NHK

    未来の司法の形を考えるきっかけにしてほしいと、対話型AIChatGPT」を裁判官役とした、模擬裁判のイベントが東京大学で行われ、判決の行方に注目が集まりました。 このイベントは公正で中立な裁きが求められる裁判で、裁判官が「人間」ではなく「機械」だった場合、複雑な法律判断の可否や機械が人を裁く未来を受け入れられるのかといったことについて問題提起するために、東京大学の学生が中心となって企画し、会場の安田講堂には多くの人が傍聴に訪れました。 模擬裁判のシナリオは、元交際相手から嫌がらせを受けた女性が、現在の交際相手に相談したところ元の交際相手を殺害し、女性も殺害に共謀したとして殺人の罪に問われるという、架空の事件を想定し、検事や弁護士などは人間が務め、裁判官役を対話型のAIChatGPT」が担いました。 まず書記官役から「この法廷では裁判の正確性と迅速性を高めるために、人工知能を裁判官として

    「ChatGPT」で模擬裁判のイベント 未来の司法考える 東京大学 | NHK
  • 「ナントカGPT」の改称相次ぐ OpenAIのガイドライン公開で

    大規模言語モデル「GPT-4」やチャットAIChatGPT」の登場以後、「○○GPT」の名を冠するサービスが続々と登場している。しかし米OpenAIが4月24日(現地時間)、同社のAPIを利用する製品について「◯◯GPT」という表現を使わないよう求めるガイドラインを公開。これにより、各社が相次いでサービス名を変更している。 例えばAIチャットbotなどを提供するギブリー(東京都渋谷区)は、行政機関専用のChatGPT環境を提供するサービス「行政GPT」を「行政GAI Powered by GPT-4」に改称。採用支援を手掛けるグラム(東京都渋谷区)は「採用GPT」というサービスの名前を「採用GAI」に、AI開発企業のHEROZは「GPT-based Knowledge System」というサービス名を「HEROZ Knowledge System built with ChatGPT」に

    「ナントカGPT」の改称相次ぐ OpenAIのガイドライン公開で
    reboot_in
    reboot_in 2023/04/26
    “「Powered by GPT-4」や「Built with GPT-4」などと表現するよう求めている。OpenAIのモデルを指すときはGPT-3、GPT-4、ChatGPT、DALL・Eを使い、Ada、Babbage、Curie、Davinci、GPT-3.5-turboなどのエンジン名を避けるよう呼び掛けている。”