masadreamのブックマーク (18,442)

  • 生成AIを使って海外AIニュースの要約を社内Teamsに投稿してみた - AITC - ISID | AI トランスフォーメンションセンター コラム

    こんにちは、AIソリューショングループの太田です。 昨年から引き続き生成AIブームが止まらない中、自主的に進めていた取り組みを紹介します。それは海外AIニュースの要約を、社内で使用しているTemasのチャネルに投稿する取り組みです。 投稿自体はPower AutomateやAzure Function、Azure OpenAI Serviceなどを活用することで自動的に投稿しており、数ヶ月運用した結果を踏まえて最近アルゴリズムの改善をおこなったので、改めて方法とノウハウをまとめたいと思います。 はじめに アーキテクチャ紹介 Power Automate Azure Functions Bing Search Azure OpenAI Service(AOAILog Analytics 海外ニュース要約 APIの処理フロー 検索ワードの翻訳 Bing 検索 HTMLの読み込み ニュース記

    生成AIを使って海外AIニュースの要約を社内Teamsに投稿してみた - AITC - ISID | AI トランスフォーメンションセンター コラム
  • Model & API Providers Analysis | Artificial Analysis

    Independent analysis of AI models and hosting providersUnderstand the AI landscape and choose the best model and API provider for your use-case

    Model & API Providers Analysis | Artificial Analysis
    masadream
    masadream 2024/02/21
    LLMベンチマーク集
  • Hugging Face、あの人のボットを作れる「HuggingChat」をローンチ——OpenAIのカスタム版「GPTs」に対抗 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

    Image credit: HuggingF ace オープンソースの AI コードとフレームワークのための開発者用リポジトリで人気の(そして昨年「Woodstock of AI」を主催した)ニューヨークを拠点とするスタートアップ Hugging Face は2日、サードパーティのカスタマイズ可能な Hugging Chat Assistants のローンチを発表した。 この新しい無料の製品により、OpenAIChatGPT に代わるスタートアップのオープンソース「Hugging Chat」のユーザは、機能と目的が OpenAI のカスタム GPT ビルダーに似た、特定の機能を持つ独自のカスタマイズされた AI チャットボットを簡単に作成することができる。ただし、ChatGPT Plus 、Team 、Enterprise は有料サブスクリプションが必要だ(それぞれ月額20ドル、月額

    Hugging Face、あの人のボットを作れる「HuggingChat」をローンチ——OpenAIのカスタム版「GPTs」に対抗 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
  • 伊藤忠商事が始めた「味覚データ」事業の衝撃 売れる味を丸裸に

    「デジタル事業群戦略」を掲げる伊藤忠商事が提供するDX(デジタルトランスフォーメーション)支援サービスを象徴するのが、品や飲料品メーカーの商品開発を支援する「FOODATA(フーデータ)」(2021年7月提供開始)と、個人の味の嗜好に基づいて商品をリコメンドする「のパーソナライズド・レコメンデーション機能」(23年11月提供開始)である。複数のパートナー企業と連係しながら、感性データの中の味覚データを収集・分析して商品開発やリコメンドに生かすサービスだ。伊藤忠の狙いと具体的なサービスの内容を追った。 伊藤忠商事が「感性データ」、なかでも味覚に着目したのは2019年にまで遡る。情報・金融カンパニーの経営企画部内にあった新規事業開発室で、「リテールテックの1.5歩先プロジェクト」と題して次代のビジネスの種を検討していた際、候補の一つとして「味覚販促ソリューション」というものがあった。 20

    伊藤忠商事が始めた「味覚データ」事業の衝撃 売れる味を丸裸に
    masadream
    masadream 2024/02/21
    よさそう。
  • ブランドロゴチェックを画像処理で自動化する社内での取り組み

    こんにちは。DS統括部で画像処理エンジニアをしている上野です。LINEヤフー株式会社の企業ロゴやサービスロゴなどのブランドロゴには、ブランドガイドラインと呼ばれるロゴ使用時に守らなくてはならないルールが定められています。ロゴを使用する際にロゴが変形してしまったり、変色してしまったりすると問題となるため、細心の注意を払って使用しております。今まではロゴが使用されている画像を担当デザイナーがすべて目視確認でチェックすることで、ガイドラインを遵守してきました。ブランド価値を守るためにとても大切な作業です。これらの作業を画像処理で自動化できないかと考え、ブランドロゴチェックツールを作成しました。 ※載せている画像は、今回のブログ用に用意したテスト画像です。 この記事では、社内のデザイナーから寄せられた目視確認の作業に工数がかかってしまっているという課題を画像処理技術で解決した事例について、紹介し

    ブランドロゴチェックを画像処理で自動化する社内での取り組み
    masadream
    masadream 2024/02/20
    同じような業務を人力ゴリ押しでやっている会社は山ほどあると思うので、アプリ化したら売れるのでは?
  • GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能

    Googleがテキスト・画像・ムービーをまとめて処理できるマルチモーダルAI「Gemini」の次世代モデルとして「Gemini 1.5」を発表しました。処理できるトークン数の上限が100万まで上昇したほか、従来の1.0モデルと比べて少ない計算で高い品質の結果を提供できるとのことです。 Google Japan Blog: 次世代モデル、 Gemini 1.5 を発表 https://japan.googleblog.com/2024/02/gemini-15.html 従来モデルであるGemini 1.0は「GPT-4を超える性能のマルチモーダルAI」として2023年12月6日に登場しました。最上位モデルのGemini 1.0 Ultraを使用したハンズオンムービーではまるで人間かと思うような受け答えをしている様子が確認できます。 文字・音声・画像を同時に処理して人間以上に自然なやりとりが

    GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能
  • 「Copilot for Microsoft 365 ユーザー向け研修資料」を公開しました!

    はじめに セキュリティチームのぐっちーです。最近、個人的に Copilot for Microsoft 365 のエンドユーザー向け研修資料を作ったので、Webで公開しました。 Copilot for Microsoft 365 をこれから触る方の参考になれば幸いです。 また、まだ書ききれていない部分も多々あるので、日々メンテはしていきたいと思います。FBやこんな内容を盛り込んで欲しいという意見がありましたらご連絡ください! 資料

    「Copilot for Microsoft 365 ユーザー向け研修資料」を公開しました!
  • RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO

    はじめに 新規事業部 生成AIチーム 山です。 ChatGPTOpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

    RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
    masadream
    masadream 2024/02/20
    良記事。RAGの精度改善で考慮しないといけない観点が網羅的に検討されていると感じる。読み込んで参考にしたい。
  • UXだけでは足りない何か | ベイジのUIラボ

    UXについて色々と考えることがあり、少し言葉にまとめてみた。何が正しいという話ではないが、率直に感じていることである。 意図されたBad UX 車を運転する人なら経験したことがあると思うが、「近づかないと識別できない信号」というのがある。 この手の信号は、近付くまで青なのか赤なのか判別できない。そのため信号の近くになるまで、このまま進むべきか、ブレーキを踏むべきか、とドキドキさせられる。 先日までペーパードライバーだった私は、当初、スムーズな運転を妨げてストレスを感じさせるこの信号を、液晶の表示角度などの計算を誤った設置ミスだと思っていた。 しかしこれは、複雑な交差点などでの交通事故を防ぐために意図的に仕掛けられたもののようである。 いちドライバーとしては、けっして心地よい体験ではない。しかし、社会全体にとっては良い方向に向かうようデザインされた信号といえる。 このような「意図的にユーザー

    UXだけでは足りない何か | ベイジのUIラボ
    masadream
    masadream 2024/02/20
    「ユーザー体験を良くすることに意識を向けるあまり、事業や組織の課題をスルーしてしまう「UXトラップ」なるものもあるように思う」
  • AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します!/Azure RAG knowledge share

    2024/1/31に開催された【StudyCo×KAGコラボ】Azure・AWSでLLMアプリ開発レベルアップ!事例&ハンズオンで発表した資料です。 AzureでRAGによる社内文章検索をやってみてさまざまな試行錯誤を通して得たナレッジを共有します!

    AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します!/Azure RAG knowledge share
    masadream
    masadream 2024/02/20
    いいまとめ。「動くものが正義」JTCに非常になじまない価値観だがどうすれば意識改革できるのか…
  • 小さいLLMでも個別ニーズに対応、NTTは「アダプター技術」でカスタマイズ

    国産の大規模言語モデル(Large Language Model:LLM)の多くは、米OpenAI(オープンAI)の「GPT」をはじめとする海外勢と比べてパラメーター数が小さいのが特徴だ。ただしパラメーター数が小さいと、同じように学習した「大きいLLM」のように汎用的に言語を解釈することは難しい。一方で当然ながら、顧客企業の業務にきちんと役立つような、的確なフィードバックができるLLMでなければ採用してもらえない。 そこで国産の「小さいLLM」が採る戦略が、適用対象とする領域の絞り込みだ。領域を絞ったうえで、業界や業務内容ごとに「LLMをカスタマイズして提供する」(NTTサービスイノベーション総合研究所/人間情報研究所の宮崎昇主幹研究員)。NECNTT両社のLLMサービス戦略を解説する。 例えばNTTの「tsuzumi」は、適用対象の1つとしてメディカル領域に注目。商用提供前ながら、20

    小さいLLMでも個別ニーズに対応、NTTは「アダプター技術」でカスタマイズ
    masadream
    masadream 2024/02/20
    「NTTのアダプター技術は、一般にLoRA(Low-Rank Adaptation)と呼ばれる技術だ」
  • 高等学校情報科「情報Ⅱ」教員研修用教材(本編):文部科学省

    PDF形式のファイルを御覧いただく場合には、Adobe Acrobat Readerが必要な場合があります。 Adobe Acrobat Readerは開発元のWebページにて、無償でダウンロード可能です。

    高等学校情報科「情報Ⅱ」教員研修用教材(本編):文部科学省
    masadream
    masadream 2024/02/20
    これ本気で全国の高校で教えられ始めたら世の中のレガシーITおじさんは殲滅されるね。大人の学び直しのレベル基準として参考にするといいのかも
  • LLMに「自分自身との対戦」で能力を向上させる手法『Self-Play Fine-Tuning(SPIN)』 | AIDB

    参照論文情報 タイトル:Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models 著者:Zixiang Chen, Yihe Deng, Huizhuo Yuan, Kaixuan Ji, Quanquan Gu 所属:カリフォルニア大学 URL:https://doi.org/10.48550/arXiv.2401.01335 コード:https://github.com/uclaml/SPIN データセット:https://huggingface.co/collections/UCLA-AGI/datasets-spin-65c3624e98d4b589bbc76f3a モデル:https://huggingface.co/collections/UCLA-AGI/zephyr-7b-sf

    LLMに「自分自身との対戦」で能力を向上させる手法『Self-Play Fine-Tuning(SPIN)』 | AIDB
    masadream
    masadream 2024/02/20
    これが今後のLLMモデル学習の方向性なんだろうなあ。もう公開データはほぼほぼ学習し尽くしたのだろうし
  • GPT連携アプリ開発時の必須知識、RAGをゼロから解説する。概要&Pythonコード例

    こんにちは。わいけいです。 今回の記事では、生成AI界隈ではかなり浸透している RAG について改めて解説していきます。 「低予算で言語モデルを使ったアプリを開発したい」というときに真っ先に選択肢に上がるRAGですが、私自身もRAGを使ったアプリケーションの実装を業務の中で何度も行ってきました。 今回はその知見をシェア出来れば幸いです。 RAG(Retrieval-Augmented Generation)とは まず、 そもそもRAGとは何ぞや? というところから見ていきましょう。 RAG(Retrieval-Augmented Generation) は自然言語処理(NLP)と特に言語モデルの開発において使用される技術です。 この技術は、大規模な言語モデルが生成するテキストの品質と関連性を向上させるために、外部の情報源からの情報を取得(retrieval)して利用します。 要は、Chat

    GPT連携アプリ開発時の必須知識、RAGをゼロから解説する。概要&Pythonコード例
  • 生成AIが潜在的に抱える「モデル崩壊」問題が早くも顕在化し始めた

    研究者たちの多くは、「Grok(グロック)」のような現在のAI人工知能)ボットが直面している問題が、将来発生するであろうより大規模な問題の兆候を既に示していると心配している。それは「モデル崩壊」と呼ばれる現象だ。生成AIツールが作成したコンテンツが他のAIモデルの訓練に使われることで、他のAIモデルが吐き出すアウトプットの質がひたすら低下していくことを指す。 xAIが開発するLLM(大規模言語モデル)を活用するチャットボット「Grok」が、米OpenAI(オープンAI)のChatGPT(チャットGPT)の応答を“盗用”したとされる現象の裏には、「モデル崩壊」というさらに深刻な問題が潜んでいた(出所/Koshiro/stock.adobe.com) 米OpenAI(オープンAI)の「ChatGPT(チャットGPT)」が一般に公開されてから1年というもの、研究者や専門家は、生成AIツールを使

    生成AIが潜在的に抱える「モデル崩壊」問題が早くも顕在化し始めた
    masadream
    masadream 2024/02/20
    人間が書く文章だって間違いまくっているのにAIが生成した文章だけ排除すればよいとなるのは何故なのか。データ量の問題?正しさをAIに求めるのは無理なのでは?人間に求めるのも無理なのだし。
  • ベネッセとウルシステムズ他、生成AI活用を推進する一般社団法人「Generative AI Japan」を設立 | IoT NEWS

    2023年は「生成AI元年」と称され、多くの企業が生成AIの活用を推進してきたが、その社会実装には、価値創造とともに、公正性と安全性の構築が求められている。 国の規制やガイドライン整備が進められている一方で、企業や利用者からの議論や、政策提言、ルール作りも必要だとされている。 そこで、株式会社ベネッセコーポレーション(以下、ベネッセ)とウルシステムズ株式会社は共同で、一般社団法人Generative AI Japanを設立した。2024年の1月に発足され、先端企業や有識者を含む17名の理事に加え、代表理事として慶應義塾大学医学部の宮田裕章教授を迎えている。(トップ画参照) 団体の目的は、生成AI教育、キャリア、協業、共創、ルール作り、提言を進め、日全体の産業競争力を高めることだ。また、会員企業の募集も始めている。 加えて、利用者の実情に基づいたユースケースから業界標準を確立し、ベストプ

    ベネッセとウルシステムズ他、生成AI活用を推進する一般社団法人「Generative AI Japan」を設立 | IoT NEWS
  • 刀・森岡毅が明かす「勝ち筋のつくり方」 沖縄・ジャングリア編

    1996年神戸大学経営学部卒。プロクター・アンド・ギャンブル(P&G)を経て2010年、ユー・エス・ジェイに入社。17年にマーケティング会社・刀を設立。独自のノウハウ「森岡・刀メソッド」を武器に、様々な分野でプロジェクトを推進中。「日最強マーケター」の異名を取る ・2010(森岡氏入社)~16年 USJ(大阪市) 経営の危機に瀕していたパークを僅か数年でV字回復させ、入場者数世界第4位のテーマパークにまで押し上げた ・2017年~ 西武園ゆうえんち(埼玉県所沢市) 70周年を迎える施設の「古さ」を、昭和ノスタルジーがもたらす「幸福感」という価値に転換。21年の新装開業を手掛け、V字回復に導いた ・2018~23年10月 ネスタリゾート神戸(兵庫県三木市) 経営破綻した年金保養施設の再生を支援。20年に黒字化を達成。22年に経営権を共同取得。23年10月、サムティに事業承継した ・2022

    刀・森岡毅が明かす「勝ち筋のつくり方」 沖縄・ジャングリア編
    masadream
    masadream 2024/02/20
    森岡さんは本当にテーマパークで頑張りたかったんだなあ。こんな偉大な人を囲っておけないUSJって…
  • 【AI動画生成】Sora 要素技術解説

    もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと

    【AI動画生成】Sora 要素技術解説
    masadream
    masadream 2024/02/20
    良記事。「時空潜在パッチにノイズをかけ、Diffusion Transofomerで一気に学習することで、画像を生成するように一括で動画を生成…ここが一番既存の動画生成モデルと異なる部分だと思います」
  • OpenAIが最長1分の動画生成AI「Sora」発表、「AGI達成へのマイルストーン」

    OpenAI(オープンAI)は米国時間2024年2月15日、テキストの指示を基に最長1分の動画を出力できる生成AI人工知能)「Sora」を発表した。一般公開せず、デザイナーや映画の制作者などだけにアクセスを許可。当面は専門家からモデルのフィードバックを受け付ける。同社は「AGI(汎用人工知能)を達成するための重要なマイルストーンになると考えている」とした。 Soraはテキストを動画に変換するAIモデルで、ユーザーのプロンプトを理解するだけでなく、「その指示が物理世界にどのように存在するかも理解している」(オープンAI)。高度な動画生成能力に加えて、最長1分という尺の長さも特徴。米Runway(ランウェイ)の動画生成AI「Gen2」は最長16秒、米Meta(メタ)の「Emu Video」は最長4秒にとどまる。 Soraが生成した動画の例。プロンプトは以下の通り。「暖かく光るネオンとアニメ

    OpenAIが最長1分の動画生成AI「Sora」発表、「AGI達成へのマイルストーン」
  • Sora: Creating video from text

    Sora Creating video from text Sora is an AI model that can create realistic and imaginative scenes from text instructions. Read technical report We’re teaching AI to understand and simulate the physical world in motion, with the goal of training models that help people solve problems that require real-world interaction. Introducing Sora, our text-to-video model. Sora can generate videos up to a mi

    Sora: Creating video from text
    masadream
    masadream 2024/02/20
    「Sora is a diffusion model...Similar to GPT models, Sora uses a transformer architecture...Sora builds on past research in DALL·E and GPT models. It uses the recaptioning technique from DALL·E 3,」Diffusionモデルなのか…