並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 3401件

新着順 人気順

検索エンジンの検索結果321 - 360 件 / 3401件

  • 自作AI時代に乗り遅れるな! #ChatGPT で自分専用のAIを10分で作る方法! #MyGPTs(神田敏晶) - エキスパート - Yahoo!ニュース

    KNNポール神田です! OpenAIの最強のアップデートが登場した。それが『MyGPTs』だ。プログラムがまったくできない人でも、自分専用のカスタマイズした『ChatGPT』がノンコードでプログラムを書かなくても作成し、『GPTstore』で公開できるというビジネスモデル付きでデビューした! ■まずは30日間だけでも有料に!ChatGPTを筆者は毎月有料にしては一ヶ月間で契約を終えるようにサブスクリプションを管理している。そう、この『MyGPTs』は『ChatGPT Plus』ユーザーだけしか利用できないからだ。 ■『MyGPTs』が表示されていたら、『GPTs』が利用できる 出典:ChatGPT 筆者加工有料契約している『ChatGPT』をPCブラウザで開くと、左下の名前のアカウントをクリックすると、『MyGPTs』が表示されていたら、利用できるようになる。まだ、表示されていない人は毎日

      自作AI時代に乗り遅れるな! #ChatGPT で自分専用のAIを10分で作る方法! #MyGPTs(神田敏晶) - エキスパート - Yahoo!ニュース
    • 日本語に対応した Embedding Model のベクトル検索での精度比較|Tatsuya Shirakawa

      こんにちは、nouu の白川です。 OpenAI Dev Day、よいリリースがたくさんありましたね!GPT-4 Turbo が出てくれたお陰で、production利用がだいぶ捗りそうです。一方で、Text Embedding に関しては全くリリースはありませんでした。 自分は Text Embedding のモデルとしてちょっと昔は sonoisa/sentence-bert-base-ja-mean-tokens-v2 をよく使っていました。最近は環境を他の人と共有しやすくて楽なので OpenAI の text-embedding-ada-002 をよく使っているのですが、下記のページを見ると、OpenAI を超えるようなモデルがいくつもあって、検証せねばという気分になったので気になるモデルをいくつかピックアップして検証してみました。 データセットやモデル、評価指標などまだまだ拡充が

        日本語に対応した Embedding Model のベクトル検索での精度比較|Tatsuya Shirakawa
      • ChatGPT頼みのプログラムど素人が一日半でPython経由でOpenAI API使えるようになった - 関内関外日記

        承前。 goldhead.hatenablog.com おれは761,000文字ある英文の小説を、AIに翻訳させたいと思った。思って、やり方をChatGPT3.5に聞いて、Pythonがいいという。はて、Python、なんだかわからんが、そのインストールから始めたのが昨日の朝。 とにかく、テキストファイルにある英文をChatGPTにハードボイルド風の日本語に翻訳させたい。ただ、一度に送信できるテキストの量(トークン)は限られているので、自動的に限度内の送信を繰り返して、その返信を受取る。受取ったテキストを結合させて一つの日本語テキストファイルにする。それでおれはクヌート・ハムスンの『土の恵み』を読める。これである。 Growth of the Soil by Knut Hamsun | Project Gutenberg で、上の記事にあるように、行き詰まったのが「AttributeErr

          ChatGPT頼みのプログラムど素人が一日半でPython経由でOpenAI API使えるようになった - 関内関外日記
        • Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンター コラム

          こんにちは、AI製品開発グループのファイサルです。 この記事では、Know Narrator Searchで使用されている文章参照手法、Retrieval-Augmented Generation(RAG)の精度向上方法について紹介します。 はじめに ChatGPTを始めとした大規模言語モデル(LLM)の登場により、AI業界、特に自然言語処理分野で多くの素晴らしい応用先が提案されるようになりました。 LLMは素晴らしい技術であることは間違いないですが、同時に幻覚(Hallucination)という問題を抱えています。 このHallucinationという問題は、LLMが事実と異なる情報をあたかも真実であるように回答するというもので、LLMの発表当初から指摘されていました。 この問題を解決するために、さまざまな手法が存在しますが、よく用いられるのが「Retrieval-Augmented G

            Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンター コラム
          • GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO

            はじめに OpenAIのDevDayで発表されたText2SpeechのAPIを使ってみたいと思います。Text2Speechとは簡単にいうとテキストの読み上げ機能です。 日本語を読ませる場合、まだ少し英語訛りですが、なかなか人間っぽい発音を行います。 今回はこのText2SpeechのAPIを使って遊んでみたいと思います。 なにを作るのか? 先程記載したように、Text2Speechでは発話を行うことができます。 この特徴とGPTの会話ができる特性を組み合わせれば、会話っぽいことができるのではないかと思い実装してみました。 今回は試験的に実装を行うため、GPTには「動物博士」としてのロールを与えて動物の雑学を教えてもらいました。 完成形は以下のような動画になります。Text2Speechを利用しているため音声ONの状態での閲覧を推奨します。 発音が英語話者っぽくなっていることや漢字を稀に

              GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO
            • 顔を PostgreSQL に登録して SQL で似ている顔(同一人物)を探す - Qiita

              はじめに 前回の記事では、画像の dHash をビット配列としてデータベース PostgreSQL に登録し、 SQL で類似画像を取得しました また、以前の記事で画像内の顔特徴量をベクトルデータベース Pinecone に登録し、似ている顔を取得しました さらに、 PostgreSQL は拡張機能 pgvector によってベクトル型を扱うことができます というわけで、これらの組み合わせを Livebook で実装します 対象となる画像から evision で顔を検出し、顔の特徴量を取得する 顔の特徴量をベクトルとして PostgreSQL に登録する SQL で似ている顔の組み合わせを取得する Livebook と PostgreSQL をコンテナで立ち上げる手順については以下の記事を参考にしてください データベース操作には Ecto を使用します Livebook 上での Ecto

                顔を PostgreSQL に登録して SQL で似ている顔(同一人物)を探す - Qiita
              • 名古屋大学、明治19年から平成29年までの法令を全文検索できる「法令データベース」を公開

                2023年11月2日、名古屋大学大学院法学研究科の佐野智也講師らの研究グループが、明治19(1886)年から平成29(2017)年までに公布された法律と勅令を全文検索できるデータベース「法令データベース」を公開したと発表しました。 プレスリリースによると、同データベースでは、近代法体系が定められた明治19年からe-Gov法令検索の運用が開始された平成29年までに公布された法律と勅令を対象とした、全文検索や法令本文の閲覧、関連情報の確認などが可能です。 現在有効な法令を対象とするe-Gov法令検索では検索できない過去の法令データを提供するものであり、これを補完する意味を持つとしています。 News過去の一覧(日本研究のための歴史情報) https://jahis.law.nagoya-u.ac.jp/news ※2023年11月2日付けで「法令データベースの公開にあたり、名古屋大学からプレス

                  名古屋大学、明治19年から平成29年までの法令を全文検索できる「法令データベース」を公開
                • (続)ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ

                  概要 背景・目的 関連研究 提案手法 実験 アルゴリズムの説明 順位相関の確認 定量評価 定量評価の内訳 定性評価 おわりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 ファッションアイテムを特徴づけるための情報として、画像とテキストがある。これらは異なる情報を含んでいると考えられる。 類似のファッションアイテムを検索する場面で、画像とテキストの情報を両方活用することで、検索の精度を向上させることができると推測される。 類似のファッションアイテムを検索するタスクで、両方の情報を活用した提案手法の性能を評価し、片方の情報だけを活用するよりも、大幅に性能が改善することを確認した。 背景・目的 この記事は以下の記事の続編です。 tech.drobe.co.jp 以前の記事で、私たちはプロのスタイリストが作成した評価データセットを用いて、複数のアルゴリズムを類似商品検

                    (続)ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
                  • プロンプト共有サイト

                    プロンプト共有サイト

                      プロンプト共有サイト
                    • ElasticsearchとXGBoostを組み合わせた検索ランキング作成と評価

                      最近検索周りで「機械学習による検索ランキング改善ガイド」という本が出版されて気になって読んでみたので、それを読んで勉強しつつ手を動かしてみてわかったことや感想を紹介してみようと思います。 この記事に書くこと&書かないこと この記事では以下のようなことに焦点を当てて書きます。 ElasticsearchとXGBoostを組み合わせたときの性能・負荷変化の実験 Elasticsearch上での特徴量エンジニアリングの体験 逆に、実験の下準備といったことについては最低限しか書かないので具体的なElasticsearchの使い方等については他の記事もしくは書籍を参照してください。 実験を行う検索システムの構成 書籍で使われているコードをベースとして色々と自分で実験を行いました。 実験を通して知りたかったこと 自分の手を動かして実験することで知りたかったことをまとめると以下のようになります。 Ela

                        ElasticsearchとXGBoostを組み合わせた検索ランキング作成と評価
                      • 法令データベース

                        日本研究のための歴史情報 法令データベース 本データベースについて 検索 全文 法令名のみ 法律 勅令 全て選択 全て解除 詳細検索 公布日 日付指定 範囲指定 年 月 日 〜 年 月 日 法令番号 年 第 号 検索 リセット

                        • 過去の法令を全文検索できるデータベースを公開 ~法制度の移り変わりを調査する出発点に~

                          国立大学法人東海国立大学機構 名古屋大学大学院法学研究科の佐野 智也 講師、増田 知子 特任教授、同大学院情報学研究科の外山 勝彦 教授、同大学数理・データ科学教育研究センターの駒水 孝裕 准教授らの研究グループは、明治 19年から平成 29年(1886~2017)までに公布された法律と勅令を全文検索できるデータベースを作成・公開しました。このデータベースは、日本政府の、現在有効な法令データを提供する「e-Gov法令検索」では検索できない過去の法令データを提供するものであり、「e-Gov法令検索」を補完する意味を持ちます。 これまで多くの法学研究において法令や判例情報の調査収集にデータベースを利用する際は、個別の事件処理等を意識した限定的利用が主でした。それを越えて、大規模データを使って政策や法令を俯瞰し、経時的に解析しようという研究は、国内的にも国際的にもほとんど例がありません。 今回の

                            過去の法令を全文検索できるデータベースを公開 ~法制度の移り変わりを調査する出発点に~
                          • 情報検索・検索技術 Advent Calendar 2023 - Adventar

                            検索に関わることならなんでもOKです! 検索エンジンのアルゴリズムや実装 検索システムの構築・運用・評価 形態素解析・分かち書きなどの自然言語処理 (NLP) 技術 検索に関する UI/UX 地理検索、画像検索、情報推薦など Lucene, Elasticsearch, Solr など検索エンジンOSS 今年も作成してみました! 2021年のアドベントカレンダー 2022年のアドベントカレンダー

                              情報検索・検索技術 Advent Calendar 2023 - Adventar
                            • 大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る

                              生成AIを用いた開発者向けの検索エンジン「Phind」が、コーディング能力でOpenAIのGPT-4を上回ったことが明らかになりました。 Phind - AI Search Engine and Pair Programmer https://www.phind.com/blog/phind-model-beats-gpt4-fast Our GPT-4-beating coding model is now the default on https://t.co/epkoFW8Ozz. It's also 5x faster than GPT-4. Learn more in our blog post: https://t.co/PrOFETEbvd— Phind (@phindsearch) PhindはもともとHello Cognition(beta.sayhello.so)として

                                大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る
                              • 【アカウントに基づく情報の表示設定が原因】GoogleにFANZAやDLSiteやDLチャンネルが検索に全く出てこない問題が発生→こうすれば解決する!

                                猫乃またたび@新刊販売中 @nknmttb_nitijo 先程のメロンやとら、コミフロがGoogle検索でTOPに出てこないというTweetだけど、FANZAも同様にプレスリリースやサポートページなど関連記事ばかりがあがって肝心なサイトのTOPは検索に出てこないですね これはエロ関係を扱ってるサイトが”村八分”処理されたか??(DLsiteはTOPページ出てきた) pic.twitter.com/RxVnCTsiat 2023-10-31 08:52:35

                                  【アカウントに基づく情報の表示設定が原因】GoogleにFANZAやDLSiteやDLチャンネルが検索に全く出てこない問題が発生→こうすれば解決する!
                                • 脱毛サロン・クリニックの集客で効果的な方法と4つのポイント【予約数15倍UP】 -webma-

                                  「新規のお客さんがなかなか集まらない」 「本当に今の集客方法を続けていて良いのだろうか」 脱毛サロンの運営には集客力が欠かせません。 2023年に入っての脱毛サロンの倒産件数はすでに過去最高の9件を記録しており、上記のように集客への不安を抱えるオーナーさんも増えています。 あなたの脱毛サロン・脱毛クリニックでは新規顧客を増やせているでしょうか? 「今は問題なく集客できている」というサロン・クリニックであっても、先回りして新たな手を打っていかなければ、いずれ集客数が頭打ちになる恐れがあります。 とはいえ、やみくもに広告費を増やしたり、手当たり次第に施策を打っても、かえって予算を無駄にしてしまうでしょう。 そこでこの記事では、脱毛業界において効果的な集客施策について解説します。 弊社エクスコアが集客支援をしている脱毛クリニックでは、Webマーケティングへの取り組みにより、1年間で予約数が15倍

                                    脱毛サロン・クリニックの集客で効果的な方法と4つのポイント【予約数15倍UP】 -webma-
                                  • GmailもGoogleドライブも連携で高速化! Google Bardの新機能を試したら期待しかなかった #TrendBuzz  | ライフハッカー・ジャパン

                                    物理カード「PassCard」を使えば、複雑なパスワードを何パターン作っても、忘れることなく安全に管理できる!

                                      GmailもGoogleドライブも連携で高速化! Google Bardの新機能を試したら期待しかなかった #TrendBuzz  | ライフハッカー・ジャパン
                                    • Google検索設定に「アカウントに基づく情報」が追加された件のまとめ - SEMリサーチ

                                      久しぶりに「これは面倒だな」というGoogle検索の仕様変更に遭遇したので、メモ。DMMという事業とサイトの性格上、正直、コアアップデートより面倒です。 日本のSEO担当者で実務レベルでこの情報を本当に必要とする人が果たしてどれだけいるのか不明ですが(この変更の直撃を受けているサイトは限定されるはず)、その少数の方の参考になれば幸いです。 Google検索設定に「アカウントに基づく情報」が出現 今回の検索仕様変更による影響 原因は「アカウントに基づく情報」 アカウントに基づく情報の挙動 Googleの「子どもから大人まで安心して利用できるインターネット」への取り組み 追記(11/1) 一般サイトも影響を受けている模様 Google検索設定に「アカウントに基づく情報」が出現 2023年10月31日に、Google検索のその他の設定の項目に、コンテンツという見出しとともに「アカウントに基づく情

                                        Google検索設定に「アカウントに基づく情報」が追加された件のまとめ - SEMリサーチ
                                      • 国立国会図書館の書誌データ | 図書館総合展

                                        変わります!書誌データ提供サービス 2024年1月、新しい「国立国会図書館サーチ」の開始に伴い、書誌データ提供サービスを拡充します。 また、一部のサービスを終了、変更します。 1.新サービス「全国書誌データ検索」 2024年1月開始!全国書誌データ検索 (PDF:465KB) 国立国会図書館の会場展示ブースでパネル展示を行いました。 全国書誌データに対象を絞って検索してダウンロードできる「全国書誌データ検索」など、特定の範囲の書誌データを対象とした検索画面を新設する予定です。 2.その他の変更点 2024年1月 書誌データ提供サービスの変更点 (PDF:465KB) 書誌データダウンロード機能やAPI機能などに変更が生じる予定です。 また、一部のRSSの提供を終了します。 書誌データ提供サービスの拡充点・変更点は、国立国会図書館ホームページでも随時お知らせしています。 全国書誌データ等の提

                                          国立国会図書館の書誌データ | 図書館総合展
                                        • Googleは4兆円を支払いあらゆるプラットフォームのデフォルト検索エンジンになっていたことが明らかに

                                          Googleは検索エンジンやブラウザ、広告出稿サービスなどインターネットに関するさまざまなサービスを展開しています。そんなGoogleが「検索エンジン市場を違法に独占している」として、アメリカ司法省から訴えられているのですが、この訴訟の中でGoogleは2021年にブラウザのデフォルトの検索エンジンになるために263億ドル(約3兆9400億円)もの資金を投じていたことが明らかになりました。 Google paid $26.3 billion in 2021 to be the default search for Apple, Firefox, and more - The Verge https://www.theverge.com/2023/10/27/23934961/google-antitrust-trial-defaults-search-deal-26-3-billion イ

                                            Googleは4兆円を支払いあらゆるプラットフォームのデフォルト検索エンジンになっていたことが明らかに
                                          • RAGを使った生成AIボットでユーザの意図を理解して対話するためのフローを考えてみた | DevelopersIO

                                            はじめに 新規事業部統括部インターンの高橋です。ここ最近はすさまじいスピードで様々な生成AIがリリースされていますね。そのなかでもChatGPTをはじめとするLLMの活用には注目が集まっており、多くの方が使用していると思います。 LLM(Large Language Model)とは大量のテキストデータを学習した言語モデルのことで、一般的な事柄であれば私たちの質問に対して十分納得感のある回答を返してくれます。しかし、LLMが学習したデータに含まれない事柄については正しく回答することができません。 この問題を解決する方法としてRAG(Retrieval Augmented Generation)という手法が用いられます。これは、LLMに外部の情報源(ここでは社内ドキュメントなど)を与えることで、それを参照して回答を生成してもらおうという手法です。ユーザは事実に基づく情報をベースにした回答を得

                                              RAGを使った生成AIボットでユーザの意図を理解して対話するためのフローを考えてみた | DevelopersIO
                                            • Google検索のコアアップデートによる影響とサイト閉鎖の検討について

                                              '); var TaglistRoadKotsu = document.getElementById('Tag_RoadKotsu'); var TagsRoadOther = TaglistRoadKotsu.getElementsByTagName('abbr'); var TagsRoadKanren = TaglistRoadKotsu.getElementsByTagName('b'); //var TagsRoadTest = TaglistRoadKotsu.getElementsByTagName('blink'); var TagsBus0 = TaglistRoadKotsu.getElementsByTagName('dd'); var TagsBus1 = TaglistRoadKotsu.getElementsByTagName('del'); var TagsB

                                                Google検索のコアアップデートによる影響とサイト閉鎖の検討について
                                              • Slack Botによるヘルプページの情報参照:LLMを組み合わせたRAGの実装

                                                はじめに 株式会社スマートショッピングで SRE をしているbiosugar0です。 先日、2023 年 10 月 23 日に行われた Amazon Bedrock Prototyping Camp というイベントに参加してきました。 そこでは Bedrock の紹介から始まり、Claude のハンズオン、実際にプロダクト反映を目指したプロトタイピングを行うという内容でした。 今回はその中で検証、実装した社内用の Slack bot に弊社ヘルプページを参照させる事例を紹介します。 Retrieval Augmented Generation (RAG) Retrieval Augmented Generation (RAG)は、LLM を用いた処理において、外部のデータベースや文書と連携してより精度の高い回答を生成するためのテクニックです。 GPT-4 のような LLM は、学習に使用さ

                                                  Slack Botによるヘルプページの情報参照:LLMを組み合わせたRAGの実装
                                                • Google、画像検索に“初出はいつ?”など信頼性チェック機能

                                                    Google、画像検索に“初出はいつ?”など信頼性チェック機能
                                                  • Google、検索結果の画像の出自を確認する「この画像について」提供開始

                                                    米Googleは10月25日(現地時間)、検索結果の画像の情報を確認できる「この画像について」機能を、まずは英語版で提供開始したと発表した。昨年4月に発表した「この結果について」の画像版だ。 検索結果の画像右上に表示される縦[…]をタップすると表示されるメニューに「About this image」という項目があり、これをタップすることで「この結果について」と同様に、画像が初めてインデックスに登録された時期や、複数のWebサイトに掲載されている場合は、そのWebサイトの一覧が表示されるようだ(本稿執筆現在、Google検索を英語版にしても筆者の環境ではまだ使えなかった)。 関連記事 Google、AI検索「SGE」に画像生成と文書下書き機能を追加 GoogleはGoogle検索の生成AI機能テスト「SGE」に、画像生成と文書下書きの2つの機能を追加した。画像生成は同社のImagenを採用し

                                                      Google、検索結果の画像の出自を確認する「この画像について」提供開始
                                                    • AIの力を借りて魅力的なブログタイトルを作ろう! #SNS #ブログ - 週刊はてなブログ

                                                      「良いタイトル」について解説いただきましたはてなブログでは「記事に表示される記事タイトル(大見出し)」「検索エンジン向けタイトル(title要素)」「SNS向けタイトル(og:title)」について、それぞれ設定できます。さらに本日、AIを用いて自動でそれぞれのタイトルを提案する機能「AIタイトルアシスト」をクローズドβとしてリリースしました 。 ただ、この機能でAIが提示したタイトルの候補からどれを選ぶべきか、また、提案内容からどのように編集するか、迷ってしまうかもしれません。また、AIに頼らず自分でタイトルを考えたいという方もいらっしゃるでしょう。 今回、はてなブログのSEOをサポートしていただいているSEO専門家の辻正浩さんに「タイトルの重要性」と「ブログのタイトル付けのコツ」について寄稿いただきました。「記事が読まれるのはうれしいけど、タイトルをいちいち考えるのは面倒」という方や、

                                                        AIの力を借りて魅力的なブログタイトルを作ろう! #SNS #ブログ - 週刊はてなブログ
                                                      • 「EverythingToolbar」+「Quick Look」で爆速ファイル検索→プレビュー環境を構築可能に/ファイルを検索し、結果から選び、スペースキーを叩くだけ

                                                          「EverythingToolbar」+「Quick Look」で爆速ファイル検索→プレビュー環境を構築可能に/ファイルを検索し、結果から選び、スペースキーを叩くだけ
                                                        • sayhi2.ai - 最新AIツールまとめサイト

                                                          様々なLLM, 画像生成AIを一箇所で使えることが魅力。新モデル発表への対応も非常に迅速で、Claude 3も既に使用できる。 無料で毎日100クレジットが発行され、例えばClaude 3 Sonnetであれば、1回5クレジットなので...

                                                            sayhi2.ai - 最新AIツールまとめサイト
                                                          • (令和5年10月23日)Google LLCらによる独占禁止法違反被疑行為に関する審査の開始及び第三者からの情報・意見の募集について | 公正取引委員会

                                                            ホーム >報道発表・広報活動 >報道発表資料 >最近の報道発表資料(令和5年) >10月 > (令和5年10月23日)Google LLCらによる独占禁止法違反被疑行為に関する審査の開始及び第三者からの情報・意見の募集について 令和5年10月23日 公正取引委員会 公正取引委員会は、Google LLC(法人番号 3700150072195)らによる独占禁止法違反被疑行為について、審査を開始し、また、後記のとおり第三者からの情報・意見を受け付けることとしました。 本件情報・意見の募集は、当委員会が令和4年6月に公表した「デジタル化等社会経済の変化に対応した競争政策の積極的な推進に向けて ― アドボカシーとエンフォースメントの連携・強化 ― 」(別紙参照)に基づき、個別事件の審査の初期段階において、初めて実施するものです。 なお、当委員会が、本件審査を開始したこと及び第三者からの情報・意見の

                                                            • Googleを独占禁止法違反で審査 公正取引委員会、検索寡占解明へ - 日本経済新聞

                                                              スマートフォン端末の初期設定でスマホメーカーに対し、自社の検索サービスを不当に優遇させるなどした疑いがあったとして、公正取引委員会は23日、米グーグルに対して独占禁止法違反の疑いで審査を開始したと発表した。あわせて第三者からの意見募集も始めた。同社が圧倒的なシェアを持つ検索サービスなどを巡っては欧米当局が規制を強化している。海外と歩調を合わせ、日本市場でも各社間の競争が阻害されていないか実態解

                                                                Googleを独占禁止法違反で審査 公正取引委員会、検索寡占解明へ - 日本経済新聞
                                                              • RAGを使ってLLMでも最新情報や企業内情報にも対応する | ネットワンシステムズ

                                                                LLMに新たな知識を習得させる方法は3種類あります。LLM全体の再学習、LLM一部の再学習、Promptに情報を埋め込むになります。今回はPromptに情報を埋め込む、RAGについて解説します。 ライター:荒牧 大樹 2007年ネットワンシステムズ入社し、コラボレーション・クラウド製品の担当を経て現在はAI・データ分析製品と技術の推進に従事。最近では次世代の計算環境であるGPU・FPGA・量子コンピュータに注目している。 【更新日】2023/11/8 はじめに Chat-GPTに代表される、LLMに最新の情報やクローズド情報を返してほしい場合に、取りうる手段が3種類あります。 LLM全体の再学習 新規データを加えたデータセットでLLMをゼロから再学習します。コストは膨大となります。 LLMの一部の再学習 Fine Tuningと呼ばれる手法で、LLMの一部を新規データで再学習します。1.の

                                                                  RAGを使ってLLMでも最新情報や企業内情報にも対応する | ネットワンシステムズ
                                                                • 「普通レベルではもう無理です」XはTwitterとは完全に別物で、イラストが拡散&表示されないし検索ガタガタで絵師に優しくない仕様になっている?

                                                                  エンペ @empe0317 XはTwitterとは完全に別物であり異常なレベルで絵師に優しくない仕様になってます。拡散もされないし表示もされない、簡単にバンされるし検索機能もガタガタ。今の仕様で沢山いいねを貰える神絵師は元のレベルが高いか神絵師同士のコミュニティが強いかの二択です。普通レベルではもう無理です。 2023-10-19 13:39:42

                                                                    「普通レベルではもう無理です」XはTwitterとは完全に別物で、イラストが拡散&表示されないし検索ガタガタで絵師に優しくない仕様になっている?
                                                                  • 都道府県 一覧 | 『日本歴史地名大系』地名項目データセット

                                                                    地名項目の位置情報(緯度経度)の推定については、精度を改善する余地が大きいため、今後も各種資料を精査しながら精度を向上させていきます。現状では、地図上のマーカーの位置が最適でない場合もあるかと思いますが、今後さまざまな精度向上の取り組みを進めていく予定です。 都道府県 一覧 合計 80502 件 検索 歴史的地名/現代地名による統合検索では、現代および歴史的な市区町村名や現代の町丁・字名による検索が可能です。 地名(の一部)を入力: 概要 『日本歴史地名大系』地名項目データセットとは、ジャパンナレッジ版『日本歴史地名大系』(平凡社)の中から、行政地名に関連する地名項目をまとめたデータセットです。2023年11月現在、地名項目=80,502件を提供しています。 出典 『日本歴史地名大系』地名項目データセット

                                                                      都道府県 一覧 | 『日本歴史地名大系』地名項目データセット
                                                                    • kaggle LLMコンペ 上位解法まとめ

                                                                      はじめに 科学分野の5択問題を解くLLMの精度を競うKaggle - LLM Science Exam というkaggleコンペが2023/10/11まで開催されていました。 コンペ終了後に公開された上位チームの解法からたくさん学びがあったので、備忘録も兼ねてまとめていきたいと思います。 コンペ概要 問題文(prompt)とA~Eの選択肢(option)が与えられ、それを解くモデルの精度を競うコンペでした。 テストデータはSTEM分野のWikipedia記事からGPT3.5に作成させたことがDataタブで明言されていました。 上位チーム解法まとめ 1. Approach 全てのチームが、問題の生成元となった記事をwikiテキストデータセットから検索(Retrieval)し、関連するテキスト(context)もモデルに入力するRAGと呼ばれるアプローチを採用していました。 RAGを行わないと

                                                                        kaggle LLMコンペ 上位解法まとめ
                                                                      • Spotifyのプロダクト戦略をUIの変化から読み解く|鈴木慎吾 / TSUMIKI INC.

                                                                        Spotifyのタブバー、いままで5つだったタブが3つになってた。消えたのはBrowseとRadio。BrowseはSearchに統合され、Radioの機能はたぶん消えた。こういうアップデートって勇気がいるが、結果使いやすくなったと思う。 pic.twitter.com/vf1ncj0qjh — 鈴木慎吾 / TSUMIKI INC. (@shingo2000) October 19, 2018 長く使われ続けているサービスでは、新しい機能がどんどん追加されていきます。新しいユーザーを増やしたり、現在のユーザーを引きつけ続けることが主な理由で、Spotifyにも様々な機能が追加されています。それにも関わらず主要なナビゲーションのタブを減らすのは勇気のいる選択だと思いました。プロダクト開発に関わっていると実感しますが、何かを付け加えることよりも何かを削ることのほうがずっと難しいのです。このU

                                                                          Spotifyのプロダクト戦略をUIの変化から読み解く|鈴木慎吾 / TSUMIKI INC.
                                                                        • 社内の知らないことを探すパターン - Konifar's ZATSU

                                                                          社で何かキャッチアップするのがめちゃくちゃ上手い人がいる。 情報がまとまっているか、参照しやすいかといった社の状況にもよるのだけれど、上手い人には一定のパターンがある気がしていて、そのへんを雑にまとめておきたい。 検索対象の選択肢を持ち、最速を意識している Slackのやりとりを検索する、GitHubのIssueやPRを探す、Google Driveを検索するといった感じでまずシュッと探してみる癖が染み付いている どこに情報がまとまっているかを見極め、選択肢のうちどこからあたるかのが最速かを素早く判断している 検索条件を駆使している ワードでの検索だけではなく、日時の範囲指定、投稿者・メンション先といったフィルタリング、除外設定などを駆使している インデックスとなる人や聞く場所を作っている 人に聞いた方が早いことも多いので、どこで誰に聞けば辿れるかインデックスを作っている。人や場所がない場

                                                                            社内の知らないことを探すパターン - Konifar's ZATSU
                                                                          • ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ

                                                                            概要 背景・目的 実験 実験の概要 定量評価 定性評価 おわりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 類似商品検索の基盤となる複数の特徴抽出アルゴリズムについて、DROBEの保有するデータで評価した 定量評価によると、画像単体を入力とする ResNet-50(自己教師あり学習)とCLIPの性能が高かった 定性評価によって、取り扱うモーダルの違いによる各モデル出力の顕著な差異が確認できた 背景・目的 小売において、商品の在庫は無数に存在しています。そのため、消費者やサービス提供者が商品に紐づく情報(画像、商品の説明文など)を解釈して、特定の商品と類似したアイテムを人手で行うのは困難です。 この課題を解決するために、機械学習手法の活用が注目されています。 機械学習を用いた処理の流れは、 商品に紐づく情報を適切に 「要約」 し、 1.で 「要約」 した商品情

                                                                              ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
                                                                            • findコマンドの使い方を簡単に理解するための7つのルール+実践的な知識 - Qiita

                                                                              はじめに find コマンドの使い方は、ざっくり調べただけではよくわからんとなりますが、見逃しがちなルールを知れば簡単に理解できます。find コマンドに限りませんが使い方を調べるのが面倒だからと曖昧な理解で使うと逆にもっと分からなくなって時間がかかります。急がば回れ、理解して正しく使ったほうがシンプルで楽で簡単です。この記事では find コマンドの使い方を理解するために必要なルールと使い方の実践的な知識をまとめました。 Q&A(?): -type や -perm の説明はしないの? ⇒ それらはドキュメントを読むか検索すればすぐにわかることで難しいポイントではありません。重要なのは基本のルールを理解することです。 関連記事 POSIX 準拠のシェルスクリプトでは find | xargs よりも find -exec {} + を使うべき! 移植性の話はこちら ⇒ findコマンドのオ

                                                                                findコマンドの使い方を簡単に理解するための7つのルール+実践的な知識 - Qiita
                                                                              • ChatGPTを使って、文字コードの理解と記述の負担を軽減できるのか 「日本語と認識しているUnicodeの範囲」「括弧の検出」「新字体への変換」を調査してみた

                                                                                「『生成AIを使ってこんなもの作ってみました』開発者LT大会」は、急速に発展しているChatGPTや生成AIといったAI技術を使って何かを作ってみた人たちがアイデアや成果を共有する、ログミーTech主催のイベントです。ここでPR TIMES社の土屋氏が登壇。「ChatGPTを使って文字コードを扱う負担を軽減できるか」という調査の内容と結果について紹介します。 Shun氏の自己紹介と、本セッションのアジェンダ Shun氏(以下、Shun):それでは、PR TIMES社の土屋が発表します。私の名前はShunといいます。PR TIMESに勤めていて、ソフトウェアエンジニアをやっています。 本日のアジェンダです。私の発表はどちらかというと、個人開発でChatGPTを使ったものを作って、それで実験をしてみたという内容になっております。 表題にもあるとおり、ChatGPTに文字コードのことを聞いてどん

                                                                                  ChatGPTを使って、文字コードの理解と記述の負担を軽減できるのか 「日本語と認識しているUnicodeの範囲」「括弧の検出」「新字体への変換」を調査してみた
                                                                                • VSCode(VisualStudioCode)の定番機能を一挙解説 - Qiita

                                                                                  はじめに コードエディタ界の王様VisualStudioCode。開発の際に使っている方も多いのではないでしょうか。 本記事では、VSCode(VisualStudioCode)の定番機能を紹介していきます。 この記事を読んで、VSCodeマスターになりましょう! 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 そもそもVSCodeって? VSCode(VisualStudioCode)はMicrosoft社が提供する無償のコードエディタです。2015年リリースですが、着々とユーザーを増やしており、2023年現在、世界で最もポピュラーなコードエディタの1つとなっています。 コードエディタって? 字や記号などのテキストで構

                                                                                    VSCode(VisualStudioCode)の定番機能を一挙解説 - Qiita