並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 391件

新着順 人気順

rankingの検索結果1 - 40 件 / 391件

  • さて、専門性と体系化の話をしようか | knowledge / baigie

    「専門性が高い人になりたいですか?」 そう問われたら、多くの人が「はい!」と答えるでしょう。エンジニアやデザイナーのような専門職に限らず、ビジネスパーソンの多くも、「できることなら何らかの専門性を高めたい」と思っているはずです。 しかし、そもそも「専門性が高い」とはどういう状態を指すのでしょうか。どんな人になれば「専門家」だと評価されるようになるのでしょうか。それを突き詰めて考えることが専門性を高めるヒントになると思い、少し深堀してみました。 最後には、まだ実験中ですが、ChatGPTを活用して専門性を高める方法をご紹介します。 専門性と体系化の関係 辞書サイトのWeblioを見ると、専門性とは「特定の分野のみに深く関わっているさま。高度な知識や経験を要求されることや、その度合い」と書かれています。この定義に従うと、専門性には「特定の分野の高度な知識や経験」が必要だということになります。

    • RAGの実装戦略まとめ - Qiita

      それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

        RAGの実装戦略まとめ - Qiita
      • Threads人気ランキング

        Threads人気ランキング Threads人気ユーザーをランキング調査。国内個人・企業アカウント・海外アカウントを分析中。 総フォロワー数や前日からのフォロワー増加数でランキングを掲載。 ユーザー登録申請 自分のアカウントがランキングに掲載されていなかった場合、以下のフォームから登録の申請ができます。 アカウント種別を選択し、ユーザーIDを入力してください。

          Threads人気ランキング
        • 個人で開発していた上場企業の情報サイトをOSSにした

          結論 個人で開発していたWEBサービスをOSSとして公開しました。 この背景や技術環境について書いていきます。 すべてのソースコードをGitHubに公開しています。 スターやレビューをしてくださると嬉しいです! 公開したサービス: 上場企業ランキング 先日、オープンソースでWEBサービスを公開しました。 「上場企業ランキング」というサービスです。 その名の通り日本の上場企業を業界ごとに「給与」や「売上」順で閲覧することができるサービスです。 URL: https://company-ranking.net/ GitHub: https://github.com/yuki0920/company-ranking 私は2度の転職活動経験がありますが、企業を選ぶ際に知っておきたいことはいくつもありますよね。 「給与はどのくらいだろう」 「売上や利益はどの程度なのかな」 こういった情報は、求人ペー

            個人で開発していた上場企業の情報サイトをOSSにした
          • RAGにおけるドキュメント検索精度向上について(概要編)

            はじめまして。損害保険ジャパン株式会社 DX推進部の眞方です。普段はリードエンジニアとして、新しいサービスのアーキテクチャ検討からローンチまでの作業や、新規技術を用いたアプリのプロトタイプ実装などを行なっています。 弊社では、LLM(Large Language Models)を活用したアプリケーションの開発を積極的に検討し、既に社内でいくつかのプロトタイプをローンチしています。 本記事では、その最も一般的?なユースケースの一つとも言えるRAG(Retrieval Augmented Generative)の構築において、ドキュメント検索精度の向上にどのように取り組んだ内容の概要を紹介させていただきます。実際の詳細な手法および結果については、別記事(実践編)で解説予定です。 はじめに RAGとは? この記事を読まれている方の中にはご存知の方も多いでしょうが、RAGとはRetrieval A

              RAGにおけるドキュメント検索精度向上について(概要編)
            • Hacker Newsで自作のOSSを紹介したらRanking 1位になり一晩で+100 stars付いた - valid,invalid

              自作のRuby gemをHacker Newsにて紹介したところ、一晩でGitHub repositoriesに100以上のstarsが付いて驚いた。また、リアルタイムでは見逃したのだがHacker News Rankingで数時間1位におり、20時間ほどトップページに載っていたらしい。2024-05-26現在は落ち着いて195pt。 投稿はこちら Show HN: PBT – A property-based testing library for Ruby | Hacker News。 2024-05-22のdaily rankingでは11位だった。 何について投稿したのか pbtという自作のテストツールで、property based testingを並列実行するというアイデアを実証したもの。このツールについてはRubyKaigi 2024で発表したので興味があればそちらの記事もご

                Hacker Newsで自作のOSSを紹介したらRanking 1位になり一晩で+100 stars付いた - valid,invalid
              • ライフハッカー・ジャパンの書評家が選ぶ、2023年の名著10選 | ライフハッカー・ジャパン

                4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

                  ライフハッカー・ジャパンの書評家が選ぶ、2023年の名著10選 | ライフハッカー・ジャパン
                • FacebookやInstagramでのAIの仕組み、公開される

                  FacebookやInstagramでのAIの仕組み、公開される2023.07.07 20:009,228 Mack DeGeurin - Gizmodo US [原文] ( 福田ミホ ) 脱ブラックボックスなるか。 MetaがFacebookやInstagramでAIをどう使ってるのか、今までになく詳細な情報を公開しました。その情報は、22の「システムカード」としてまとまっています。 Metaのサービスの仕組みがブラックボックスだという批判が今まで無数にありましたが、今回の情報公開はそんな声に応えるためなんでしょうね。 AIの仕組みを22のカードで説明22のシステムカードは、14がFacebook関係、8がInstagram関係となっていて、各カードがたとえばFacebookの「フィード」とか「フィードの推薦」「知り合いかも」という風に、配下の細かいサービスに割り振られてます。 各システ

                    FacebookやInstagramでのAIの仕組み、公開される
                  • スニーカー文庫35周年サイト|角川スニーカー文庫

                    35th anniversary character ranking 35周年記念 キャラクターランキング 結果発表!

                      スニーカー文庫35周年サイト|角川スニーカー文庫
                    • Twitterのデマ拡散を防ぐ「コミュニティノート」は本当に信用できるのかアルゴリズムの仕組みを解説

                      Twitterでは誤解を招く情報やデマ情報の拡散を防止するために、ユーザー同士で評価し合ってファクトチェックを行える「コミュニティノート」機能が2022年12月から正式に導入されています。しかし、コミュニティノートはユーザーによって記されるものなので「そもそもコミュニティノートは信用していいのか?」と気になっている人も多いはず。コミュニティノートの信頼度を決定するアルゴリズムが公開されていたので、その内容をまとめてみました。 Note Ranking Algorithm https://communitynotes.twitter.com/guide/en/under-the-hood/ranking-notes ◆コミュニティノートとは? コミュニティノートは、誤解を招く可能性のあるツイートに対して、ユーザーがツイートの文脈を説明する「ノート」を残すことができる機能です。例えば、以下の「

                        Twitterのデマ拡散を防ぐ「コミュニティノート」は本当に信用できるのかアルゴリズムの仕組みを解説
                      • MySQLで全文検索機能を使う際のパフォーマンスについて調査してみた - iimon tech blog

                        こんにちは、CTOの森です。iimonは今回が初のアドベントカレンダー参加です! 本記事はiimonアドベントカレンダー1日目の記事となります。 はじめに 検証した環境 MySQL/mecabのインストール 大量のデータを入れる 1レコードのINSERTにかかった時間 検索してみる 検索文字列が「出来事」の場合 インデックスなし N-gram(bi-gram) IN NATURAL LANGUAGE MODE IN BOOLEAN MODE MeCab IN NATURAL LANGUAGE MODE IN BOOLEAN MODE 検索文字列が「チューリングはロンドンのリッチモンドに住み」の場合 まとめ 参照したサイト 最後に はじめに 今回はMySQLで全文検索機能を使う際のパフォーマンスについて書こうと思います! 全文検索をちゃんと使うのであればElasticsearchやSolrな

                          MySQLで全文検索機能を使う際のパフォーマンスについて調査してみた - iimon tech blog
                        • 風俗客デビューするという友人へ送る

                          友人が風俗客デビューするとかしないとかって話になった ので、メールなりなんなり送ろうと思ったのだが 相当な長文になるので増田の方がよかんべと思ったので筆をとる 簡易まとめ世の中結論が先にある方が望ましい風潮にある。 なので、結論なんだが https://ranking-deli.jp/member/info/ まずは「駅ちか」に登録する。店探しはここから始めるのがいい。理由は色々あるし他の会員サイトも試すべきだけど最初は駅ちかからでいい。店選びはここから。 次に「店選び」についてだがこれは単純で 「家から近くて通いやすい店」これが鉄板。電車を数回乗り換える時点で論外と思っていい。 そして絶対外さない店を選ぶコツは 「在籍人数が多い店」迷ったら在籍嬢の多さで決める。これが基本。 次に風俗嬢選びだが 通える曜日と時間帯を調べるその時間帯に出勤がある相手の中で口コミがある相手を調べる(悪い口コミ

                            風俗客デビューするという友人へ送る
                          • 意味的知識グラフとApache Solrを使った関連語検索の実装 - Ahogrammer

                            Manningから出版予定の『AI-Powered Search』(AIを活用した情報検索の意)を冬休み中に読んでいたら、その中で意味的知識グラフ(Semantic Knowledge Graph)と呼ばれるデータ構造について説明していて、関連語の計算やクエリ拡張などに使えるということで興味深かったので紹介しようと思います。最初に意味的知識グラフについて説明したあと、日本語のデータセットに対して試してみます。 AI-Powered Search(https://www.manning.com/books/ai-powered-search) 本記事の構成は以下のとおりです。 意味的知識グラフとは 意味的知識グラフを用いた関連語の計算 参考資料 意味的知識グラフとは 知識グラフと聞くと、固有表現認識や関係抽出、OpenIEを使って構築するグラフを思い浮かべる方もいると思うのですが、意味的知識

                              意味的知識グラフとApache Solrを使った関連語検索の実装 - Ahogrammer
                            • サーバレスにおけるRustについて - NTT Communications Engineers' Blog

                              この記事は、 NTT Communications Advent Calendar 2023 22日目の記事です。 はじめに こんにちは、イノベーションセンターの鈴ヶ嶺です。普段は、クラウド・ハイブリッドクラウド・エッジデバイスなどを利用したAI/MLシステムに関する業務に従事しています。 本記事は、各クラウドベンダーのサーバレスにおけるプログラミング言語Rustについて調査・比較した結果を紹介します。 まず初めにサーバレスでRustを利用するメリットをエネルギー効率の観点から説明し、次に各クラウドベンダーの関連記事をピックアップします。 さらに、それぞれのクラウドでRustを使ったサーバレスアプリの代表的な作成方法を紹介して比較します。 Rustのエネルギー効率 Rustは、次の公式ページでも宣伝している通りパフォーマンスを強くアピールしています。 Rustは非常に高速でメモリ効率が高く

                                サーバレスにおけるRustについて - NTT Communications Engineers' Blog
                              • 【子育てで大変なことランキング】パパ&ママ500人アンケート調査

                                子育てって、毎日大変ですよね。 新生児のころは授乳や寝かしつけが大変ですし、反抗期や思春期のお子さんを育てている方は、子どもとの接し方について悩みが多いことでしょう。 子どもとの関わりだけではなく、金銭面で困難を抱えるご家庭もあります。 今回は子育て中のパパ・ママ500人にアンケートを実施。 「子育てで大変なこと」や「子育ての大変さを軽減するための対処法」について聞きました。 【調査概要】 調査対象:子育て中の方 調査期間:2023年8月8日~17日 調査機関:自社調査 調査方法:インターネットによる任意回答 有効回答数:500人(女性400人/男性100人) 回答者の年代:20代 15.2%/30代 55.4%/40代 24.4%/50代以上 5.0%

                                  【子育てで大変なことランキング】パパ&ママ500人アンケート調査
                                • こんな何も調べずに書いてるクソエアプに騙されてんじゃねえよカスSNS

                                  ジャンプルーキーの毎月1位だけがプラスで連載出来る権利、悪魔の所業 まず書き続けないと周知して貰えないし、1位にならないと連載出来ないから書き続ける。 はぁ?お前ちょっとは調べてから書いたら?直近半年の1位を調べる程度のことはやったらどうなんだ? こんなん最初の3話ぐらいでバズるかどうかのクソゲーなんだって秒で分かると思うけど? システムをそもそも理解してるか? https://rookie.shonenjump.com/rensai_ranking/about より抜粋 ランキングは、エントリー作品の最新3話分の閲覧数の合計で決まります。最新話を投稿するとその月のランキングにエントリーすることができます これのせいで「最初の3話でクソウケたら勝ち」のクソゲーなんだよ。 マジでゴミだからこのシステム。 直近半年の1位の作品名および1位獲得時の「ランキング集計対象直近3話」2024年04月 

                                    こんな何も調べずに書いてるクソエアプに騙されてんじゃねえよカスSNS
                                  • 思ったより全然使えそう。OpenAIが提供する「有用GPT」ランキング

                                    11月頭に開催されたOpenAI初のデベロッパーカンファレンスDevDay。あのころは、まさかその後とんでもないドラマが待ち受けているなんて思ってませんでしたね…。 ドラマはさておき、DevDeayで発表された特定分野専門のChatGPTともいえる「GPT」。GPTストアから入手できるGPT。すでに多くの開発者が制作しており、続々と公開されています。 その中で使える(笑える)GPTをいくつかピックアップして、ランキング形式でまとめてみました。 10位:NOT HotdogImage: ChatGPT画像にあるものが、ホットドッグかそうではないかを見分けるだけのGPT。 ドラマ『シリコンバレー』で登場したアプリをそのままGPT化。ドラマのファンだった人は思わず笑ってしまいますが、ドラマを知らない人からしたらネタGPTにもならないのですが…。 9位:The Secret of Monkey I

                                      思ったより全然使えそう。OpenAIが提供する「有用GPT」ランキング
                                    • ‘Lavender’: The AI machine directing Israel’s bombing spree in Gaza

                                      Smoke rises after Israeli airstrikes in Beit Lahia, in the northern Gaza Strip, December 28, 2023. (Yonatan Sindel/Flash90) In 2021, a book titled “The Human-Machine Team: How to Create Synergy Between Human and Artificial Intelligence That Will Revolutionize Our World” was released in English under the pen name “Brigadier General Y.S.” In it, the author — a man who we confirmed to be the current

                                        ‘Lavender’: The AI machine directing Israel’s bombing spree in Gaza
                                      • 2022年に泊まった温泉宿で「部屋」「風呂」「食事」が良かったおすすめ宿ランキングを発表する - 温泉ブログ 山と温泉のきろく

                                        選んだ10軒の宿はすべて1人で宿泊可能な宿です 2017年から毎年、1年間に泊まった宿を振り返って「部屋」「風呂」「食事」というそれぞれの側面において「この宿はすばらしく良かった!」と印象に残っている宿をそれぞれ1位から3位まで紹介する、という記事を更新しています。 本稿はその2022年版です。 過去5回分の記事は下記になります。 食事部門だけ3軒に絞りきれず3位が2軒あり、全部で10軒の宿を紹介しています。 2019年、2020年、2021年に引き続いて2022年版で選んだ宿も、すべて1人で宿泊した宿でした。現時点でも、すべての宿が1人泊を受け入れており、10軒の宿の中で6軒は、休前日でも1人で宿泊可能な宿です。私自身もそうですが、土日休みの勤め人で、できれば土曜日に1人で泊まれる宿が知りたい……という方が多いのではないかと思いますので、各宿についていつなら1人で予約可能かを付記していま

                                          2022年に泊まった温泉宿で「部屋」「風呂」「食事」が良かったおすすめ宿ランキングを発表する - 温泉ブログ 山と温泉のきろく
                                        • 2023年もっとも売れたライフハックツールTOP10【文具編】 | ライフハッカー・ジャパン

                                          4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

                                            2023年もっとも売れたライフハックツールTOP10【文具編】 | ライフハッカー・ジャパン
                                          • 【事故物件に住みたくない理由ランキング】男女500人アンケート調査

                                            「事故物件」に明確な定義はありませんが、一般的には「殺人や自殺などで人が亡くなった部屋」を指します。 入居に抵抗を感じる人が多い「心理的瑕疵物件」のひとつです。 事故物件は借り手がつきにくいため、家賃が安くなっていたり初期費用が不要になっていたりと、条件面で優遇されていることも多くなっています。 とはいえ、「部屋を借りるなら事故物件は避けたい」と考える方も多いでしょう。 今回は男女500人を対象にアンケートを実施。 「事故物件に住みたくない理由」や「事故物件でも住んでもいいと思える条件」について聞きました。 【調査概要】 調査対象:全国の男女 調査期間:2023年6月7日~8日 調査機関:自社調査 調査方法:インターネットによる任意回答 有効回答数:500人(女性341人/男性159人) 回答者の年代:10代 0.4%/20代 17.0%/30代 42.6%/40代 27.2%/50代 1

                                              【事故物件に住みたくない理由ランキング】男女500人アンケート調査
                                            • 印南敦史の「毎日書評」年間ランキングTOP30|2023年ライフハッカー読者に人気だった本は? | ライフハッカー・ジャパン

                                              4TBが9千円台だって。バッファローの静音HDDは在庫があるうちに回収しておこう【Amazonセール】

                                                印南敦史の「毎日書評」年間ランキングTOP30|2023年ライフハッカー読者に人気だった本は? | ライフハッカー・ジャパン
                                              • RAGでの回答精度向上のためのテクニック集(応用編-B)

                                                はじめまして。株式会社ナレッジセンスの門脇です。普段はエンジニア兼PMとして、「社内データに基づいて回答してくれる」チャットボットをエンタープライズ企業向けに提供しています(一応、200社以上に導入実績あり)。ここで開発しているチャットボットは、ChatGPTを始めとしたLLM(Large Language Models)を活用したサービスであり、その中でもRAG(Retrieval Augmented Generative)という仕組みをガッツリ利用しています。本記事では、RAG精度向上のための知見を共有していきます。 はじめに この記事は何 この記事は、LlamaIndexのAndrei氏による『A Cheat Sheet and Some Recipes For Building Advanced RAG』[1]という記事で紹介されている「RAGに関するチートシート」について、And

                                                  RAGでの回答精度向上のためのテクニック集(応用編-B)
                                                • Amazon Bedrock "Claude 2" と、ChatGPT "GPT-4" を比較してみる - Qiita

                                                  Amazon Bedrock "Claude 2" と、ChatGPT "GPT-4" を比較してみるAWSAIChatGPTGenerativeAIAmazonBedrock Amazon Bedrockとは? 2023/9/28にAWSが生成系AIのサービス「Amazon Bedrock」を正式リリース (GA) しました。 「Amazon Bedrock」は、様々な企業の基盤モデル(FM)を1つのAPIで利用できるようにするサービスです。 基盤モデルとは、大量のデータで事前訓練された大規模な機械学習モデルのことで、用途は幅広く、検索からコンテンツ作成、医薬品開発など、様々な分野で活用できます。 Amazon Bedrockは、この基盤モデルの利活用が容易にできるサービスとなっています。 ユーザーは、AIのスタートアップや著名な企業が開発した基盤モデルを簡単に試すことができ、また、自社

                                                    Amazon Bedrock "Claude 2" と、ChatGPT "GPT-4" を比較してみる - Qiita
                                                  • Threadsの人気ランキング見て、 https://b.hatena.ne.jp/entry/s/threads-ranking.userlocal.jp/ ..

                                                    Threadsの人気ランキング見て、 https://b.hatena.ne.jp/entry/s/threads-ranking.userlocal.jp/ ランキングにケチ付けてる人、ブロックリスト助かる、とか全員ミュートした、とかブコメ付けてる人、 なんか痛々しい。 昔よくいた、得意気にテレビ見てない、テレビ持ってないアピールしてた人みたいで。 俗世から離れる、主流派から距離を置く、 それは一つの生き方、戦略としてアリだとは思うけど、 それを声高にアピールしてるのをみると「自意識高めの痛々しい人だなあ」としか思えないよね。

                                                      Threadsの人気ランキング見て、 https://b.hatena.ne.jp/entry/s/threads-ranking.userlocal.jp/ ..
                                                    • Anthropic「Claude 3 Opus」がLLM評価指標「Chatbot Arena」で初めてOpenAI「GPT-4」のパフォーマンスを上回る快挙を達成

                                                      2024年3月に発表されたAnthropicの大規模言語モデル(LLM)「Claude 3」は、20万トークンまでのコンテキスト長に対応しているほか、わずか2つのプロンプトから量子アルゴリズムを設計可能との報告も挙がっています。今回、AI研究者が大規模言語モデルの相対的な能力を測定するために使用する「Chatbot Arena」において、Claude 3の上位モデル「Claude 3 Opus」がOpenAIの大規模言語モデル「GPT-4」の性能を初めて上回ったことが報告されました。 Anthropic's Claude 3 replaces OpenAI's GPT-4 as most popular user-rated LLM https://the-decoder.com/anthropics-claude-3-replaces-openais-gpt-4-as-most-popu

                                                        Anthropic「Claude 3 Opus」がLLM評価指標「Chatbot Arena」で初めてOpenAI「GPT-4」のパフォーマンスを上回る快挙を達成
                                                      • GoogleのチャットAI「Bard」で会話内容を共有するとGoogle検索に表示されてしまうことが発覚

                                                        GoogleのチャットAI「Bard」は、2023年7月のアップデートで「AIとの会話内容を共有する機能」を追加しました。この会話共有機能を使用すると、Bardとの会話がGoogle検索にインデックスされてしまい、全世界に公開されてしまうことが明らかになっています。 Google accidentally leaking Bard AI chats into public search results https://www.fastcompany.com/90958811/google-was-accidentally-leaking-its-bard-ai-chats-into-public-search-results Google To Block Bard Public Shared Conversations From Google Search https://www.ser

                                                          GoogleのチャットAI「Bard」で会話内容を共有するとGoogle検索に表示されてしまうことが発覚
                                                        • RAGs powered by Google Search technology, Part 1 | Google Cloud Blog

                                                          When a large language model (LLM) doesn’t have enough information or has no contextual knowledge of a topic, it is more likely to hallucinate and provide inaccurate or false responses. Developers are increasingly excited about generative AI and Retrieval Augmented Generation (RAG) — an architecture pattern that combines LLMs with backend information retrieval from other information sources. This a

                                                            RAGs powered by Google Search technology, Part 1 | Google Cloud Blog
                                                          • 英国では機関リポジトリによるオープンアクセスが大隆盛!それを支えた大学図書館現場の実践 | JPCOARウェブマガジン

                                                            1.連載のはじめに 祝! JPCOARウェブマガジン創刊! ということで新創刊されたウェブマガジンにて国際動向を紹介する連載を受け持つことになりました、JPCOAR運営委員(国際担当)の佐藤翔です。普段は同志社大学で図書館司書課程の授業を担当する図書館情報学者であり、自称「日本で初めて機関リポジトリの研究で博士号をとった人間」として、時々中断をはさみつつ、機関リポジトリ関連の活動にも長く関わらせていただいています。2017年に終刊した「月刊DRF」でも連載を持たせていただいていたので、機関リポジトリ関連媒体での連載は6年ぶりのカムバックということに。さすがに世の顔ぶれも一新されていそう……と思ったらJPCOARの運営委員の皆さんは割と当時から馴染みの方々……。 本連載では毎回、佐藤が日々目にした中で「これはJPCOARや、日本の機関リポジトリ界隈の皆さんに紹介した方がいいかも」という国際的

                                                              英国では機関リポジトリによるオープンアクセスが大隆盛!それを支えた大学図書館現場の実践 | JPCOARウェブマガジン
                                                            • 検索エンジンをVespaへ移行しています - Stanby Tech Blog

                                                              検索エンジンをVespaへ移行しています こんにちは、スタンバイで検索周りの開発を担当している鷹取です。 今回はスタンバイで利用している検索エンジンをVespaへ移行している話を紹介します。 検索エンジン移行の背景 Stanby Tech Blogのスタンバイ2+1年の軌跡の記事で説明されている通り、 スタンバイでは、主に求人検索機能を提供していますが、その中でもオーガニック(無料掲載)と広告(有料掲載)という2種類の検索が存在します。 この2種類の検索ではそれぞれで異なる検索エンジンを使用しています。 オーガニック検索: Yahoo! ABYSSという検索プラットフォーム 広告検索: Elasticsearch このようになっている背景については、前述の記事に詳細が記載されていますので、興味がある方はそちらをご参照ください。これまで、この2種類の検索エンジンを運用してきましたが、それぞれ

                                                                検索エンジンをVespaへ移行しています - Stanby Tech Blog
                                                              • 日本語LLMの"1トークン"は何文字相当なのか?

                                                                TR:TL 最近、日本語のLLMが続々公開されているが、各LLMが何文字まで生成可能なのかを知りたい。 Rakudaのデータで各LLMのトークナイザーの「1トークンあたりの文字数」を調べた。 標準的な日本語特化のLLMでは2.0~2.6文字/トークン程度、一方で、GPT-4/3.50.96文字/トークン程度。 背景 最近、日本語でも使えるLLMが続々と公開されています。特に、GPT-3.5-turboやGPT-4は、8192トークンという大きい最大トークン長を誇っています。一方で、LINEのjapanese-large-lmなどの2023年時点で公開されている公開されている日本語LLMの多くは、2048トークンが最大トークン数になっている場合が多いです。額面上、LINEのLLMは、OpenAI GPT-3.5の1/4の長さのテキスしか生成できないように見えますが、それぞれのトークナイザーは

                                                                  日本語LLMの"1トークン"は何文字相当なのか?
                                                                • 【表現の自由】白馬社の広報担当さん「コミュニティノートが貼り付けられる発信は信憑性が高いと思って間違いない。政府や企業に都合の悪い情報だから貼り付けられる」

                                                                  コミュニティノート(以下CN)を作成しているのは同じXユーザーの有志です。CNは誰でも参加できますが、参加基準はあります。 https://communitynotes.twitter.com/guide/en/contributing/signing-up また、CNの公開は同じ回答傾向の人だけではなく反対の傾向の人の回答傾向も参考にするなど一定のアルゴリズムに従って行われ、できる限り偏った考えが含まれない工夫がされています。 https://communitynotes.twitter.com/guide/en/under-the-hood/ranking-notes また、CN公開後も賛同者より反対者の方が一定数多くなると公開停止になります。つまり、個人の意見ではあるけれど多くの賛同が得られた上で公開される公平性の高いコメントです。 公開が続くということは、そのCNに対する賛同者が多

                                                                    【表現の自由】白馬社の広報担当さん「コミュニティノートが貼り付けられる発信は信憑性が高いと思って間違いない。政府や企業に都合の悪い情報だから貼り付けられる」
                                                                  • 楽天ふるさと納税返礼品ランキング 総合TOP15

                                                                    驚くほどの海外産率 もうやめちまえよ 順位都道府県市町村返礼品産地1北海道別海町ホタテ北海道産2北海道白糠町いくらアメリカ産3岩手県花巻市牛タンアイルランド産・イギリス産他4福井県敦賀市カニカナダ産、アメリカ産、ロシア産、バレンツ海5北海道別海町いくら北海道産6福岡県飯塚市ハンバーグ国産表記なし、製造は市外に委託7福井県敦賀市ブラックタイガーインドネシア産 / ベトナム産 / タイ産 / ミャンマー産 / インド産8長野県須坂市シャインマスカット須坂市9福井県敦賀市カニロシア、カナダ、アメリカ(アラスカ)、ノルウェー(バレンツ海)産10北海道白糠町サーモンノルウェー産11北海道紋別市ホタテオホーツク産12宮城県気仙沼銀鮭チリ産13北海道別海町牛肉別海町14福岡県新宮町いちご福岡県内15静岡県 焼津市ネギトロキハダマグロ(台湾、韓国、その他)・メバチマグロ(台湾、韓国、その他) https:

                                                                      楽天ふるさと納税返礼品ランキング 総合TOP15
                                                                    • Japan’s former PM, 83-year-old Aso, piles insults on female foreign minister

                                                                      Aso also twice got her surname wrong – calling her Kamimura – and incorrectly suggested she was Japan’s first female foreign minister. In fact, she is the third, after Makiko Tanaka and Yoriko Kawaguchi, who were appointed during the administration of Junichiro Koizumi in the early 2000s. Kamikawa, who became one of five women appointed to prime minister Fumio Kishida’s cabinet in September last y

                                                                        Japan’s former PM, 83-year-old Aso, piles insults on female foreign minister
                                                                      • React Routerはルートをどうランク付けしているか

                                                                        React Router とは React Router のルートのマッチング React Router のドキュメントのRanking Routesのセクションを例として説明します。 以下の 5 つのパスパターンを取り得るアプリケーションがあるとして、/teams/newというパスが与えられたときに、どのパスパターンがマッチするでしょうか。 [ "/", "/teams", "/teams/:teamId", "/teams/:teamId/edit", "/teams/new", ]; React Router はここからさらにルートをランク付けし、最終的に/teams/newを最もマッチするルートとして採用します。 どのようにルートをランク付けするか ランク付けというのは、ルートがどれだけパスにマッチするかを評価することです。React Router は、ルートのパスパターンと与えら

                                                                          React Routerはルートをどうランク付けしているか
                                                                        • RAGでの回答精度向上のためのテクニック集(応用編-A)

                                                                          はじめまして。株式会社ナレッジセンスの門脇です。普段はエンジニア兼PMとして、「社内データに基づいて回答してくれる」チャットボットをエンタープライズ企業向けに提供しています(一応、200社以上に導入実績あり)。ここで開発しているチャットボットは、ChatGPTを始めとしたLLM(Large Language Models)を活用したサービスであり、その中でもRAG(Retrieval Augmented Generative)という仕組みをガッツリ利用しています。本記事では、RAG精度向上のための知見を共有していきます。 はじめに この記事は何 この記事は、LlamaIndexのAndrei氏による『A Cheat Sheet and Some Recipes For Building Advanced RAG』[1]という記事で紹介されている「RAGに関するチートシート」について、And

                                                                            RAGでの回答精度向上のためのテクニック集(応用編-A)
                                                                          • A Guide on 12 Tuning Strategies for Production-Ready RAG Applications

                                                                            This article covers the following “hyperparameters” sorted by their relevant stage. In the ingestion stage of a RAG pipeline, you can achieve performance improvements by: Data cleaningChunkingEmbedding modelsMetadataMulti-indexingIndexing algorithmsAnd in the inferencing stage (retrieval and generation), you can tune: Query transformationsRetrieval parametersAdvanced retrieval strategiesRe-ranking

                                                                              A Guide on 12 Tuning Strategies for Production-Ready RAG Applications
                                                                            • 情報検索の評価指標の弱点と選択バイアスを考慮した改善アプローチ - ZOZO TECH BLOG

                                                                              こんにちは。検索基盤部の山﨑です。検索基盤部では、ZOZOTOWNの検索機能の改善を目的とした施策の有効性をA/Bテストで検証しています。 A/Bテストは、新たな施策の有効性を評価する手法として信頼性の高い手法ではあるものの、下記のような制約があります。 統計的に有意な差が出るためには、多くのユーザーからのフィードバックが必要である 比較手法を実際のユーザーに提示するため、ユーザー体験に悪影響を与えるリスクがある これらの制約から、実験したい全ての施策をA/Bテストで検証することは困難なため、事前に有効な可能性が高い施策に絞った上でA/Bテストに臨むことが大切です。 事前に有効な可能性が高いことを示すためには、オフラインでの評価結果を活用します。しかし、オフライン評価とA/Bテストの結果は必ずしも一致しないことが知られており、ZOZOTOWNにおいても同様の問題が発生しています。 このよう

                                                                                情報検索の評価指標の弱点と選択バイアスを考慮した改善アプローチ - ZOZO TECH BLOG
                                                                              • How Meta built the infrastructure for Threads

                                                                                On July 5, 2023, Meta launched Threads, the newest product in our family of apps, to an unprecedented success that saw it garner over 100 million sign ups in its first five days. A small, nimble team of engineers built Threads over the course of only five months of technical work. While the app’s production launch had been under consideration for some time, the business finally made the decision a

                                                                                  How Meta built the infrastructure for Threads
                                                                                • Getting started with Web Performance 🚀 - HTMHell

                                                                                  by Alistair Shepherd published on Dec 14, 2023 Carefully observing websites in the wild As the murderous tortoises start to converge on Ryūji’s hideout, they pull out their phone. It’s a cheap, older device but it’s survived the toils of the tortoise-ageddon well so far. Thankfully the internet still exists, although a bit slower, so they’re able to search online for how to scare tortoises away. T

                                                                                    Getting started with Web Performance 🚀 - HTMHell