タグ

ブックマーク / blog.johtani.info (3)

  • Oramaという検索エンジンでブログ検索を作ってみた

    この記事は、情報検索・検索技術 Advent Calendar 2023の15日目の記事です。 昨年に続き2回目の情報検索のAdvent Calendar参戦です。 今年は、夏にオンライン参加したBerlin Buzzwordsの「The Debate Returns (with more vectors) Which Search Engine?」というセッションでPhilippさんが話題に出したOrama searchという検索エンジンを紹介してみようと思います(Oramaが正式名称なのかな?)。 Oramaという検索エンジン 公式サイトのトップにも記載がありますが、エッジで動作する全文検索&ベクトル検索エンジンというもののようです。 なにそれ?という感じがしますが、オープンソース版のドキュメントを見るともう少しわかりやすい説明になっています。 Orama is a fast, bat

    Oramaという検索エンジンでブログ検索を作ってみた
    sh19910711
    sh19910711 2024/02/24
    "Orama: TypeScriptで書かれた、依存なしで利用できる検索エンジン + エッジで動作する全文検索&ベクトル検索 / tokenize関数を変更できる + 形態素解析ライブラリとして、wakachigakiというライブラリを利用" / 2023
  • ElasticsearchのアーキテクチャとStateless / Serverless

    記事は情報検索・検索技術 Advent Calendar 2022の9日目の記事です。 だいぶ間が空いてしまいましたが、日語のオートコンプリートに関する記事の続きです。 という感じで、Suggesterのデータ構造とか仕組みを書こうと思っていたのですが、思ったよりも調べないといけないことが多くて挫折しました。。。 (これの続きは年末年始で調べて書くはず?) ということで、代わりにElasticsearch/OpenSearchのアーキテクチャの変更に関してさらっとまとめてお茶を濁してみようと思います。 発端はElasticON Tokyo? 先週の11月30日に、ElasticのオフラインイベントであるElasticON Tokyoが開催され参加しました。 参加しようと思ったのは、10月の頭にElasticのブログで公開された「Stateless — your new state of

    ElasticsearchのアーキテクチャとStateless / Serverless
    sh19910711
    sh19910711 2022/12/11
    "10月の頭にElasticのブログで公開された「Stateless — your new state of find with Elasticsearch」 / ElasticもAWSも考え方の基本となっているのは、Berlin BuzzwordsでAmazonのMikeさんが2019年に発表されたものだと思っています"
  • システムの特徴と検索機能について(検索システムに関する妄想その1)

    今年の頭からシステムの検索周りを手伝う仕事フリーランスとしてやっています。 検索の仕組みを知れば知るほど面白くなってきたからという理由になるのかな? LuceneやSolr、Elasticsearchなどを長く触っているというのもあるかと思います。 ということで、検索についていつも考えています。 頭の中でまとまっていない状況ですが、システムにおける検索機能についていくつか頭の中にあることを書き出して、 いろんな方にダメ出しやコメントをもらいたいなと思ったので、色々と書いてみようかと。 思いつきのままに書いているので、はなしがあちこち飛ぶ可能性もありますが、あしからず。 検索って難しい 「「検索」とは、データの集合から目的のデータを探し出すこと」By Wikipedia 一言で「検索」といっても、使う人、ユースケースによっていろいろな「検索」があります。 例えば、新しいスマホを買ったときに

    システムの特徴と検索機能について(検索システムに関する妄想その1)
    sh19910711
    sh19910711 2022/08/03
    2020 / "いろいろな「検索」 / 検索機能のコアな部分を考えるだけでなく、提供しているシステム、コンテンツがどんなものかなど、システム全体を考えながら検索機能を考えていく事が検索をより良いものとして行く"
  • 1