タグ

Elasticsearchに関するteracy_junkのブックマーク (11)

  • 楽天APIとLINE Messaging APIによるレシピ検索ボット ~Elasticsearchを添えて~ - Qiita

    この記事はリンク情報システム(Facebook)が主催するイベント「Tech Connect! Summer」のリレー記事です。 「Tech Connect! Summer」は engineer.hanzomon のグループメンバによってリレーされます。 記事は4日目、8/3(土)分です。 先日弊社の社内アイデアソンで「チャットボットを考えよう」みたいなテーマやったんですが、その時自分で出した(そしてボツにした)レシピ検索ボットを作ってみました。 こんな感じでキーワードを入力したり 材料入れてみたりすると それっぽいレシピを5件くらい横並べで表示してくれます。 なんでボツにした案をやるかって?簡単そうだからだよ! あとElasticsearch、というか全文検索をさわってみたかった。 構成 今回はMessaging API(所謂LINE BOT) + AWS Lambda + AWS E

    楽天APIとLINE Messaging APIによるレシピ検索ボット ~Elasticsearchを添えて~ - Qiita
  • ElasticsearchでSuggestersを日本語で試す - Qiita

    Suggestesを以下の4つの種類があります。 Term Suggester: 編集距離(Edit Distance)によってサジェストする。 Phrase Suggester Completion Suggester Context Suggester ElasticsearchのSuggesterで、サジェストを試してみるを試しながらやっていきます。 マッピングの設定 PUT suggest_sample { "settings": { "index": { "number_of_shards": 5, "number_of_replicas": 1, "analysis": { "tokenizer": { "kuromoji_tokenizer_search": { "type": "kuromoji_tokenizer", "mode": "search", "discard_

    ElasticsearchでSuggestersを日本語で試す - Qiita
  • 様々なファイルをデータソースにElasticsearchへデータ投入する | DevelopersIO

    はじめに 藤です。 Elasticsearchにデータ投入する方法を調べる機会がありましたので、今回はいくつかのファイルをデータソースにElasticsearchへデータ投入する方法をご紹介します。 概要 Elasticsearchはリアルタイムデータ分析、ログ解析、全文検索など様々なユースケースで活用することができます。例えば、Excelでデータ蓄積して、グラフ化・集計を行っているのであれば、Elasticsearchにデータ投入して、Kibanaで可視化することができます。ログをSyslogで集約して、grepやawkを駆使してパフォーマンス解析しているのであれば、logstashやfluentdなどでメッセージ解析し、Elasticsearchに集約、Kibanaで可視化することができます。ブログサイトの記事をDBに投入していてアプリケーションによって検索処理ロジックを実装している

    様々なファイルをデータソースにElasticsearchへデータ投入する | DevelopersIO
  • ElasticsearchでPDF, MSOfficeファイルの全文検索 - tom__bo’s Blog

    つい最近までバイト先でElasticsearchを使っていたのだが、優先度的に当分触らなくなってしまいそうなので、自分のPCで構築しつつ復習してみます。 Elasticsearchに関する基的な知識はちょっと古いけど下の書籍がおすすめです。 ( ↑公式のドキュメントと共にだいぶお世話になりました) 今回は実験としてPDF, PowerPointの文書を登録して日語で検索してみます。 目次: 1. mac環境でのElasticsearchのインストール 2. プラグインのインストール 3. 日語対応 4. pdf, ppt等の対応 1. mac環境でのElasticsearchのインストール brew install elasticsearch これだけ。 yumと違ってほぼ最新版が持ってこれるので楽ちん。 yumももうお亡くなりになったそうだけど、、、 (O_O) 2. プラグインの

    ElasticsearchでPDF, MSOfficeファイルの全文検索 - tom__bo’s Blog
  • 形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法 - Qiita

    この記事はVASILY DEVELOPERS BLOGにも同じ内容で投稿しています。よろしければ他の記事もご覧ください。 こんにちは、バックエンドエンジニアの塩崎です。 今まではiQONの全文検索用のインデックスには形態素解析だけを用いていましたが、先日Ngramも併用することで検索を改善しました。 その結果、検索結果のヒット数が向上し、なおかつ検索ノイズの増加を軽微なものに抑えることができました。 この記事では、Ngramを併用することのメリット、およびそれをApache Solrで利用する方法について紹介します。 欲しい情報が見つからないとは そもそも、「検索したけど欲しい情報が見つからない状態」とはどのような状態でしょうか? ここではその状態を以下の2つの状態に分解して考えてみます。 欲しい情報の数が少ない 1つ目の状態は「欲しい情報が検索結果中に少ない」状態です。 例えば、旅行情報

    形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法 - Qiita
  • ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作った話

    ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作ったときの具体的な話

    ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作った話
  • 第2回 Elasticsearch 入門 データスキーマ設計のいろは | DevelopersIO

    第2回目の Elasticsearch 入門は「データスキーマ設計のいろは」です。 設計と言うほどでもないのですが、例えば RDB で検索にフォーカスした設計や、他の検索エンジンも経験していると、これまでの制限や習慣で Elasticsearch の特徴を生かせない設計をしてしまう事があるので、このテーマにしてみました。 それではインデックスするためのデータ構造を Elasticsearch でどのように設計するのか解説したいと思います。 設計フローまで変えてしまう画期的なドキュメント指向型検索エンジン Elastic 社のホームページを見てみると Elasticsearch の特徴の1つとして「Document-Oriented」と言う記載があります。直訳すると「ドキュメント指向」です。 簡単に説明すると 現実世界の複雑なデータをJSONドキュメントにしてインデックスするだけで、デフォル

    第2回 Elasticsearch 入門 データスキーマ設計のいろは | DevelopersIO
  • Elasticsearch で作る検索エンジン ― 理論と実践 (1/2) | Wantedly Engineer Blog

    こんにちは。エンジニアの岩永です。 先日 Wantedly では Elasticsearch と検索エンジンについて勉強会を開催しました。 概要 Wantedly が内部向けにやっている勉強会に20名様だけご招待。 63,000回。Google は一秒間にこれだけの検索をしていると言われています。 1.2年ごとに世界中の情報が倍になっている現代において、 検索はユーザが目的のものに素早くアクセスする手助けをしています。 情報に素早くアクセスできるというのはどんなサービスでも重要なことです。 しかし、検索エンジンを作ると言っても、実際に何に気をつけて作っていけばいいのかわからないという方も多いと思います。 今回の実践会では GitHub の I カバー画像は Elasticsearch 開発元である Elastic 社の Jun Ohtani さんがおみやげに持ってきてくれたグッズです。(あ

    Elasticsearch で作る検索エンジン ― 理論と実践 (1/2) | Wantedly Engineer Blog
  • Elasticsearchを用いた日本語検索システムの理論と設定

    連載は、対話インターフェースを利用して新しい形の検索システムを体験してもらうことを目的としています。今回は日語検索システムでよく用いられるElasticsearchを紹介します。Elasticsearchは大規模なデータに対しても適用可能な検索機能を提供している全文検索エンジンです。特徴としてスケーラブル、検索速度の速さ、検索結果の分析のしやすさ、開発者にとって使いやすいRESTfulなAPIが挙げられます。今回の記事はElasticsearchを用いた日語検索システムの仕組みから設定の部分までを記述し、次回の記事で実際に動作させてもらいます。 連載の内容 連載で紹介予定の内容は次のとおりです。 Step1:Elasticsearchを用いた日語検索システム 対話型の検索システムを作成するためのStep1として、Elasticsearchを用いた日語検索システムの構築方法を紹

    Elasticsearchを用いた日本語検索システムの理論と設定
  • Elasticsearch の Percolator を使った地理属性判別システムの構築 - クックパッド開発者ブログ

    こんにちは、ホリデー株式会社の内藤です。Holiday ( https://haveagood.holiday/ ) というサービスの開発を行っています。 先日開催した Cookpad TechConf 2016 では、『おでかけスポット検索のむずかしさ - Holiday を支える検索技術』という題で発表を行いました。 おでかけスポット検索のむずかしさ - Holidayを支える検索技術 from Yusuke Naito www.slideshare.net この発表では、 おでかけスポットの検索では、全文検索だけでは満足のいく結果は得られない 地理空間検索に拡張することでよりよい検索体験を作ることが可能 これを実現するための Elasticsearch の機能を紹介 というような内容を紹介しました。 例えば、我々が「中目黒」を思い浮かべた時にイメージするエリア内の住所には、「中目黒」

    Elasticsearch の Percolator を使った地理属性判別システムの構築 - クックパッド開発者ブログ
    teracy_junk
    teracy_junk 2016/03/17
    『(ユーザの検索文字列とユーザが想定しているエリアの相違から)検索クエリを文字列として扱うだけでは、検索クエリに込められたユーザの意図を汲みとった検索結果を返すことが難しくなる』
  • 自分流Elasticsearch入門 - $shibayu36->blog;

    【2016/09/10追記】 勉強しなおして、Elasticsearchの知識についてさらにまとめた記事を書いたので、そちらを参照してもらうと良さそうです。 blog.shibayu36.org 最近Elasticsearchの勉強をした。ただ、入門のためどのような資料が適しているかを知るのが大変だった。そこでどのように勉強したかについてメモをしておく。少しまとめエントリー的なノリになりそう。 Elasticsearchの概念を知る 全文検索技術の基を知る Elasticsearchのドキュメントのたどり方を知る の順に学習を進めていった。 Elasticsearchの概念を知る Elasticsearchの学習を始めようとした時に、まずは基からということで以下のを読んでいた。 高速スケーラブル検索エンジン ElasticSearch Server (アスキー書籍) 作者:Rafal

    自分流Elasticsearch入門 - $shibayu36->blog;
  • 1