第20回Solr勉強会の資料です。Solr 6.4から取り込まれているSynonymGraphFilterの設定方法を紹介しています。
第20回Solr勉強会の資料です。Solr 6.4から取り込まれているSynonymGraphFilterの設定方法を紹介しています。
Hadoopの時代は終わった、という言説をたまに見かけるようになりました。 もちろん終わってなどいません。しかし、Hadoopとその取り巻く環境が変化したのは事実です。 本記事では、この変化が何なのかを明らかにし、その上で、なぜHadoopの時代は終わったという主張が実態を正しく表していないのかを説明していきます。 DISCLAIMER 私はHadoopを中心としたデータ基盤を取り扱うベンダー、Clouderaの社員です。 中立的に書くよう努めますが、所属組織によって発生するバイアスの完全な排除を保証することはできません。 以上をご了承の上、読み進めてください。 要約 データ基盤は、Hadoopの登場により非常に安価となり、今まででは不可能だった大量のデータを取り扱えるようになりました。 Hadoopは、NoSQLブームの中、処理エンジンであるMapReduceとストレージであるHDFSが
NTTドコモは6月23日、AIエージェントを実現するための「AIエージェントAPI」を開発したことを発表。同時に、そのAPIをさまざまなパートナー企業に対しオープンな形で提供し、新たなサービスを共同開発する「ドコモAIエージェント・オープンパートナーイニシアティブ」を打ち出した。 「ドコモAIエージェント・オープンパートナーイニシアティブ」の発表会に登壇した面々。左から高島屋の髙山氏、NTTドコモの中村氏、インテルの江田氏、価格コムの村上氏 同日に開催された発表会で登壇したNTTドコモ代表取締役副社長の中山俊樹氏は、現在掲げている中期戦略2020「beyond宣言」において、顧客のライフスタイルを革新する新たなAIエージェントを提供すると打ち出したことが、開発の背景にあると説明する。 同社はこれまでにも、エージェントサービスの「iコンシェル」を提供し750万を超える有料会員を抱えているほか
一カ月前に炎上を狙うコンテンツや不快なコンテンツ、嫌悪感を煽るコンテンツは低品質とみなされ、検索評価(検索順位)が上がりにくくなるどころか検索結果に表示されにくくなると当ブログでお伝えしましたが、正にその実現に向けてGoogleが検索順位アルゴリズムを改良した(アップデートを行った)ことが発表されました。 「Project Owl(プロジェクト アウル)」と呼称されたこのプロジェクトによって行われたアップデートは、「フェイクニュース」や「不快な、嫌悪感を煽るコンテンツ」を検索結果に表示するべきではないものと定めました。 特に「お金」「健康」「安全」「法律」に関するコンテンツの質のチェックを強化するアップデートとしても実施されています。 今回のアルゴリズム改善によって影響を受けるのは現在の検索トラフィック全体の僅か0.25%程度だと発表されていますが、これはあくまで始まりでしかありません。
ヤフーは24日、高次元データの高速検索技術「NGT( Neighborhood Graph and Tree for Indexing)」を開発し、オープンソースソフトウェア(OSS)として「GitHub」に公開したと発表した。 NGTは、テキストや画像、商品・ユーザーデータなど、複数の特徴を持つ高次元データを、膨大なデータベースの中から高速に検索する技術。AIやIoTの登場で膨らみ続けるビッグデータの分析を高速化でき、200万件の言語データを対象に実施した「SASH」との比較では約4倍、「FLANN」と比較すると約12.3倍の高速化を確認したという。 NGTを活用することで近似したデータのマッチングを高速化でき、AI技術の精度向上が可能になるほか、フォーマットや入力方法がバラバラの大量のデータを高速に照合することで、企業内で活用し切れていないデータを名寄せし、AIに最適なビッグデータを生
米Microsoftが「BitFunnel」という新しいオープンソースプロジェクトを開始した。同社の検索エンジン「Bing」向けのアルゴリズムをベースとした実験的な情報検索システムで、高速さを特徴とする。現在、早期段階のコードが公開されている。 BitFunnelはBingで利用されている高性能な全文検索システム。キーワード、フレーズ、数学的表現を含むクエリに対してドキュメントを識別・ランク付けするアルゴリズムを持つ。BitFunnelのほか、C++表現「NativeJIT」、JavaおよびLuceneベースのツール「Workbench」の3種類のプロジェクトで構成される。ライセンスはMIT License。 開発チームによると、アルゴリズムの一部をオープンソースにした段階であり、新しいシステムが実際にドキュメントの解析やクエリ処理を行えるようになるにはもう少し時間を要するとしている。今後
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く