タグ

searchに関するlabduckのブックマーク (19)

  • List.js

    List.js v2.3.1 Tiny, invisible and simple, yet powerful and incredibly fast vanilla JavaScript that adds search, sort, filters and flexibility to plain HTML lists, tables, or anything. Hi! I'm Jonny and the author of List.js. I hope you like the lib. I’ve put a lot of hours into it! Feel free to follow me on Twitter and GitHub for news and donate a coffee for good karma ;) Follow @javve Donate a c

  • meanpath.com

    Skip to content And one. Tomatoe soup is onsale again! Search for:

    labduck
    labduck 2013/07/23
    HTMLのソースレベルで検索ができるサービス
  • Ruby on Rails + MySQL で全文検索 - ドワンゴ 研究開発ブログ

    このエントリでは Ruby on RailsMySQL を使って日語の全文検索を行う方法を記述する。Ruby on Rails のバージョンは 2.0.2、MySQL のバージョンは 5.0.67、Tritonn のバージョンは 1.0.12、Hyper Estraier のバージョンは 1.4.10 を使用した。サンプルの文章データとして、あらゆる日人にとって極めて身近な著作権切れ文章である『ドグラ・マグラ』と『黒死館殺人事件』を利用した。処理のために整形したデータはエントリに添付しておく。またデータベースへアクセスするコードではマイグレーションを除きできるだけベンチマークを取るようにし、その結果はエントリの最後に記載する。 ページネーション Rails でページネーションを実現する will_paginate という plugin は ActiveRecord に標準でつ

  • キーワードマッチではなくアクセス履歴でファイルを検索するというアイデア:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ

    昨日に引き続いて情報爆発時代プロジェクトの成果報告会とその展示&デモを見にいっての感想。 2日目の午前中に気になったのは、国立情報学研究所の神門先生らの「探索・学習のための情報アクセス技術」と東京工業大学の横田先生らの「大量非構造データ間の概念構造を考慮した論理的探索ビューに関する研究」の2つ。 「探索・学習のための情報アクセス技術」は実際に画面をみてちょっと触ってみたのだが、探索性能と言うよりはナビゲーションの仕方、具体的に言うとディスプレイ内で複数のウィンドウを開いて探索範囲の絞り込みや検索条件の切り替えを随時提案していくインターフェースが面白かった。 そういえばPCのディスプレイも昔よりも大画面化が進んでいるしマルチディスプレイで仕事をする人も増えて来ている。でもそういう大画面や複数画面を徹底的に利用するような探索インターフェースってあまり見たことが無かった。 メインビューで絞り込ん

    キーワードマッチではなくアクセス履歴でファイルを検索するというアイデア:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ
  • MOONGIFT: � 進化したディレクトリ型検索サイト「FreeGlobes」:オープンソースを毎日紹介

    かつてサイトの検索エンジンと言えば、ロボット型よりもディレクトリ型のが主流だった。現在はロボットの性能が向上したため、Web検索エンジンと言えばロボット型がスタンダードだ。 管理画面 とは言え、あるカテゴリに属するサイトなどを集約して紹介する際など、まだまだディレクトリ型の利用ケースは数多く存在する。そこに登場したのがこのソフトウェアだ。 今回紹介するオープンソース・ソフトウェアはFreeGlobes、ディレクトリ型検索エンジンの進化版だ。 FreeGlobesははじめにカテゴリを登録しておき、それ以下にサイトやサブディレクトリを登録していくタイプの検索エンジンだ。タグやサムネイル画像を貼付けたり、フィードを読み込んで表示、コメントや投票ができるといった機能が今風になっている。 カテゴリ一覧 個人的にFreeGlobesが凄いと思うのは、何もサイトの登録だけに限らず利用できる可能性がある点

    MOONGIFT: � 進化したディレクトリ型検索サイト「FreeGlobes」:オープンソースを毎日紹介
  • Podcastle

    Podcastle (ポッドキャッスル) とは Podcastle は、ポッドキャストの音声を日語で検索できるサービスです。音声認識技術によって音声を文字に変換しています。その認識誤りは、ユーザが自由に訂正できます。詳しくは「Podcastleとは」をご覧下さい。

  • 第15回 テキスト情報の抽出[その2] | gihyo.jp

    前回は、テキストファイルとHTMLファイルからテキスト情報を抽出する方法について解説しました。今回はMicrosoft Word等に代表されるアプリケーション固有の文書ファイルからテキスト情報を抽出する方法についてとりあげます。 アプリケーション固有の文書ファイル型式 世の中のアプリケーションの多くは、それぞれ固有のファイル型式で情報を保存しています。たとえば、Microsoft Wordは拡張子.docや.docxのファイル型式、Adobe Acrobatは拡張子.pdfのファイル型式という具合です。そして、各アプリケーションの固有のファイル型式仕様は、オープンになっているものもあれば、アプリケーションベンダがまったく公開していないものもあります。 仕様がオープンになっている文書ファイル型式のファイルからテキスト情報を抽出するには、公開仕様に基づいて文書ファイルを解析し、ファイルの中から

    第15回 テキスト情報の抽出[その2] | gihyo.jp
  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
  • 検索エンジン相関図 2008年1月版|αSEO(アルファSEO)

    検索エンジン相関図 2008年1月版。検索連動型広告の掲載パートナー、ロボット型検索エンジンの主要な提携先等をまとめています。今月からPCとモバイルのコンテンツ連動型広告相関図を追加しました。 PC 検索エンジン 主な動き 今回はロボット型、ディレクトリ型、検索連動型ともに大きな変更はありません。ただし、ウェブ検索の2強、Yahoo!Googleは検索利用者の意図を汲んだ機能の改良を行っています。 Yahoo!は検索キーワードがYahoo!ニュース内の記事と合致し、かつユーザーがリアルタイム情報を求めていると判断される場合にウェブ検索結果にニュース記事へのリンクを表示するようになっています。また、Googleは地域系キーワードと組み合わせて検索した時に、ウェブ検索結果上に地図と地域情報、口コミへのリンクを表示しています。特にGoogleはユーザーの意図に適したデジタルコンテンツを表示する

    検索エンジン相関図 2008年1月版|αSEO(アルファSEO)
  • Google Japan Blog: 大規模日本語 n-gram データの公開

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • livedoor Developers Blog:String::Trigram でテキストの類似度を測る - livedoor Blog(ブログ)

    こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開発が開始されたともいう、分社化前の芸風の名残で、キーワードの検索結果にはユーザが自由に解説を書き込める Wikipedia 的スペースもついています。 で、この解説部分に、さまざまなサイトから文章をまる写ししちゃう人がとても多いのですね。 特に多いウィキペディア日語版からの剽窃を防止するために、livedoor キーワードでは以下のような対策を講じることにしました。 ウィキペディア日語版の解説

  • Clusty the Clustering Engine

    This domain may be for sale!

    labduck
    labduck 2007/10/09
    クラスタ
  • エンタープライズサーチ

    検索が企業に与えるインパクトに着目しよう 国内1000サーバ超の実績から学ぶ失敗しないエンタープライズサーチ導入 企業向け検索、いわゆるエンタープライズサーチを導入して成功を収める企業が出る一方、未導入の企業においてはその価値に対する理解が進んでいないのも現状だ。今回は、1000サーバを超える国内導入実績をもとにエンタープライズサーチの必要性と失敗しない選び方についてご紹介する。 ATOKの日語処理能力を活用した「ConceptBase」 人と対話するように目的のドキュメントを探し出す 似ている言葉もOK、意味が近い文書もOK。1つのキーワードからドキュメントの中身にまで踏み込んだ検索を行ってくれるのが「ConceptBase」だ。文字入力が面倒、検索結果が膨大すぎて、絞り込みができないという現場の声を解決できる実践型ソリューションだ。 独自理論のサーチで世界シェアナンバーワン「IDOL

    エンタープライズサーチ
  • 検索意図の4分類と便利な「キーワード分類表」の実例 | Moz - SEOとインバウンドマーケティングの実践情報

    さあ、今日は全世界で10億人に及ぶ検索エンジンユーザーの深層心理に迫って、彼らが検索エンジンを使う動機をより包括的に探ってみよう。この(疑似)心理学的な洞察は、ターゲティングやクリック率、広告配信などの視野を広げ、相対的価値まで把握する一助になるかもしれない。 まず、検索エンジンとはツールであることを理解しておく必要がある。つまり、何かの意図をもって用いるリソースだってことだ。検索ボックスを使うのは、ブックマークからIHT.comやredditSEOmozなどのサイトにアクセスするのと質的に違うんだよね。StumbleUponツールバーの「stumble」ボタンをクリックしたり、お気に入りのブログにアクセスするのとも違う。検索とは、その背景に「何かを見つけたい」という直接的な意図があるんだ。この「何か」を、以下のように分類してみたので、いっしょに見ていこう。 ナビゲーション型の検索 ナ

    検索意図の4分類と便利な「キーワード分類表」の実例 | Moz - SEOとインバウンドマーケティングの実践情報
  • ブラウザからの政府資料検索

    http://websearch.e-gov.go.jp/cgi-bin/common.cgi?CONFFILENAME=common.conf.J&TEMPLATE=keyword_list_J1.html&Search_Object=TCEGOV&Search_Type=NEW&Search_QueryRule=%28+%40content%3A%3D%24Search_Query%5B%24Search_Ope%5D+%7C+%40title%3A%3D%24Search_Query%5B%24Search_Ope%5D+%29+%26+%40gj%3A%3D%24SYO%5BO%5D+%26+%40cc%3A%3D%24KKN2%5BO%5D+%26+%40cc%3A%3D%24KEN2%5BO%5D+%26+%40cc%3A%3D%24Kikan_Kubun%5BO%5D+%26

  • 第1回 社内版“Google”の正しい作り方

    エンタープライズ・サーチ製品はこの1~2年,ぐんと充実してきた。並行して,国内での導入事例も徐々に増えつつある。「社内のシステムを横断的に探し,欲しい情報を何でも即座に取り出せる」。グループウエアや社内Webサーバーなどの広がりとともに,検索機能へのニーズは着実に高まっている。 個々のユーザーが勝手気ままにフォルダを作り,ファイルを保存してゴミためのようになってしまっているファイル・サーバー,膨大な数の文書が書き込まれているグループウエアや社内Webサーバー,玉石混交のイントラブログ/SNS──。いまや,企業内では数多くのサーバーが稼働し,大量の情報が分散している。その文書の合計数は,必要なデータを探し出すことが難しいと感じられるほどにまで膨れあがっている。 こうした状況下で重要性を増しているのが「エンタープライズ・サーチ」である。いわば社内版の“Google”だ。キーワードをいくつか指定

    第1回 社内版“Google”の正しい作り方
  • 全文検索システム Hyper Estraier

    概要 Hyper Estraierは全文検索システムです。たくさんの文書の中から、特定の語句を含むものを探して、該当するものの一覧を表示することができます。Webサイトを運営している方なら、自分のサイト専用の検索エンジンとして利用することができます。メールボックスやファイルサーバを対象とした検索ツールとして利用することもできます。 Hyper Estraierには、次のような特徴があります。 インデックスを使った高速な検索ができます。 大量の文書のインデックスを短時間で作成できます。 N-gram方式による漏れのない検索ができます。 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます。 フレーズ検索や正規表現検索や属性検索や類似検索をサポートします。 世界各国の言語が扱えます。 対象文書の所在や形式に依存しません。 賢いWebクローラが付属しています。 ライブラリとして各種

  • OSM記事:新世代検索エンジン大集合

    このページは、オープンソースマガジン2006年4月号の第2特集「新世代検索エンジン大集合」に寄稿した記事の校正前の版です。 超弩級全文検索システムHyper Estraier 巷で話題の全文検索システムHyper Estraier。Webサイトやデスクトップの検索システムとして使えることはもちろん、ライブラリとして様々な用途に使うことができます。稿ではその特徴を説明し、導入から応用までを案内します。 Hyper Estraierのススメ O型のあなた、デスクトップにウンザリするほどのファイルが散らかっていませんか? A型のあなた、フォルダで整理したつもりが、階層が深すぎて毎回探すのが面倒になっていませんか? B型のあなた、人から貰ったファイルの保存場所を忘れて何度も再送してもらうことはありませんか? AB型のあなた、メーリングリストやメールマガジンに登録しすぎてメーラを開くと大変なことに

  • MySQL FULLTEXT Ngram : LIKE検索より数十倍高速な、お手軽 日本語全文検索 について|blog|たたみラボ

    tatamilab.jp

  • 1