タグ

検索に関するmasuiのブックマーク (22)

  • why GNU grep is fast

    Mike Haertel mike at ducky.net Sat Aug 21 03:00:30 UTC 2010 Previous message: Latest intr problems Next message: why GNU grep is fast Messages sorted by: [ date ] [ thread ] [ subject ] [ author ] Hi Gabor, I am the original author of GNU grep. I am also a FreeBSD user, although I live on -stable (and older) and rarely pay attention to -current. However, while searching the -current mailing list f

  • 連想検索エンジン reflexa

    連想検索エンジンreflexa(リフレクサ)はコトバとコトバのつながりを元に未知の情報を探索していくための連想検索エンジンです。連想検索ならではの楽しい検索体験をお楽しみ下さい。

  • WEB素行調査

    アイツのすべてが知りたい・・・ そんなときはbm11情報局にお任せください! 独自のエンジンを搭載した電子の探偵がネット上を駆け巡って あなたの知りたいターゲットの情報を集め、最大18項目の調査結果を表示します。 人名を入力してください。ハンドルネームでもけっこうです。(例:空条承太郎 ウエンツ瑛士 柳澤大輔) ※ターゲットが非常に用心深い人物の場合、情報が集まりにくいことがあります。 また、bm11調査局は常に進化しておりますので、調査のたびに結果が微妙に異なります。 ご了承ください。 ※相手の名を入れると、より真実に近づくかもしれません。 (あなたの秘密は確実にお守りします!)

    masui
    masui 2007/12/29
    Kayacのサービス(?)
  • 国立国会図書館デジタルアーカイブポータル(ndldap)

    リサーチ・ナビ 調査のポイントや参考になる資料・Webサイトなど、調べものに役立つ情報を、テーマや資料の種類に沿って紹介します。

    国立国会図書館デジタルアーカイブポータル(ndldap)
    masui
    masui 2007/10/24
    「わが国のデジタル情報にアクセスする総合的なポータルサイトです。現在、全20種類のアーカイブ内の情報を検索可能です。」
  • グーグル、「ユニバーサル検索」モデルに対応した新デザインのサイトを披露

    UPDATE カリフォルニア州・マウンテンビュー発--Googleが米国時間5月16日、1箇所に多くのメディアに対応した検索結果を表示する「ユニバーサル検索」モデルに対応した新デザインのサイトを披露した。 関連情報を1箇所で簡単に見つけられるユニバーサル検索は、Googleの競合にとっても脅威となる機能である。 ユニバーサル検索を利用すると、ユーザーは画像、動画、ニュース、ニュースアーカイブ、書籍などを別々のページから検索せずに済む。例えば、「Steve Jobs」と入力するだけで、Steve Jobs氏に関するあらゆる情報へのリンクが手に入れられるようになる。 Googleの検索製品およびユーザーエクスペリエンス担当バイスプレジデントMarissa Mayer氏は社で開催したメディアイベントSearchologyで「ユニバーサル検索を介して、われわれはより包括的な検索結果を示せるように

    グーグル、「ユニバーサル検索」モデルに対応した新デザインのサイトを披露
    masui
    masui 2007/05/18
    なんでも一度に検索するというGoogleの新しい技?
  • Adversarial Information Retrieval on the Web (AIRWeb'07)

    masui
    masui 2007/05/11
    論文がWeb公開されている
  • 類書の探し方まとめ - Myrmecoleon in Paradoxical Library. はてな新館

    東北各県版の図書館マップでがんばってるid:natu_nさんが「続き物(シリーズ)の検索もいれないと」と最近動いてる。あとid:bookscannerのところでは最近,AmazonWikipediaの記事の「つながり」を可視化することについての記事が連続してあがっている。 自分とこでも何かに使えないかとそのへんのアイディアをまとめてるんだけど,どうも実装には時間がかかりそうなので,アイディアだけ放出してみた。どうぞご自由にお使いくださいな。ただし利用は自己責任で。 ちなみに主題としてはの関連書の探し方ですが,基的な考え方は論文の検索やWebページの探し方とも共通しています。このへんはレファレンサの基礎の基礎と言えますね。 著者名 要するに同じ著者の書いた。一番スタンダードだが,適合率*1は非常に高め。たいがい同じ人物は似たような主題分野のを書きがちであるという性質を利用。難し

    類書の探し方まとめ - Myrmecoleon in Paradoxical Library. はてな新館
    masui
    masui 2007/03/31
    [[http://pitecan.com/Enzan/ 本棚演算]]が参照されてなかった
  • 2ch Cache Search

    ヤフー経由で2ちゃんねるを検索します。 検索結果リンク先はキャッシュになっているのでdat落ちも安心。 また検索結果からもなるべくdat落ちのものをはじくようにしています。 とは言っても、完全ではないのでそこらへんはご了承下さいませ。 検索例: 知事選、 日経平均、 NHK、 クマー、 らめぇ

    masui
    masui 2007/03/29
    これは便利かも!
  • Selfkleptomaniac — 社内文書の検索システム

    Blogging is a disease: selfkleptomania, your normal condition. About GPG Public Key 思い立って仕事の合間にブラウザから閲覧する社内文書の全文検索システムを作っている。 【ざっとした要件】 ■PDF、Word、ExcelPowerPointのファイルに対応 wvWare、pdftotext、xlhtmlが使える。 ■検索エンジンはSennaを利用 Hyper EstraierとNamazuが候補だった。 前者は付属のCGIが便利だけど改造するのが面倒で、後者は珍しさと真新しさに欠けるので。 技術的な優位性とかは考慮せず。 ludiaが使えるので。 ■ファイルをアップロードするとその場でインデックスを更新 PDFはludiaのマニュアル通りに、他はテキストに変換してINSERT。 ■アップロード処理中はプログ

    masui
    masui 2007/03/25
    Senna / ludia で社内文書検索システムを作った実例
  • http://pitecan.com/EPG/asearch.js

    masui
    masui 2007/03/24
    自分のページをブクマ
  • 招待講演「大規模Webアーカイブの時空間分析とその実際」 - Cafe Babe

    1月22・23日に人工知能学会・知識ベースシステム研究会と電子情報通信学会の知能ソフトウェア工学研究会の共催で研究会があったのだが,「Web情報処理」特集と共に,東京大学から豊田正史助教授を招いて招待講演を企画させて頂いた.豊田助教授は,情報大航海プロジェクトと情報爆発プロジェクトの中心人物である喜連川教授の研究室に属していることからわかるように,これらのプロジェクト技術的基盤を支える人物の一人でもある.この招待講演のスライドは以下の場所で公開されているので,興味がある人は見て頂きたい. http://www.tkl.iis.u-tokyo.ac.jp/~toyoda/bib/papers/kbse-jsai-kbs.pdf 講演に関しては,口頭でかまわないから,普段論文やプレゼン資料に書かないようなこと…たとえば実装の詳細とか,実際の処理時間とか,このようなデータを扱うノウハウとか…も

    招待講演「大規模Webアーカイブの時空間分析とその実際」 - Cafe Babe
    masui
    masui 2007/02/10
    豊田氏の講演記録 by 風間氏
  • [を] Dynamic Programming による類似文字列マッチの実装例

    Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを 素直に Perl で実装したみた。 さらにマッチ箇所取り出しロジックも実装してみた。 DP はいわゆる「類似文字列検索(あいまい検索)」に使うと 便利なアルゴリズム。 実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。 単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、 転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二

    masui
    masui 2007/01/24
    BaezaYates本の曖昧検索アルゴリズム(LCS?)をPerlで実装
  • ITmedia Biz.ID:書店にいるのに、本のタイトルや著者名を思い出せない!を解決

    お目当てのがあって書店に行ったのに、タイトルや著者名、出版社名が分からなくて買えない、という経験をしたことはないだろうか。そんなときに便利な方法を紹介する。 を買おうと書店に行き、すぐにが見つからなくて困ったことはないだろうか。筆者の場合、著者名やのタイトルは大体覚えていても、どこの出版社のか分からない場合に困ることが多い。単行は著者別に並んでいても、文庫や新書は、シリーズごとに並んでいるのが普通だからだ。 著者名や書名を正確に覚えていれば、店員さんに聞けば大抵調べてくれるが、うろ覚えだとちょっと聞きにくい。「保田なんとかさんの、株式のなんとかっていうなんですけど……」などと聞かれても、店員さんは困ってしまうことだろう。 大型書店なら検索用の専用機が置いてあることもあるが、しかし油断はならない。筆者は先日、某書店でタッチパネルの専用機を使おうとしたのだが、どうも相性が悪か

    ITmedia Biz.ID:書店にいるのに、本のタイトルや著者名を思い出せない!を解決
    masui
    masui 2006/12/23
    Amazonのケータイ向けサービスだと曖昧検索してくれるらしい
  • Part2 Google Web APIsでWeb検索プログラミング!

    Webの世界で検索エンジンの代名詞と言えば,Googleです。日語で「ググる」という動詞が使われるほど有名ですよね。 Googleの検索エンジンは,Webページのリンク数に基づいたアルゴリズム(PageRankと呼びます)で検索結果を順位付けしており,その検索結果の確かさと,処理速度の速さは高い評価を受けています。稿では,Googleが提供するサービスの一つである「Google Web APIs」を取り上げて,格的なWeb APIプログラミングを体験します。 Google Web APIは 1回10件,1日1000回の制限がある Google Web APIsは,Googleの検索エンジンをプログラムから利用するためのWeb APIです。検索エンジンを利用できるといっても,1回の検索で10件,1日あたり1000回までという制限が設けられています。日常的な調べ物に使うには足りないかもし

    Part2 Google Web APIsでWeb検索プログラミング!
    masui
    masui 2006/10/16
    ITProの解説
  • NTTデータ公式サイト

    NTTデータ(国内事業会社) 企業情報 プロフィール 社長メッセージ 役員一覧 NTTデータのテクノロジー NTTデータグループ(持株会社) 企業情報 プロフィール 社長メッセージ Our Way 役員一覧 サステナビリティ 沿革 グループ会社 協賛・文化活動 取引先企業の皆様へ NTT DATA, Inc.(海外事業会社) 企業情報

    NTTデータ公式サイト
    masui
    masui 2006/10/13
    [[Senna]]にPostgreSQLの皮をかぶせた(だけの)ものらしい
  • Ajax うきうき Watch 第13回 オンラインゲームで検索の精度を上げる「Google Image Labeler」

    さて、このサービスを試して最初に気付くのは、あまりに低いゲームへの参加障壁でしょう。guestの立場であれば、Webブラウザでアクセスし、ボタン1つでプレイ開始できます。ユーザー登録や、専用ソフトのインストールの手間もありません。プラグインのインストールの手間もありません。とても簡単にゲームを始められます。この手軽さが、とてもAjax的です (このサービスは、Google Web Toolkitで開発されているようです)。 しかし、このサービスの真の価値は、実はそこにはありません。このゲームには、画像検索の精度を上げるという具体的な効能があるのです。ですが、ゲームで検索性能が向上するなどということがあるのでしょうか? 通常の検索はキーワードを入力して、それに一致するテキストを探します。しかし、キーワードから画像を探す検索は、そもそも画像は文字ではないので、キーワードと一致することはありませ

    masui
    masui 2006/10/02
    遊んでると思ったら実は仕事をしていた... というのはうまいやり方。
  • シグマ計画 - 池田信夫 blog

    経済産業省は、「日の丸検索エンジン」について50億円を概算要求することを決めた。これは初年度だけの予算で、総額は300億円といわれる。これについて取材した記者が、経産省の担当者に「過去に第5世代コンピュータやシグマ計画が失敗したことをどう考えているか?」と質問したところ、驚いたことに「知らない」と答えたそうだ。第5世代については、先日の記事でも紹介したので、シグマについてごく簡単にまとめておく。 シグマ計画は、1985年から5年かけて250億円の国費をつぎこみ、国内のコンピュータ・メーカーを集めて、日語で使えるUNIXツールの標準規格をつくろうという計画だったが、これについての通産省の事後評価は存在しない。業界でも、シグマの話はタブーとされており、ウェブにも関連する情報はほとんど出ていない。当事者の話としては、提唱者のインタビューや「被害者」の書いたでふれられている程度である(その他

    masui
    masui 2006/09/02
    情報大航海の八尋俊英という人物はΣ計画の失敗のことをを知らなかったらしい。駄目だこりゃ。
  • 「過去に自分が見たページ」だけから検索する

    「ウノウサーチ」は、ブラウザの履歴を保存しておいて、過去に自分が訪問したページだけを対象に検索できる無料のソフトウェアだ。 「以前見たあのサイトを探しているんだけど、URLを思い出せないし、検索しても見つからない……」「社内イントラネットのあのページにたどり着きたいが、トップページからリンクをたどるのは面倒だ」 こんな経験をした読者は多いのではないだろうか。ウノウが提供するアプリケーション「ウノウサーチ」では、自分が訪問したページの内容をブラウザのキャッシュとは別の場所に記憶しておき、そのページだけを対象に検索する。自分が見たページであれば、一般のWeb検索エンジンでは探せないイントラネットや会員制サイトも検索の対象になる。 ウノウサーチは、これまでウノウのエンジニアによる実験的なサービスの1つとして「ウノウラボ」で提供されてきたが、8月28日から正式版となった。利用は無料で、対応するOS

    「過去に自分が見たページ」だけから検索する
    masui
    masui 2006/08/29
    便利そうだが、どういう原理なんだろう?
  • ITmedia Biz.ID:“情報を読まない”情報収集術――「未読RSS恐怖症」対策

    RSSリーダーの未読記事が膨れ上がり、RSSリーダーを開くのがだんだん嫌になってくるという“恐ろしい”病気への対策とは――。 ブログ時代の情報収集ツールとして、いまや必需品のひとつになった印象もあるRSSリーダー。皆さんはすでにRSSリーダーを利用されているでしょうか。 これまでのWebサーフィンは、基的にWebサイトが更新されているだろうという推測を元にそれぞれのサイトを見てまわるというのが常識でしたが、RSSリーダーを使えば、そのサイトが更新されたかどうかが分かるだけでなく、件名や概要も取得することができます。うまく使えば情報収集力を大幅に増やすことができる、非常に有効なツールだといえるでしょう。 ただ、RSSリーダーに慣れてくると、陥りがちな病気があるんです。 その名も「未読RSS恐怖症」です。RSSリーダーに調子に乗って大量のブログやニュースサイトを登録したことで、毎日更新通知さ

    ITmedia Biz.ID:“情報を読まない”情報収集術――「未読RSS恐怖症」対策
    masui
    masui 2006/08/23
    四六時中RSSリーダを読んでしまう人への対策。mixi対策も必要だ。
  • グーグル、「ググる」の使用に難色

    Googleが、「google someone(だれかについてググる)」といった一般動詞としての同社名の使用を厳重に取り締まる意向を明らかにした。 Googleによると、このような言いまわしは、同社のブランドを傷つける恐れがあるという。 同社の関係者は、「『Google』という言葉を使ってGoogleを使ったインターネット検索を表すことと、『google』という言葉を使ってインターネットの一般的な検索処理を表すこととは明確に区別することが重要だと思う。商標に関する深刻な問題が絡んでいる」と述べている。 言語学の権威であるレスター大学のJulie Coleman氏は、Googleの懸念に理解を示している。 「商標が一般的に利用されると、その名声は失われてしまう。したがって、Googleの主張は理解できる。彼らは検索以外のこともいろいろやっているため、自分たちのブランド名がこの分野に限定されて

    グーグル、「ググる」の使用に難色
    masui
    masui 2006/08/20
    ネタか...