[B! 検索] masuiのブックマーク

why GNU grep is fast

Mike Haertel mike at ducky.net Sat Aug 21 03:00:30 UTC 2010 Previous message: Latest intr probl ems Next message: why GNU grep is fast Messages sorted by: [ date ] [ thread ] [ subject ] [ author ] Hi Gabor, I am the original author of GNU grep. I am also a FreeBSD user, although I live on -stable (and older) and rarely pay attention to -current. However, while searching the -current mailing list f

masui 2010/08/24

リンク

連想検索エンジン reflexa

連想検索エンジンreflexa（リフレクサ）はコトバとコトバのつながりを元に未知の情報を探索していくための連想検索エンジンです。連想検索ならではの楽しい検索体験をお楽しみ下さい。

masui 2009/06/25

リンク

WEB素行調査

アイツのすべてが知りたい･･･そんなときはbm11情報局にお任せください！独自のエンジンを搭載した電子の探偵がネット上を駆け巡ってあなたの知りたいターゲットの情報を集め、最大18項目の調査結果を表示します。人名を入力してください。ハンドルネームでもけっこうです。（例：空条承太郎ウエンツ瑛士柳澤大輔） ※ターゲットが非常に用心深い人物の場合、情報が集まりにくいことがあります。また、bm11調査局は常に進化しておりますので、調査のたびに結果が微妙に異なります。ご了承ください。 ※相手の本名を入れると、より真実に近づくかもしれません。（あなたの秘密は確実にお守りします！）

masui 2007/12/29

Kayacのサービス(?)

リンク

国立国会図書館デジタルアーカイブポータル(ndldap)

リサーチ・ナビ調査のポイントや参考になる資料・Webサイトなど、調べものに役立つ情報を、テーマや資料の種類に沿って紹介します。

masui 2007/10/24

「わが国のデジタル情報にアクセスする総合的なポータルサイトです。現在、全20種類のアーカイブ内の情報を検索可能です。」

リンク

グーグル、「ユニバーサル検索」モデルに対応した新デザインのサイトを披露

UPDATE　カリフォルニア州・マウンテンビュー発--Googleが米国時間5月16日、1箇所に多くのメディアに対応した検索結果を表示する「ユニバーサル検索」モデルに対応した新デザインのサイトを披露した。関連情報を1箇所で簡単に見つけられるユニバーサル検索は、Googleの競合にとっても脅威となる機能である。ユニバーサル検索を利用すると、ユーザーは画像、動画、ニュース、ニュースアーカイブ、書籍などを別々のページから検索せずに済む。例えば、「Steve Jobs」と入力するだけで、Steve Jobs氏に関するあらゆる情報へのリンクが手に入れられるようになる。 Googleの検索製品およびユーザーエクスペリエンス担当バイスプレジデントMarissa Mayer氏は本社で開催したメディアイベントSearchologyで「ユニバーサル検索を介して、われわれはより包括的な検索結果を示せるように

masui 2007/05/18

なんでも一度に検索するというGoogleの新しい技?

リンク

Adversarial Information Retrieval on the Web (AIRWeb'07)

masui 2007/05/11

論文がWeb公開されている

リンク

類書の探し方まとめ - Myrmecoleon in Paradoxical Library. はてな新館

東北各県版の図書館マップでがんばってるid:natu_nさんが「続き物（シリーズ）の検索もいれないと」と最近動いてる。あとid:bookscannerのところでは最近，Amazonの本やWikipediaの記事の「つながり」を可視化することについての記事が連続してあがっている。自分とこでも何かに使えないかとそのへんのアイディアをまとめてるんだけど，どうも実装には時間がかかりそうなので，アイディアだけ放出してみた。どうぞご自由にお使いくださいな。ただし利用は自己責任で。ちなみに主題としては本の関連書の探し方ですが，基本的な考え方は論文の検索やWebページの探し方とも共通しています。このへんはレファレンサの基礎の基礎と言えますね。著者名要するに同じ著者の書いた本。一番スタンダードだが，適合率*1は非常に高め。たいがい同じ人物は似たような主題分野の本を書きがちであるという性質を利用。難し

masui 2007/03/31

[[http://pitecan.com/Enzan/ 本棚演算]]が参照されてなかった

リンク

2ch Cache Search

ヤフー経由で２ちゃんねるを検索します。検索結果リンク先はキャッシュになっているのでdat落ちも安心。また検索結果からもなるべくdat落ちのものをはじくようにしています。とは言っても、完全ではないのでそこらへんはご了承下さいませ。検索例：知事選、日経平均、 NHK、クマー、らめぇ

masui 2007/03/29

これは便利かも!

リンク

Selfkleptomaniac — 社内文書の検索システム

Blogging is a disease: selfkleptomania, your normal condition. About GPG Public Key 思い立って仕事の合間にブラウザから閲覧する社内文書の全文検索システムを作っている。【ざっとした要件】 ■PDF、Word、Excel、PowerPointのファイルに対応 wvWare、pdftotext、xlhtmlが使える。 ■検索エンジンはSennaを利用 Hyper EstraierとNamazuが候補だった。前者は付属のCGIが便利だけど改造するのが面倒で、後者は珍しさと真新しさに欠けるので。技術的な優位性とかは考慮せず。 ludiaが使えるので。 ■ファイルをアップロードするとその場でインデックスを更新 PDFはludiaのマニュアル通りに、他はテキストに変換してINSERT。 ■アップロード処理中はプログ

masui 2007/03/25

Senna / ludia で社内文書検索システムを作った実例

リンク

http://pitecan.com/EPG/asearch.js

masui 2007/03/24

自分のページをブクマ

リンク

招待講演「大規模Webアーカイブの時空間分析とその実際」 - Cafe Babe

1月22・23日に人工知能学会・知識ベースシステム研究会と電子情報通信学会の知能ソフトウェア工学研究会の共催で研究会があったのだが，「Web情報処理」特集と共に，東京大学から豊田正史助教授を招いて招待講演を企画させて頂いた．豊田助教授は，情報大航海プロジェクトと情報爆発プロジェクトの中心人物である喜連川教授の研究室に属していることからわかるように，これらのプロジェクトの技術的基盤を支える人物の一人でもある．この招待講演のスライドは以下の場所で公開されているので，興味がある人は見て頂きたい． http://www.tkl.iis.u-tokyo.ac.jp/~toyoda/bib/papers/kbse-jsai-kbs.pdf 講演に関しては，口頭でかまわないから，普段論文やプレゼン資料に書かないようなこと…たとえば実装の詳細とか，実際の処理時間とか，このようなデータを扱うノウハウとか…も

masui 2007/02/10

豊田氏の講演記録 by 風間氏

リンク

[を] Dynamic Programming による類似文字列マッチの実装例

Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを素直に Perl で実装したみた。さらにマッチ箇所取り出しロジックも実装してみた。 DP はいわゆる「類似文字列検索（あいまい検索）」に使うと便利なアルゴリズム。実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二

masui 2007/01/24

BaezaYates本の曖昧検索アルゴリズム(LCS?)をPerlで実装

リンク

ITmedia Biz.ID：書店にいるのに、本のタイトルや著者名を思い出せない！を解決

お目当ての本があって書店に行ったのに、タイトルや著者名、出版社名が分からなくて買えない、という経験をしたことはないだろうか。そんなときに便利な方法を紹介する。本を買おうと書店に行き、すぐに本が見つからなくて困ったことはないだろうか。筆者の場合、著者名や本のタイトルは大体覚えていても、どこの出版社の本か分からない場合に困ることが多い。単行本は著者別に並んでいても、文庫本や新書本は、シリーズごとに並んでいるのが普通だからだ。著者名や書名を正確に覚えていれば、店員さんに聞けば大抵調べてくれるが、うろ覚えだとちょっと聞きにくい。「保田なんとかさんの、株式のなんとかっていう本なんですけど……」などと聞かれても、店員さんは困ってしまうことだろう。大型書店なら検索用の専用機が置いてあることもあるが、しかし油断はならない。筆者は先日、某書店でタッチパネルの専用機を使おうとしたのだが、どうも相性が悪か

masui 2006/12/23

Amazonのケータイ向けサービスだと曖昧検索してくれるらしい

リンク

Part2　Google Web APIsでWeb検索プログラミング！

Webの世界で検索エンジンの代名詞と言えば，Googleです。日本語で「ググる」という動詞が使われるほど有名ですよね。 Googleの検索エンジンは，Webページのリンク数に基づいたアルゴリズム（PageRankと呼びます）で検索結果を順位付けしており，その検索結果の確かさと，処理速度の速さは高い評価を受けています。本稿では，Googleが提供するサービスの一つである「Google Web APIs」を取り上げて，本格的なWeb APIプログラミングを体験します。 Google Web APIは 1回10件，1日1000回の制限がある Google Web APIsは，Googleの検索エンジンをプログラムから利用するためのWeb APIです。検索エンジンを利用できるといっても，1回の検索で10件，1日あたり1000回までという制限が設けられています。日常的な調べ物に使うには足りないかもし

masui 2006/10/16

ITProの解説

リンク

NTTデータ公式サイト

NTTデータ（国内事業会社）企業情報プロフィール社長メッセージ役員一覧 NTTデータのテクノロジー NTTデータグループ（持株会社）企業情報プロフィール社長メッセージ Our Way 役員一覧サステナビリティ沿革グループ会社協賛・文化活動取引先企業の皆様へ NTT DATA, Inc.（海外事業会社）企業情報

masui 2006/10/13

[[Senna]]にPostgreSQLの皮をかぶせた(だけの)ものらしい

検索
NTT

リンク

Ajax うきうき Watch 第13回　オンラインゲームで検索の精度を上げる「Google Image Labeler」

さて、このサービスを試して最初に気付くのは、あまりに低いゲームへの参加障壁でしょう。guestの立場であれば、Webブラウザでアクセスし、ボタン1つでプレイ開始できます。ユーザー登録や、専用ソフトのインストールの手間もありません。プラグインのインストールの手間もありません。とても簡単にゲームを始められます。この手軽さが、とてもAjax的です（このサービスは、Google Web Toolkitで開発されているようです）。しかし、このサービスの真の価値は、実はそこにはありません。このゲームには、画像検索の精度を上げるという具体的な効能があるのです。ですが、ゲームで検索性能が向上するなどということがあるのでしょうか？通常の検索はキーワードを入力して、それに一致するテキストを探します。しかし、キーワードから画像を探す検索は、そもそも画像は文字ではないので、キーワードと一致することはありませ

masui 2006/10/02

遊んでると思ったら実は仕事をしていた... というのはうまいやり方。

リンク

シグマ計画 - 池田信夫 blog

経済産業省は、「日の丸検索エンジン」について50億円を概算要求することを決めた。これは初年度だけの予算で、総額は300億円といわれる。これについて取材した記者が、経産省の担当者に「過去に第5世代コンピュータやシグマ計画が失敗したことをどう考えているか？」と質問したところ、驚いたことに「知らない」と答えたそうだ。第5世代については、先日の記事でも紹介したので、シグマについてごく簡単にまとめておく。シグマ計画は、1985年から5年かけて250億円の国費をつぎこみ、国内のコンピュータ・メーカーを集めて、日本語で使えるUNIXツールの標準規格をつくろうという計画だったが、これについての通産省の事後評価は存在しない。業界でも、シグマの話はタブーとされており、ウェブにも関連する情報はほとんど出ていない。当事者の話としては、提唱者のインタビューや「被害者」の書いた本でふれられている程度である（その他

masui 2006/09/02

情報大航海の八尋俊英という人物はΣ計画の失敗のことをを知らなかったらしい。駄目だこりゃ。

リンク

「過去に自分が見たページ」だけから検索する

「ウノウサーチ」は、ブラウザの履歴を保存しておいて、過去に自分が訪問したページだけを対象に検索できる無料のソフトウェアだ。「以前見たあのサイトを探しているんだけど、URLを思い出せないし、検索しても見つからない……」「社内イントラネットのあのページにたどり着きたいが、トップページからリンクをたどるのは面倒だ」こんな経験をした読者は多いのではないだろうか。ウノウが提供するアプリケーション「ウノウサーチ」では、自分が訪問したページの内容をブラウザのキャッシュとは別の場所に記憶しておき、そのページだけを対象に検索する。自分が見たページであれば、一般のWeb検索エンジンでは探せないイントラネットや会員制サイトも検索の対象になる。ウノウサーチは、これまでウノウのエンジニアによる実験的なサービスの1つとして「ウノウラボ」で提供されてきたが、8月28日から正式版となった。利用は無料で、対応するOS

masui 2006/08/29

便利そうだが、どういう原理なんだろう?

検索

リンク

ITmedia Biz.ID：“情報を読まない”情報収集術――「未読RSS恐怖症」対策

RSSリーダーの未読記事が膨れ上がり、RSSリーダーを開くのがだんだん嫌になってくるという“恐ろしい”病気への対策とは――。ブログ時代の情報収集ツールとして、いまや必需品のひとつになった印象もあるRSSリーダー。皆さんはすでにRSSリーダーを利用されているでしょうか。これまでのWebサーフィンは、基本的にWebサイトが更新されているだろうという推測を元にそれぞれのサイトを見てまわるというのが常識でしたが、RSSリーダーを使えば、そのサイトが更新されたかどうかが分かるだけでなく、件名や概要も取得することができます。うまく使えば情報収集力を大幅に増やすことができる、非常に有効なツールだといえるでしょう。ただ、RSSリーダーに慣れてくると、陥りがちな病気があるんです。その名も「未読RSS恐怖症」です。RSSリーダーに調子に乗って大量のブログやニュースサイトを登録したことで、毎日更新通知さ

masui 2006/08/23

四六時中RSSリーダを読んでしまう人への対策。mixi対策も必要だ。

検索
RSS

リンク

グーグル、「ググる」の使用に難色

Googleが、「google someone（だれかについてググる）」といった一般動詞としての同社名の使用を厳重に取り締まる意向を明らかにした。 Googleによると、このような言いまわしは、同社のブランドを傷つける恐れがあるという。同社の関係者は、「『Google』という言葉を使ってGoogleを使ったインターネット検索を表すことと、『google』という言葉を使ってインターネットの一般的な検索処理を表すこととは明確に区別することが重要だと思う。商標に関する深刻な問題が絡んでいる」と述べている。言語学の権威であるレスター大学のJulie Coleman氏は、Googleの懸念に理解を示している。「商標が一般的に利用されると、その名声は失われてしまう。したがって、Googleの主張は理解できる。彼らは検索以外のこともいろいろやっているため、自分たちのブランド名がこの分野に限定されて

masui 2006/08/20

ネタか...

リンク

はてなブックマーク

タグ

関連タグで絞り込む (33)

検索に関するmasuiのブックマーク (22)

お知らせ

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

今週のはてなブックマーク数ランキング（2024年5月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス