タグ

検索に関するamringのブックマーク (17)

  • Cuil

    Query by Category Find pages that referrence concepts in a category. For example, use "category: american-presidents" to search for pages that talk about Presidents of the USA. More Information

  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • i-revo お客様サポート 重要なお知らせ

    i-revo お客様サポート 重要なお知らせ i-revoマイポータル終了のお知らせ(2017年3月31日) 日頃よりi-revoマイポータルをご愛顧いただき誠にありがとうございます。 このたび、当サイトは2017年3月31日付けにてサービスを終了いたしました。 併せて「プニマル」、「i-revo 占い」についてもサービスを終了いたしました。 2006年3月のサービス開始以来、 お客様および関係各社の皆様にはさまざまに、ご協力をいただきました。 ここに御礼申し上げます。 i-revoマイポータルのサービス終了につきまして、なにとぞご理解いただきたく存じます。 今後とも「i-revo」をよろしくお願い申し上げます。 全て見る

  • 検索エンジン相関図 2008年1月版|αSEO(アルファSEO)

    検索エンジン相関図 2008年1月版。検索連動型広告の掲載パートナー、ロボット型検索エンジンの主要な提携先等をまとめています。今月からPCとモバイルのコンテンツ連動型広告相関図を追加しました。 PC 検索エンジン 主な動き 今回はロボット型、ディレクトリ型、検索連動型ともに大きな変更はありません。ただし、ウェブ検索の2強、Yahoo!Googleは検索利用者の意図を汲んだ機能の改良を行っています。 Yahoo!は検索キーワードがYahoo!ニュース内の記事と合致し、かつユーザーがリアルタイム情報を求めていると判断される場合にウェブ検索結果にニュース記事へのリンクを表示するようになっています。また、Googleは地域系キーワードと組み合わせて検索した時に、ウェブ検索結果上に地図と地域情報、口コミへのリンクを表示しています。特にGoogleはユーザーの意図に適したデジタルコンテンツを表示する

    検索エンジン相関図 2008年1月版|αSEO(アルファSEO)
  • CloudMap - 直感型「3次元」コンテンツ検索

    自律神経失調症の治療費は、現役世代なら3割負担で済みます。自営業の方なら国民健康保険、会社に勤めている方なら社会保険が適用されるので、治療費は実際にかかる金額の3割を払うだけで良いのです。でも、実際に自律神経失調症にかかる費用はどのくらいなのでしょうか。 自律神経失調症の治療には、数ヶ月~5年以上かかる人まで実に様々です。医師による診察料は、1回につき2,000~4,000円です。これにカウンセリング料5,000~10,000円、漢方薬1か月分5,000~10,000円、鍼灸治療2,000~5,000円が組み合わされます。いずれも医師が必要と認めた場合は、治療費の負担は3割で済むので、1回の来院で1万円以上かかるということはほとんどありません。 しかし、病気中の人には痛い出費かもしれません。もし自律神経失調症の治療費の捻出が難しいようであるのならば、公的な扶助の自立支援医療費制度に頼ってみ

  • 辞書不要の形態素解析エンジン「マリモ」とは − @IT

    2007/08/15 検索サービスを提供するベンチャー企業のムーターは8月1日、辞書を必要としない形態素解析エンジン「マリモ」の提供を開始した。従来、形態素解析では品詞情報を含む日語辞書を用意するのが常識だったが、マリモでは、そうした辞書を不要とした。新技術のアプローチと特性について、開発元のムーターに話を聞いた。 統計処理で単語部分を推定 形態素解析とは、与えられた文を、文法上意味のある最小の単位(形態素)に区切る処理。「今日は晴れています」なら、「今日(名詞)/は(助詞)/晴れ(動詞)/て(助詞)/い(助詞)/ます(助動詞)」と分ける。検索エンジンをはじめ、さまざまな自然言語処理の場面で必要となる基礎技術だ。 形態素解析を行うには、あらかじめ品詞情報が付加された数十万語からなる辞書を用意する必要がある。また、新語や造語、専門用語に対応するには、個別に人力で単語を登録する必要がある。

  • SEO的な情報がまとめて手に入る検索エンジン『ピタゴラス』 | P O P * P O P

    なかなか便利そうな検索エンジンが登場したようです。 サイトのSEO的情報がまとめて見られるツールです。どのサイトがどう強いのかを知るのに便利そうですね。広告出稿を考えている企業の方にとってはかなり使えるのではないでしょうか。 以下に簡単にご紹介。 ↑ トップページはGoogleライク。キーワードかURL直接指定かで検索します。 ↑ とりあえず「百式」で検索。がんばっていますねぇ、100SHIKI.COMw。 ↑ さらに詳しく、をクリックするとこのような画面に。頻出単語一覧などが参考になりますね。 ↑ 画面の下のほうにはさらに詳細な情報が並びます。 データはYahoo! JAPAN検索のものを使っているようですね。ご興味のある方は以下よりどうぞ。 » Pythagoras(ピタゴラス)

  • OSS Message Pedia

    さあ、始めよう オープンソースプロダクトのメッセージを検索できます。あなたが使用しているソフトウェアのエラーメッセージの対処方法が分かります。 調査して欲しいメッセージ 153(ja) [4] Debug: sleeping function called from invalid context at : [1 month ago] 84(ja) [3] request_module: runaway loop modprobe [18 days ago] 5356(ja) [3] : VFS is out of sync with lock manager! [1 month ago] 22473(ja) [3] : dma_timer_expiry: dma status == 0x [3 months ago] 13057(ja) [3] tty_check_change: tty

  • 見つけて得するソースコード専用の検索エンジン - @IT

    Java News.jp(Javaに関する最新ニュース)」の安藤幸央氏が、CoolなプログラミングのためのノウハウやTIPS、筆者の経験などを「Rundown」(駆け足の要点説明)でお届けします。(編集部) プログラミングと検索エンジンは切っても切れない プログラミングと検索エンジンの関係は切っても切り離せないものです。プログラミングに役立つドキュメントやノウハウを探したり、参考になるサンプルプログラムを見つけ出せます。 さらにバグの回避方法を見つけたり、エラーメッセージを検索エンジンで探して、解決方法が見つかることも多いでしょう。良質のソースコードから、的確なアルゴリズムや、思いもしなかったようなコード例を見いだすのも新たな楽しみです。 さて、ここではプログラミングの際に便利に利用できるソースコード専用の検索エンジンをいくつか紹介しましょう。ソースコード専用の検索エンジンを利用した検索

    見つけて得するソースコード専用の検索エンジン - @IT
  • JavaScriptによる全文検索エンジン - llameradaの日記

    JavaScriptでインデックス型の全文検索エンジンを作ってみた。全文検索エンジンを作る際に問題となるのは、インデックスデータを部分的に読み込む方法である。通常はmmapやpreadなどを使ってファイルの一部を部分的に読み込むのだが、もちろん、ブラウザには使えない。ブラウザでファイルの一部分を読み込むには2通りの方法がある。1つは、ファイルを多数のファイルに分割する方法であり、もう1つはHTTPリクエストのRangeヘッダを利用して、ファイルの一部を取得する方法である。前者の利点は、ブラウザのキャッシュが効くことや、対応ブラウザが多いことである。後者の利点は、ファイル数が少なくなるので、インデックスの管理が容易になることである。今回はRangeヘッダの実用性にも興味があったので、後者の方法を用いた。 参考ページ:最速インターフェース研究会 :: Ajaxを使ったシンプルなチャット 転置イ

    JavaScriptによる全文検索エンジン - llameradaの日記
  • Expired

    Expired:掲載期限切れです この記事は,ダウ・ジョーンズ・ジャパンとの契約の掲載期限(90日間)を過ぎましたのでサーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。

  • ソーシャルネットワーキング.jp: googleを超える検索2.0サイトたち

    googleを超える検索2.0サイトたち AI Favored Search 2.0 Solution Read/WriteWebの読者が選ぶ「検索2.0」のコンセプト。 人工知能の期待が高いですね。 人工知能:HakiaやPowerset 人力検索:del.icio.usやChaCha バーティカル検索:SimplyHiredやTechnorati パーソナル検索:Collarity クラスタリング:ClustyやSearchMash ソーシャル検索:EureksterやRollyo 可視化:Quintura やKartoo プレビュー:SnapやLive Image Search 日ではとりあえずsnapは見かける機会が増えました。technoratiも便利です。EureksterのようなSNS+検索サイトはもう少しあっても良い気もします。 googleを超えるサイトはここからでて

  • メディア・パブ: Wikipediaベースの検索サービスが開始,Googleを脅かすかも

    Wikipediaベースの検索サービス(β版)が始まった。検索対象を,Wikipediaページと,Wikipediaページからリンクが張られているページに限定することにより,絞り込みを行っているのが特徴だ。Wikipedia投稿者が,実際に引用したページだけを検索対象にしているため,雑音情報のフィルタリングが期待できる。以下は,About Wikiseekの原文。About Wikiseek The contents of Wikiseek are restricted to Wikipedia pages and only those sites which are referenced within Wikipedia, making it an authoritative source of information less subject to spam and SEO schem

  • どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup

    Webの全体像を効率よく取り込み,分類する 「YSTのシステムは大まかに三つの機能に分かれます(図2)。最初は世界中のWebページをYSTのシステムに取り込む『クローリング(crawling)』という機能です」(Yahoo! JAPAN,リスティング事業部 検索企画室の宮崎光世氏,以下同)。 取り込むと簡単に言っても,Webページの数は膨大なうえ,更新の頻度や情報の質などがまちまちです。すべてのページに同じようにアクセスしていると非効率なことこの上ありません。そこで,限られた時間で質の良い検索ができるようにするための工夫をしています。例えば,クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす,といったことをしているそうです。 ただ,更新の頻度が単に高いだけではダメです。重要性が高いと考えられるWebサ

    どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup
  • ITmedia News:Googleの限界は「人の手」で破る――国産の新検索「想」

    高野教授は「人間ができることを機械が10倍のスピードでやってくれるなら、たとえ質が7割落ちてもそっちを選ぶ人は多い」と嘆く 「Googleは確かに便利だが、大きな問題がある」。国立情報学研究所(NII)の高野明彦教授は指摘する。「プロの手による知識を、そこここで台無しにしている」というのだ。 Googleは、被リンク数などを尺度とした独自のアルゴリズムでサイトの重要度を機械的に判定するため、検索結果の表示順と情報の信頼性は必ずしも比例しない。これがGoogleの「唯一最大の問題」という。 「Google上では、記者が現場を歩いて裏を取った新聞記事も、ネット上の情報を写しただけのブログ記事も同列。情報の質や、経過の“差異”が失われる」。ネットが誕生するはるか以前から培われてきたプロの手法も、ロボット検索の前には無力だ。 高野教授がこれまでに開発してきた検索システムも、同じような問題に直面して

    ITmedia News:Googleの限界は「人の手」で破る――国産の新検索「想」
  • 今日の井原. - blog検索エンジン「NAMAAN」の中身

    2008年09月 (1) 2008年05月 (6) 2008年04月 (3) 2008年03月 (4) 2006年10月 (3) 2006年09月 (2) 2006年08月 (5) 2006年07月 (4) 2006年06月 (8) 2006年05月 (7) 2006年03月 (3) 2006年02月 (3) 2006年01月 (6) 2005年12月 (3) 2005年11月 (10) 2005年10月 (23) 2005年09月 (22) 2005年08月 (25) 2005年07月 (22) 2005年06月 (11) 2005年05月 (20) 2005年04月 (13) 2005年03月 (18) 2005年02月 (22) 2005年01月 (3) 2004年12月 (7) 2004年11月 (31) 2004年10月 (4

  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • 1