タグ

indexとwebに関するmyrmecoleonのブックマーク (10)

  • 【検索神に遭遇した】ネットで検索する能力って個人差があるよね - MIKINOTE

    現代人にとって、GoogleYahooなどで調べ物をするという行為は生活の一部のような存在となっています。 そして、その能力には、個人差があるのではないかな?という話です。 やっぱりね、何かを知りたいと思った時に、その事柄をすぐに知ることができるということは、それだけ他人に比べて優位な立場に立つことができるということだと思うのです。 ググる(Googleの検索フォームに言葉を入力して調べ物をすること)ことが、上手いだけでも生きていくことができるかもしれません。 僕自身は、そんなに検索能力が高い人間ではありません。しかし、そんな僕から見てもググる能力が低い人と言うのも存在しています。もちろん、逆に、インターネットの検索能力のレベルがとてつもなく高い人もいるのですけどね。 今は、インターネットに接続できる端末を、誰もが所有している時代です。だからこそ、検索エンジンを上手に使うことができるとい

    【検索神に遭遇した】ネットで検索する能力って個人差があるよね - MIKINOTE
    myrmecoleon
    myrmecoleon 2016/02/04
    「一昔前の「辞書を引く能力」と似ています」どっちもインデックス参照してるし,どんなインデックスが存在するかを想像する力なのでだいたい同じですね。
  • Web NDL Authorities

    Web NDL Authoritiesは、国立国会図書館が作成している典拠データを検索・ダウンロードできるサービスです。 検索例 🔍夏目漱石🔍源氏物語🔍インターネット🔍漫画 各典拠データから、国立国会図書館サーチの書誌データを検索することもできます。 Web NDL Authoritiesについて 典拠データを使った資料検索:Web NDL Authoritiesガイド(NDL-HPへリンク) Web NDL Authorities is a service that allows you to search and download authority data created by the National Diet Library, Japan. Search Keyword Example 🔍与謝野晶子🔍Genji monogatari🔍Internet🔍Manga

    myrmecoleon
    myrmecoleon 2010/06/30
    試してみた。すごいなWeb NDLSH。これをキーにウェブサービスとか作れそうだ……バラバラの分類と件名からクラスタリングしてまとめてネット書架つくったり。
  • 国立国会図書館、ウェブ版の国立国会図書館件名標目表(Web NDLSH)を公開

    国立国会図書館は、2010年6月30日に、ウェブ版の国立国会図書館件名標目表(Web NDLSH)および国立国会図書館件名作業指針を公開しました。Web NDLSHは、主題語彙を扱うのに適したSKOS(Simple Knowledge Organization System)のモデルを活用したRDF/XML形式を採用しています。Web NDLSHの特徴は次のような点です。 ・各NDLSHデータに対してURIを付与しており、外部からのNDLSHデータへのURI参照が可能です。 ・APIの一種であるクエリ言語のSPARQLを使用することで、外部システムから検索できます。 ・標目語や参照語からだけではなく、NDLC、NDCからも検索できます。 ・PDF版より収録範囲を拡張し、細目付き普通件名も提供します。 ・他の件名標目表やWebサービス上の語彙との関連を示しています。 ・多様な形式でのデータの

    国立国会図書館、ウェブ版の国立国会図書館件名標目表(Web NDLSH)を公開
    myrmecoleon
    myrmecoleon 2010/06/30
    「各NDLSHデータに対してURIを付与しており、外部からのNDLSHデータへのURI参照が可能です」「NDLC、NDCからも検索」おおお。素晴らしい。API的なものもあり。
  • ブックワン BK1

    myrmecoleon
    myrmecoleon 2009/05/12
    素晴らしい。著者典拠ファイルを確実に構築してるbk1(TRC)ならではのサービス。たとえばAmazonにはこれは難しい。
  • deckkr.jp

    deckkr.jp 2024 著作権. 不許複製 プライバシーポリシー

  • Google検索が一度のクロールで見るユニーク URLは1兆件

    Googleの検索エンジンでは,現在,新しいコンテンツを見つけるために,一度に1兆件のユニークURLを見て回るという。同社Web検索インフラ・チームのソフトウエア・エンジニア,Jesse Alpert氏とNissan Hajaj氏が米国時間2008年7月25日に同社公式ブログに投稿した記事によると,1998年に構築した最初のGoogleインデックスは2600万ページだった。2000年には10億に拡大し,その後8年間で膨大な数のコンテンツがWeb上に登場した。 Googleの検索では,最初のページから新しいページへのリンクをたどり,そこからまた新しいページへのリンクをたどる。これを繰り返して膨大なリンクのリストができあがる。同じコンテンツでも自動複製などにより複数のURLが設けられている場合があり,これら重複を除いたユニークURLのリストは1兆件。1日当たり作成されるWebページは数十億ペ

    Google検索が一度のクロールで見るユニーク URLは1兆件
    myrmecoleon
    myrmecoleon 2008/07/28
    「重複を除いたユニークURLのリストは1兆件。1日当たり作成されるWebページは数十億ページ」「現在は,継続的に新しいページの情報を収集し,1日に数回PageRankグラフを計算」「1兆の交差点がある道路図」
  • benli: Googleですら行う妥協をはてなが行わない理由って?

    はてなブックマークの場合、特定のサイト、特定のエントリーについて利用者がブックマークをすると、ブックマークされたエントリー等の一部が切り取られてブックマークページに表示される仕組みになっています。つまり、はてなブックマークは通常ブックマーク元のエントリー等の一部を複製および送信可能化という形で利用しているということができます。 既存のウェブサイトやエントリーの一部を切り取って送信可能化するという行為自体はGoogle等の検索エンジンでもやっているわけですが、Google等は、ロボットよけのタグを埋め込むことで特定のウェブサイトをその検索サービスの対象外とする余地を各サイトオーナーに与えています。そのことにより、「黙示の許諾」等の主張をしやすい形にしているわけです。 そういう意味では、はてなブックマークに取り込まれたくないサイトオーナーのためのオプションを用意しないというのは、いかがなものか

    myrmecoleon
    myrmecoleon 2008/06/09
    「はてなブックマークに取り込まれたくないサイトオーナーのためのオプションを用意しないというのは、いかがなものかなあ」
  • 「深い」サイトと「広い」サイトとで、検索エンジンへのクロールされやすさはどのくらい違うのか?

    サイト内のコンテンツを、順を追って階層的にたどっていく様にする「深い」ウェブサイトと、1つのページに数多くのコンテンツへのリンクを表示する「広い」ウェブサイトとでは、検索エンジンへのクロールされやすさがどのくらい違うのか、について、2つの種類のウェブサイト(前者を「パンくずリスト(Bread Crumb)型」、後者を「ビュッフェ(Buffet)型」と呼んでいます)を構築し、365日間の検索エンジン(Google、MSN、Yahoo!)のロボットの訪問ログを分析したレポートが、D-Lib Magazine誌に掲載されています。広いウェブサイトの方が、漏れなく、早くクロールされることがわかったとのことで、各々のクロールのされ方を示したアニメーション図も掲載されています。なお、この調査では、.comサイトと.eduサイトの両方で同じ実験を行っていますが、.eduサイトの方が漏れが多く、時間もかか

    「深い」サイトと「広い」サイトとで、検索エンジンへのクロールされやすさはどのくらい違うのか?
  • Big Sky :: 今さら聞くのは恥ずかしい「microformatsとは何か?」

    The sbox program encountered an error while processing this request. Please note the time of the error, anything you might have been doing at the time to trigger the problem, and forward the information to this site's Webmaster (webmaster@www.ac.cyberhome.ne.jp).Stat failed. /usr/local/apache2/cgi-bin/~mattn: No such file or directory sbox version 1.10 $Id: sbox.c,v 1.16 2005/12/05 14:58:01 lstein

  • asahi.com :ネット検索業者育成 著作権の許諾不要に - ビジネス

    myrmecoleon
    myrmecoleon 2007/01/08
    和製Googleはたぶん生まれないと思うが,これで大手を振って世に出せる,ってサービスはかなりありそうな予感。
  • 1