タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

apacheとクローラに関するkappaseijinのブックマーク (1)

  • Apache Nutch freecode日本語情報ページ - OSDN

    Nutch は、非常にスケーラブルな Web 構築されて Apache Hadoop と Lucene Java のソフトウェアを検索します。主な特長ほかの Web クローラー、インデクサー、クロール管理ツールは、パーサーは HTMLPDF、ドキュメント、および他のいくつかのドキュメント形式およびドキュメント パーサー、カスタム スコアリング アルゴリズム、コンテンツのカスタム パーサー、プロトコル、および詳細などの追加機能をプラグインすることができます、拡張可能なアーキテクチャ。

    Apache Nutch freecode日本語情報ページ - OSDN
  • 1