タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

クローラーに関するAndrionのブックマーク (1)

  • 10. ウェブアーカイブの技術的な課題 | ウェブアーカイブのしくみ|国立国会図書館インターネット資料収集保存事業

    ウェブアーカイブでは、全てのウェブコンテンツを完璧に収集できるわけではありません。収集ロボットの技術的な限界により収集が難しいコンテンツがあるためです。代表的なものとして、動的コンテンツやストリーミングファイルがあります。 動的コンテンツ データベースの中に格納され、検索を実行して初めて表示されるようなデータは、収集ロボットで収集することができません。 これらは動的コンテンツと呼ばれ、検索を実行したり画面をスクロールしたりするなど、ユーザの操作により要求(クエリ)がサーバに送信され、サーバ側のプログラムで結果が生成されてデータが返信される仕組みです。また、JavaScriptを使ってクライアント側で実行して生成されるコンテンツもあります。表示される内容やURLは、クライアントの要求によって異なったものになります。 一方、htmlページ、画像ファイル、文書ファイルなどが固定したURLで置かれ

  • 1