Naomi Suzuki @NaomiSuzuki_ 03/27 Bingの検索結果に、サポート詐欺に誘導する偽アマゾンの広告出現(図1-2)。中継サイト(hxxps://hotcarsinjp.shop/bing/)経由でWindowsをサポート詐欺サイトに(図3)、他は公式サイトに(図4)転送。騙されないようお気を付けください。 pic.twitter.com/TYTRxFPb6K 2024-03-27 13:32:07
先日、静的サイトに特化した全文検索ライブラリとして「Pagefind」というソフトウェアがあることを、下記の記事が話題になったことで知りました。 参考:静的サイトに特化した検索ライブラリ Pagefind を試す | grip on minds 実は、いまお読みのPublickeyはまさに、Movable TypeというCMSを用いて生成された静的なWebサイトです。現在、PublickeyではGoogleが提供している「Googleカスタム検索エンジン」を全文検索エンジンとして採用しています(右上の虫眼鏡アイコンから呼び出せます)。 しかしPublickeyでは以前からGoogleに依存しない、自前の全文検索エンジンを持てないかと模索しており、まさにPagefindは私が探し求めていたソフトウェアだったと言えます。 そこでさっそくPagefindがPublickeyに導入できるかどうか、
デモとして、このブログに Pagefind を導入してみました。ヘッダーの検索アイコンをクリックすると検索フォームが表示されるので、キーワードを入力して検索してみてください。 使い方 Pagefind は構築済みの UI ライブラリと、CLI コマンドとしてインデックスを作成するためのツールから構成されています。まずは UI ライブラリの部分から見てみましょう。 UI ライブラリ Pagefind の UI ライブラリは、検索フォームと検索結果を表示するためのコンポーネントから構成されています。この UI は以下のコードを追加するだけで簡単に利用できます。 <link href="/pagefind/pagefind-ui.css" rel="stylesheet" /> <script src="/pagefind/pagefind-ui.js"></script> <div id="s
久しぶりに「これは面倒だな」というGoogle検索の仕様変更に遭遇したので、メモ。DMMという事業とサイトの性格上、正直、コアアップデートより面倒です。 日本のSEO担当者で実務レベルでこの情報を本当に必要とする人が果たしてどれだけいるのか不明ですが(この変更の直撃を受けているサイトは限定されるはず)、その少数の方の参考になれば幸いです。 Google検索設定に「アカウントに基づく情報」が出現 今回の検索仕様変更による影響 原因は「アカウントに基づく情報」 アカウントに基づく情報の挙動 Googleの「子どもから大人まで安心して利用できるインターネット」への取り組み 追記(11/1) 一般サイトも影響を受けている模様 Google検索設定に「アカウントに基づく情報」が出現 2023年10月31日に、Google検索のその他の設定の項目に、コンテンツという見出しとともに「アカウントに基づく情
米Googleは3月28日(現地時間)、4月2日の「世界ファクトチェックデー」に向け、Google検索の結果の信頼性を判断するための複数の取り組みを発表した。 「この結果について」がグローバルで正式版に 「この結果について」は、検索結果のURLの右端に表示される縦[…]をクリックすると表示される、情報提供者についての概要を表示するカードだ。昨年4月に発表され、日本でもβ版として既に表示されるようになっている。 これが、日本語を含むすべての言語で正式版になる。 「この結果はすぐに変わる可能性があります」が日本語でも 突然の災害や大きな事件などについての未確認の速報の検索結果に、「このトピックが新しい場合は、信頼できる情報が公開されるまでに時間がかかる可能性があります。この結果はすぐに変わる可能性があります」というラベルを表示する機能が、向こう数カ月以内に日本語版にも拡大される。 「この著者に
「あなたの過去を消去します」というキャッチフレーズのもと、インターネット上に残るデジタルタトゥーの削除サービスを提供する企業が「Eliminalia」です。同社による非倫理的あるいは欺瞞的なデジタルタトゥー削除手法の実態を、The GuardianやThe Washington Postが報じています。 The Spanish firm that uses dubious methods to ‘erase your past’ from the internet | Spain | The Guardian https://www.theguardian.com/world/2023/feb/17/spanish-firm-erase-past-internet-eliminalia-web The Gravediggers: How Eliminalia, a Spanish repu
Googleは独自のルールに従って検索結果の表示順位を決めていますが、Googleの広告枠を購入すれば任意のウェブサイトを検索結果の最上部に表示することができます。この広告枠を悪用して人気画像処理ソフト「GIMP」の公式サイトになりすました偽サイトが検索結果の最上部に表示されてしまう事態が発生しました。偽サイトはドメインの見た目までソックリで、インターネットに慣れている人でも見分けることは困難となっています。 Dangerous Google Ad Disguising Itself as www.gimp.org : GIMP https://www.reddit.com/r/GIMP/comments/ygbr4o/dangerous_google_ad_disguising_itself_as/ Dangerous Google Ad Disguising Itself as www
Linuxの主要なディストリビューションの1つであるUbuntuを開発するCanonicalは、AWSが主導するオープンソースの検索エンジン「OpenSearch」のプロジェクトへの参加を表明しました。 Great open source software is built together with a diverse community of contributors. Canonical, the publisher of #Ubuntu, is proud to be a member of the OpenSearch #opensource community. Read more about our collaboration here: https://t.co/EkQlAZtS9A pic.twitter.com/AwxCkWWFiU — Ubuntu (@ubuntu)
1.はじめに 膨大な量の電子データから目的となるデータを取得・抽出する情報検索。その技術は広く普及し、多くの人々が、様々な場面でその恩恵を受けています。GoogleやBingをはじめとした、世の中に大きなインパクトを与えるWeb検索がその代表例ですが、物件検索や論文検索、メール検索などその応用は様々です。 さて、今回取り組んだのは、Goによる転置インデックスを用いた全文検索エンジンのスクラッチ実装です。研究で自然言語処理を学んだことをきっかけに、情報検索や転置インデックスといったトピックに強い興味が湧いたので、Elasticsearch等には頼らず、ゼロから実装を行いました。以下、リポジトリになります。 本記事では、Omochiの設計・実装に関する説明を行なっていきます。 2.転置インデックス型・全文検索エンジンOmochi リポジトリのREADME.mdにも記載がありますが、今回実装した
米Googleは4月27日(現地時間)、Google検索結果からの個人情報削除リクエストの範囲を拡大したと発表した。「個人情報または晒し行為のコンテンツ」カテゴリーで新たに対象になったのは以下の項目だ。 身分証明書の画像 個人の連絡先情報(住所、電話番号、メールアドレス) 機密性の高いログイン認証情報 これまでは、以下が対象だった。 機密性の高い政府機関発行の個人識別番号(米国の社会保障番号、アルゼンチンの個人納税者識別番号、ブラジルの納税者番号、韓国の住民登録番号、中国の身分証明カードなど) 銀行口座番号 クレジット カード番号 手書きの署名の画像 医療記録など、高度に個人的で制限のある公的な記録 該当すると思われるコンテンツを削除してもらうには、サポートページにある「削除リクエストを開始する」ボタンをクリックして指示通りに操作する。 Googleはリクエストを評価し、報道価値があるか、
「Google検索は死んでいる」がバズったので「まとも検索」を作った。 今のGoogle検索の結果は広告とSEOだらけだ。 まとめサイトも広告も出ません。 まとも検索は色々オプションをつけてGoogle検索にリダイレクトしますが真面目な検索結果しかでません。スマホでは検索オプションが面倒くさすぎるのでデフォルトでつけてます。 仮想通貨が買いたくなくなる 「まとも検索」で「仮想通貨」で検索すると、ビットフライヤーでもコインチェックでもなく消費者庁のこのページが出てくる。まともですね。 ダイエットもしたくなくなる。 まとも検索で「ダイエット」で検索すると、ダイエット食品のアフィカス記事だらけ...にはならない。厚労省のページがトップでヒットしダイエットのネガティブ情報ばかり出てくる。 「極端な摂取制限は、リバウンドの恐れがあるだけでなく健康に害を及ぼす。」「若い女性の[やせ]や無理なダイエット
Google検索で情報を探そうとして、検索結果に並ぶページのタイトルが不自然な途切れ方をしていたり、省略されて内容がよく分からなくなったりしているのを目にしたことがある人は多いはず。Googleはよくページのタイトルを勝手に書き換えるので、コンテンツの制作者が意図したものとは違ったタイトルが検索結果に表示されることがしばしば発生します。そんなGoogleによるタイトルの書き換え対策について、検索エンジン最適化(SEO)対策ソフトウェアを手がけるZyppyのサイラス・シェパードCEOが解説しました。 We Studied 81,000 Page Titles - Google Rewrote 61% Of Them https://zyppy.com/blog/google-search-title-rewrite-study/ ページのタイトルは、Google検索をしたユーザーの目に最初に
「Amazon Elasticsearch Service」の名称が「Amazon OpenSearch Service」に変更。ElasticsearchからフォークしたOpenSearchも採用 Amazon Web Services(AWS)は、クラウドサービスとして提供しているAmazon Elasticsearch Serviceの名称を「Amazon OpenSearch Service」へ変更することを発表しました。 同時に、Elasticsearchからフォークし、同社がオープンソースで開発しているOpenSearchを採用することも発表しました。 Rejoice, you can use the open source tools you love without the operational overhead! OpenSearch is here and avail
米グーグルのロゴ(2019年2月17日撮影、資料写真)。(c)Lionel BONAVENTURE / AFP 【7月14日 AFP】フランス競争委員会は13日、欧州連合(EU)の著作権規則に基づいたニュースコンテンツ使用をめぐり、メディア企業との「誠実な」交渉を怠ったとして、米IT大手グーグル(Google)に5億ユーロ(約650億円)の制裁金を科すと発表した。 競争委員会のイザベル・ドシルバ(Isabelle de Silva)委員長は記者会見で、グーグルへの制裁金は同委員会の裁定に従わなかった企業に科されたものとしては史上最高額となると説明。グーグルによる問題行為の「重大性を反映」したものだとした。 同委員会はさらに、グーグルに対して「著作権で保護されたコンテンツの現在の使用に関する報酬」をメディア企業に提示するよう命令。応じなければ1日最大90万ユーロ(約1億2000万円)の追加制
この記事はRecruit Engineers Advent Calendar 2020の11日目の記事です。 TL;DR 対象読者は転置インデックスを少し知ってるくらいの検索初心者です 検索エンジンに興味が湧き、仕組みを知るためにGoで自作しています 自作検索エンジンのAnalyzerとIndexerとSearcherを紹介します はじめに ここ最近、以下の観点から情報検索への興味が強いです。 技術面: フリーワード検索機能を実装した際にElasticsearchの使いやすさと多機能さに圧倒されたこと。 プロダクト面: 検索がプロダクトに不可欠な機能かつ、 非エンジニアにとって検索エンジンは未知であり知識の乖離が大きいため、エンジニアだからこその価値を提供しやすいこと。 検索エンジンの仕組みを知り情報検索分野に詳しくなるために自作し始めました。 プログラミング言語Goを読んで学んでいるので
事件で逮捕されたあと不起訴になった男性が、ネット上に当時の記事が表示されないよう「グーグル」に検索結果の削除などを求めていた2審の裁判で、男性が訴えを取り下げたことが分かりました。代理人の弁護士はグーグル側が削除に応じたためと説明しています。 原告の男性は以前、女性に性的な暴行を加えたとして警察に逮捕され、その後、嫌疑不十分で不起訴になったのにネット上に当時の記事が表示されるのはプライバシーの侵害だとして、グーグルを運営するアメリカの会社に検索結果の削除などを求めました。 1審の札幌地裁は去年、「検索結果を表示する必要性よりも原告の法的利益が優越する」として、グーグル側に検索結果の一部を削除するよう命じましたが、原告側が控訴して2審の審理が続いていました。 この裁判について原告の代理人の弁護士は、グーグル側がすべての削除に応じたとして、2日、訴えを取り下げたことを明らかにしました。 一方で
DuckDuckGo(https://duckduckgo.com)はプライバシーの保護に重きを置いている検索エンジンのひとつである。 特筆すべきは、Bangという機能があって、探しものがとてもはかどる。 たとえば「!a 図書館」(ビックリマーク+アルファベットのa+スペース+検索語)と入力するとAmazonを検索してくれる。 こんな風に「!+何か」 で特定のサイトのみの検索ができる機能がBangである。 検索エンジンが使えなくなった(クズみたいなサイトが上位に来て、欲しい情報が見つからない等)と言われて久しいが、探すべきサイトにダイレクトで検索することで、この問題のかなりの部分が解決する。 よく使いそうなのは ! (キーワード) 最初の検索結果へ直接ジャンプ !i イメージ検索 !m 地図検索 !n ニュース検索 !v 動画検索 !w ウィキペディア検索 !pdf PDFファイルだけを検
こんにちは!最近気になるニュースはスピノサウルスの尻尾の化石が発見されたこと1な、SRE部エンジニアの塩崎です。ZOZOテクノロジーズの前身となった会社の1つであるVASILYでは数多くのクローラーの開発・運用の担当をしてきました。 今回はその知見を生かして、クローラーを楽に運用するためのクラウドサービスを紹介します。 概要 データ解析を円滑に進めるためには、CSVやWeb APIなどの構造化されたデータが必要です。しかし全てのWebサイトにあるデータが構造化データを提供しているとは限りません。むしろ提供していないケースの方がはるかに多いです。そのため、Webクローラーを作成して構造化されていないWebページを解析し、構造化データを生成する必要があります。 しかし、Webクローラーの運用には数多くの「つらみ」があります。特に大量のWebページを1日1回などの頻度で定期的にクロールする際には
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く