これ、作者の人や一部の人は「明らかにおかしい(botによって参考画像に寄せる攻撃が行われている)」と判断してるけど、素直に信じてる人が結構いるのが興味深い https://t.co/2rRPCHurkO
これ、作者の人や一部の人は「明らかにおかしい(botによって参考画像に寄せる攻撃が行われている)」と判断してるけど、素直に信じてる人が結構いるのが興味深い https://t.co/2rRPCHurkO
今やっていること 真面目に相性を考慮した企業推薦アプリやマッチングアプリを作りたい 企業への就職や出会いを求める場など、現在はITが進んでいますが、まだ最適な状態に至っていいないだろうと思われます。そんな課題を解決するために、人の行動ログ(ここではSNSでの発信ログ等)を利用して、真面目なマッチングエンジンを作ろうとしていました。 具体的な多くの人の行動ログを取得可能なサービスを所有していないので、Twitter社のデータを用いて、マッチングエンジンを作ろうとして現在、技術検証や精度の改善などをしています。 日本語のテキストを書くユーザ 2400万人 分の直近500 ~ 1000ツイート程度をサンプリングしており、さまざまな観点を検証しています。 安西先生...、botが邪魔です...! 狭い課題として、botと呼ばれるプログラムでの自動運用されたアカウントが少なくない数存在し、botは特
知っている人は知っていると思うが、Qiitaではたびたび大量のスパム記事が投稿されている。 深夜24~26時頃に記事一覧を確認してみて欲しい。 スパム記事がわんさか出てくるはず。 登録したてのQiitaユーザは不安よな。1 ———— @dcm_chida 動きます🧐 はじめに これはNTTドコモサービスイノベーション部AdventCalendar2019の1日目の記事です。 我々の部署では日頃から「KDDCUP2」や「論文読み会」に取り組んでおり、若手から中堅社員まで最先端の技術取得に励んでいます。 そうした活動をもっと外部へと発信していこうと始めたのがこのAdventCalendarです。社員一人一人が書いた記事を通して、少しでも多くの方に興味を持って頂ければ幸いです。 さて、僕は4年目社員ですがプログラミング初心者の頃から現在に至るまで、Qiitaにはかなりお世話になりました。 自分
※この投稿は米国時間 2019 年 2 月 7 日に Google Cloud blog に投稿されたものの抄訳です。 毎月 Gmail を使っている人は 15 億人、G Suite の一部として Gmail を有料で使っている企業は 500 万社に上ります。一般ユーザーと企業ユーザーのどちらにとっても、Gmail の最大の魅力は、あらかじめ組み込まれているセキュリティ保護機能でしょう。 セキュリティが優れていることは、常に脅威よりも優位に立っていることを意味します。Gmail で従来から使用されている機械学習(ML)モデルは非常に強力で、ほかの保護機能とともに、スパムやフィッシング、マルウェアの 99.9 % 以上を Gmail の受信トレイから遠ざけてきました。 私たちは、セキュリティ保護機能を絶えず強化するとともに、利用者保護の観点から ML の機能向上に努めてきました。Google
ネット上の「文字認証」を簡単突破できる人工知能(AI)を、米ベンチャー企業が開発した。視覚にかかわる脳の機能を再現し、文字の特徴を効率的に学習できるようになったという。27日付の米科学誌サイエンスに発表する。 ネットで会員登録する際などに使われる、グニャグニャとゆがんだ文字が乱雑な背景の上に書かれた文字認証「CAPTCHA(キャプチャ)」は、人間には読み取れても、コンピューターが識別するのは難しいという特徴を応用した仕組みだ。 米ヴァイカリアス社は、人間の脳にある「視覚野」の構造をコンピューターで再現し、画像の「輪郭線」を見つけ出すことで、見たものの中に何があるかを把握できるAIを作った。 このAIを使って文字認証を解けるか試したところ、正解率は66%だった。通常、数個つらなったアルファベットや数字を読み取る確率が1%を超えれば、認証は「突破された」とみなされるため、今回の結果は極めて高率
Googleは「Gmail」に、専用機械学習モデルに基づくフィッシング検出など、複数のセキュリティ機能を追加した。 Gmailで受信されるメッセージの50~70%がスパムメールだが、Googleは機械学習を採用することによって、スパムやフィッシングのメッセージを99.9%を超える精度で検出できるという。 同社の最新機械学習モデルは、一部のメッセージ(平均でメッセージ全体の0.05%未満)をさらなるフィッシング分析のために遅延させることによって、この処理を改善する。 Googleによると、同社の新しい検出モデルによってURLクリック時の新しい警告も生成され、疑わしいリンクをクリックした場合に警告メッセージがユーザーに表示されるという。新しいパターンが検出されるにつれてモデルが適応していき、時間の経過とともに改良されていくという。 またGoogleは、保護すべきデータを誤って社外の人物に送信し
Googleは、「Gmail」の受信トレイに迷惑メールが振り分けられる可能性は平均0.1%未満であり、一方で必要なメールが迷惑メールフォルダに振り分けられる可能性は0.05%にも満たないと述べている。 Googleによると、人工ニューラルネットワーク(神経回路網)を利用して膨大な数の受信メールを取捨選択し、不要なメッセージやフィッシング攻撃を除去することで、この数字を実現できたという。 Googleがスパムの除去にあらゆる手を尽くしていなければ、Gmailは利用に耐えるものではないだろう。セキュリティ企業のKaspersky Labによると、同社が2015年第1四半期にフィルタリングしたすべてのメールのうち、59.2%はスパムだったという。スパムの送信者たちは、「.work」や「.science」など新しく利用可能になったドメインをいち早く利用してスパムフィルタをかいくぐり、広告やマルウェ
Linuxカーネルの開発者として知られる“Linuxの父”ことリーナス・トーバルズ氏が、米GoogleのGmailに苦言を呈しているようだ。米Wall Street Journal(WSJ)などがそんな話を伝えている。 WSJによると、Gmailでは7月半ばごろから、トーバルズ氏宛ての正当なメールをスパムメールとして分類するようになっていた。それに気付いた彼がおかしいと思って調べてみたところ、迷惑メールボックスに振り分けられていた約3000通のメールのうち30%超(1190通)は、Linuxカーネル開発者たちのメーリングリストを含む“必要なメール”だったという。 トーバルズ氏は「Gmailがどんなメールを迷惑メールとして判定して破棄しているのか知らないが、率直に言ってひどすぎる。とても受け入れられたものじゃない。Googleがここ数日でGmailに加えた変更は完全におかしい」と自身のGoo
By Will Lion Gmailのスパムフィルターは、受信トレイにスパムメールが入り込む割合を平均0.1%以下、読みたいメールが迷惑メールフォルダに分類されてしまう確率を0.05%以下まで落とすことに成功しています。そんな高精度な分類機能を既に有しているGmailのスパムフィルターが、Google検索やGoogle Nowと同じニューラルネットワークを応用することでさらに精度の高い分類を行えるようになり、さらに月次計算書や領収書などのスパムメールに分類されやすいメールを迷惑メールに分類されないようにするための送信者向けツール「Postmaster Tools」も新たに公開されました。 Postmaster Tools – Google https://gmail.com/postmaster/ Official Gmail Blog: The mail you want, not th
論文紹介のコーナー.*1 今回紹介するのは,KDD'2011のUnbiased Online Active Learning in Data Streams (Wei Chu, Martin Zinkevich, Lihong Li, Achint Thomas, and Belle Tseng). Yahoo! Labsのグループによる研究です.(その後,第一著者はMicrosoftへ移動しています) 本論文は,ユーザーがコンテンツを生成できるウェブサービスから効率的にスパムやアダルトコンテンツを排除する手法について提案されています. このようなサービス形態はUser-Generated Content(UGC)と呼ばれ,ニュースサイトのコメント欄や掲示板・SNS・ソーシャルゲーム・ユーザー投稿型動画サイトが主な例として挙げられます. 3行概要 ストリームデータ環境下において,学習に有用
Dspam - Community Driven Antispam Filter DSPAM is a scalable and open-source content-based spam filter designed for multi-user enterprise systems. On a properly configured system, many users experience results between 99.5% - 99.95%, or one error for every 200 to 2000 messages. DSPAM supports many different MTAs and can also be deployed as a stand-alone SMTP appliance. For developers, the DSPAM co
今回は、機械学習で使う「確率」のお話です。 確率は、統計的な機械学習のもっとも重要な基礎知識です。とはいえ、確率についてゼロから説明するというのは紙数的にも厳しいため、高校の確率を少し憶えているくらい(期待値や標準偏差など)を前提とし、「高校の確率」と「機械学習の確率」の本質的な相違点について、少し丁寧に見ていく、という形で進めていきます。 機械学習と確率 最初に、機械学習にとって確率はどういう役割なのかを確認しておきましょう。 実のところ、機械学習に確率が必須というわけではありません。ニューラルネットワークやサポートベクターマシンなどの有名な手法も「確率を用いない機械学習」ですし、その他にも数多くの手法があります。しかし、「確率を用いない機械学習」の多くは、「結果のランキングを作りづらい(評価値の大小に意味がない)」「条件が異なる場合の結果を比較できない」などの欠点がありま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く