タグ

ネットと言語に関するardarimのブックマーク (5)

  • スノーデン氏、「Twitterのチートモードは日本語」と日本語でツイート

    米連邦政府による極秘情報収集活動を暴露した元米中央情報局(CIA)職員エドワード・スノーデン氏が、「Twitterのチートモードは日語」と日語でツイートした。140文字制限の中で伝えられる情報の多さに驚いているようだ。 パナマの法律事務所「モサック・フォンセカ」から、租税回避や脱税に関する世界各地との金融取引を記録した文書が流出した「パナマ文書」問題で、英国のキャメロン首相の父・イアン氏の名前も含まれており、“税金逃れ”のためのオフショア投資ファンドを設立していたことが明らかになった。 スノーデン氏は、父のファンドに関与したかを問われたキャメロン首相が「プライベートな問題」と一蹴した――というニュースに対し、皮肉を込めて「おお! ついにキャメロン首相もプライバシーに興味を持ったのか!」と引用リツイートしていた。

    スノーデン氏、「Twitterのチートモードは日本語」と日本語でツイート
  • インターネットで使われている言語の普及率をグラフ化してみる(2010年6月末時点)

    今や世界中にその網を張り巡らせ、パソコンやモバイル端末に限らず多様な機器によって利用されているインターネット。言葉通り「世界をまたにかけている」情報網であるが、それは地域毎の言語による違いを認識する機会が生じることを意味する。ブラウザに未対応の言語で構成されたページへアクセスして文字化けばかりの状況に遭遇したり、幸いにもブラウザが対応していたため閲覧はできるが、まるで異世界の言葉が並ぶコンテンツを目にした経験がある人は多いはず。また動画共有サイトで興味をひくサムネイルだがタイトルや解説が読めない言語で書かれており、難儀した経験は誰にも一度や二度ならずあるだろう。今回はインターネット界隈で用いられている言語の利用状況、シェアについて、【InternetWorldStats.com】の今件該当項目となる【INTERNET WORLD USERS BY LANGUAGE Top 10 Langu

    インターネットで使われている言語の普及率をグラフ化してみる(2010年6月末時点)
  • 増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除

    ライブドアは10月10日、「livedoorブログ検索」に、検索結果にスパムブログを表示しない技術を実装した。スパムブログを自動判定する技術を新開発。従来、検索結果の半分ほどスパムだったが、新技術でスパムの約9割が表示されなくなったという。 スパムブログとは、アフィリエイト収入を得たり、特定のサイトへ誘導することを目的に、専用ツールを使って自動生成された、内容の伴わないブログ。 別のブログやニュースサイトの記事をそのままコピーしたものや、アフィリエイトリンクを大量に掲載しているもののほか、流行のキーワードや芸能人の名前など、検索されやすい言葉を並べ、意味の通らないでたらめの文章「ワードサラダ」を自動生成し、投稿しているものもある。 同社エンジニアの山下拓也さんによると、「日々新しいパターンのスパムブログが出てくる」という。スパムが検索結果に表示されなくなれば、スパムブログを通じてアフィリエ

    増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除
  • 本当に危険な「ネット犯行予告」を検知できるか? - 総務省が技術開発へ | ネット | マイコミジャーナル

    総務省は12日、インターネットでの犯行予告などを自動的に検知できる新技術の開発を行う方針を明らかにした。東京・秋葉原での殺傷事件を受け、増田寛也総務大臣が指示した。 総務省によると、現在のフィルタリング技術では、「殺人」「殺します」といった言葉に反応する方式になっている。この方式だと検知数が膨大なものになってしまい、どれが当に危険なものかを見抜くのは難しいのが現状。 新しく開発する技術は、情報通信研究機構などで開発されている「自然言語処理技術」を応用。単語に関わる文脈や時間的変遷を解析することで、「どの情報が当に危険なものかを検知することができる」(総務省)という。 同省では、新技術の開発について、2009年度の予算要求に盛り込む方針。要求が通れば、来年度から研究が開始される。開発されれば、フィルタリングサービスを提供する企業などの利用が見込まれている。 だが、研究を開始しても数年はか

    ardarim
    ardarim 2008/06/12
    原理的に無理な気がするのは気のせいか? 表記のぶれとか2ch語とかちょっと考えただけでも課題は山積みな気がするが…
  • 1