昨日6月6日に日本武道館で行われた「第4回AKB48選抜総選挙」は、過去3回のうち2回センターに輝いた前田敦子の卒業発表による出馬辞退で、跡目争いが注目された。開票に先立って、スポーツ紙からAKBファンを自称するタレント、リサーチ会社までさまざまな事前予想が繰り広げられたが、中でも精度の高さを誇ったのが、ブログクチコミ件数などから算出した“ビッグデータ予測”。選抜メンバー上位16人中15人の顔ぶれを的中させていた。 デジタルマーケティングコンサルティング会社のルグラン(東京都渋谷区)が、総選挙2日前の6月4日に発表した「データで予測する2012年第4回AKB選抜総選挙」がそれだ。大島優子のセンター返り咲きはもちろんのこと、前年の9位から4位に躍進した指原莉乃を大胆にも3位と予測するなど、かなり精度の高い内容だった。ちなみに予測が外れたのは、20位と予測した梅田彩佳が16位に飛び込み、替わり
Mahout in Action 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman出版社/メーカー: Manning Pubns Co発売日: 2011/10/28メディア: ペーパーバック購入: 4人 クリック: 81回この商品を含むブログ (10件) を見る Index Information & Links Apache Mahout Abouc Apache Mahout Mahout has machine learning libraries Mahout Download / Setting Madmagi Words Scraping Word MA Mecab MA HDFS PUT Clustering Theory TF/IDF K-Means Canopy Clustering Word Vector Clust
回転寿司が抱える一番の問題。 それは、お客さんが取らなかったネタは決められた時間で捨てなければならないということ。 最近は、タッチパネルなどで個別の注文も出来ますが、レーンにそのお寿司しか流さなければ、なんだかショボ〜イ感じになってしまいます。 かといって、注文以外のお寿司を流しすぎると、廃棄も増えてしまう…。 なるべくたくさんお寿司を流して、いかに廃棄を減らすか。これが大事なテーマなのです。 スシローの場合は、お寿司の廃棄率が4%!業界平均が6%というから、大したもの。 ここに、スシローならではの徹底した工夫があります。 先ほどの曽根店長にお話を伺いましょう! 曽根さん:スシローには強い武器というか、予言者的な存在がいます。こちらが、その予言者ですね。 と、ご紹介いただいたのは1台のモニター。
Googleが、面白いYouTube動画を自動的に判定するアルゴリズムを開発した。それによると、一番面白いのはシーリングファンに頭をぶつける男性の動画だという。 このアルゴリズムは、カメラワークや笑い声といった動画の特徴に加え、動画のタイトル、説明文、コメント欄のテキストを分析し、コメディカテゴリーの動画から最も面白いものを割り出す。コメント欄の分析は「hahaha」「kekeke」などの笑い声、「lol」(「(笑)」「ワラタ」のような意味)といった笑いを表す略語、顔文字に着目しているという。 同社はアルゴリズムで面白いと判定した動画を集めたサイト「Comedy Slam」を設けた。視聴者は「今すぐ投票する」ボタンをクリックして動画に投票することもできる。現在の1番のおもしろ動画は「Ceiling Fan Trick Knockdown」というタイトルで、天井にぶら下がったトマトを取ろうと
「君と僕の関係*1」、というタイトルで、AKB48メンバーブログの“コメント欄”のテキスト分析をしました。 さながら、「ファンレター2.0」、ですよ。すごい世界。ぞくぞく。 きっかけと背景 個人的に、アイドルブログの真骨頂はコメント欄だと思ってて、わりと眺めるのがすきです。甘い愛の言葉も熱い激励の言葉も、クラスの友達かよwってくらい軽くて近くて短すぎるコメントもまぜこぜで、あまりに混沌としていてうっとりします。すてき。距離感がめちゃくちゃ。 今、2011年(データとった当時)のアイドルとファンの関係を知りたくて、ブログの“コメント欄”だけで形態素解析をしました。あっち側の人たちの経営戦略やマネジメントの手腕は誰か偉い人がきっと分析してくれるから、わたしはもっとこっち側の、お祭に加担してる、一緒に踊らされてる人たちのことを知りたい。どんな人がいるんだろう、何を考えているんだろう、どんなことに
Parallel Domain is putting the ability to generate synthetic datasets into the hands of its customers. The San Francisco-based startup has launched a new API called Data Lab that stands on the shoulde Multiple subreddits are adopting alternative methods of protesting like publishing only one kind of post, changing the topic in focus, and days when the community turns private. A lot of these commun
なぜ西洋の料理とアジアの料理はこんなにも味が異なるのか?2011.12.25 12:00 mayumine 「なぜ西洋の料理とアジアの料理はこんなにも味が異なるのか?」を 理論的に解明できそうな興味深い研究結果がネイチャー誌より発表されました。56498件のレシピを分析した結果、381種の食材のペアが存在することが明らかに。 その「味」の違いとは一体何なのでしょう? 研究結果によると、北米と西欧の料理は共通する風味をもつ食材を好んで用いる傾向があることがわかりました。一方アジアの料理では正反対で、同じような風味を含む食材を系統的に避ける傾向があり、2つの食材に共通する味が多ければ、アジアの台所ではそれを避けようとするのですね。 過去10年間の実験的研究の理論が証明されました。 フードペアリング理論では、2つの食材を組み合わせておいしいと感じられるのは、個々の食材が類似の風味化合物によって構
印刷 日本将棋連盟の米長邦雄会長(68)とコンピューターの将棋ソフト「ボンクラーズ」が21日、インターネット上で対局し、ボンクラーズが85手で勝った。米長会長は2003年に現役を引退したが、名人を含むタイトル獲得19期の実績を誇る元トッププロ。 近年、実力が著しく伸びている将棋ソフトの実力を試すために企画された。この日は、ボンクラーズが初手に角を働かせる最も自然な手を選んだのに対し、米長会長は△6二玉という奇策で応じ、定跡にない戦いになったが、ボンクラーズが一方的に攻めて勝った。持ち時間は各15分で、使い切ると1手60秒という早指し対局だった。 ボンクラーズは5月の世界コンピュータ将棋選手権で優勝。早指しで対戦した現役プロを負かすこともあるという。これまで現役の棋士が将棋ソフトに公の場で負けたことはない。 続きは朝日新聞デジタルでご覧いただけます
グーグルでは、社内のプログラマによって作り出される大量のコードの品質を保つため、チェックイン前にユニットテストとコードレビューが行われているそうです。しかし、コードが大量になってくると、ユニットテストやレビューをすり抜けるバグも少なからず発生します。 そこでコードの品質をさらに高めるために、グーグルでは「バグ予測アルゴリズム」を採用。バグがありそうな部分をレビュアーにアドバイスする仕組みを採用したとのこと。 そのバグ予測アルゴリズムとはどんなものなのか。Google Engineering Toolsブログに投稿されたエントリ「Bug Prediction at Google」(グーグルにおけるバグ予測)で説明されています。 ソースコードの修正履歴を基に予測 コードの中にバグがありそうな箇所を分析する手法としては、「ソフトウェアメトリクス」がよく用いられます。これはコードを静的に分析して、
テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい(けれど高度な数学は厳しい…)」というビジネスマンや学生さんです。数式は出来る限り「使います」。使わないと意味するところは理解できません。ただし、愚直に数式の一行一行を手計算で順を追って解いていきますし、必要な数学知識はその都度説明し、前提知識は求めませんので「数式出てくるの?じゃあついていけないのでは…」という心配は不要です。この記事の特徴は「機械学習の手法をやたら冗長な数式と過剰なまでの例を用いて、くどくどと同じ話を何度も説明する」ことです。 筆者ことあんちべは純文系出身で、数学や統計学、プログラミングは全然学生時代やってこなかった上、業務でも機械学習を使うことなんて皆無、それどころか機械学習なんて言葉は就職してからよう
Hadoopによるテキストマイニングの精度を上げる2つのアルゴリズム:テキストマイニングで始める実践Hadoop活用(最終回)(1/3 ページ) Hadoopとは何かを解説し、実際にHadoopを使って大規模データを対象にしたテキストマイニングを行います。テキストマイニングを行うサンプルプログラムの作成を通じて、Hadoopの使い方や、どのように活用できるのかを解説します Passive-Aggressiveとロジスティック回帰で精度向上 前回の「実践! 「MapReduceでテキストマイニング」徹底解説」では、「青空文庫」の作品から学習を行い、テキストデータから著者の寿命を推定するMapReduceプログラムを作成しました。 今回は、前回のプログラムを少し変更するだけで、精度が上がる「Passive-Aggressive」というアルゴリズムを実装します。また、テキスト分類のアルゴリズムと
スーパーコンピューターは、世界の重大事件を予測できるのだろうか?イリノイ大学の研究者 Kalev leetaru 氏は、メディアのニュース記事をテキスト分析することで可能になるという。 同氏によれば、コンピューターによるテキスト分析はすでに広い分野で活用されており、たとえば、電子書籍のテキストを分析することで、地域ごとや時代ごとの文化の流行傾向が分かるようになってきているという。 同氏が今回行ったプロジェクトは、ニュース記事をテキスト分析することで、リアルタイムで世界各地の人々の状況を把握し、今後起こりうる重大事件を予測できないかを検証するもの。小説などの出版物と異なり、新聞などのニュースは事実以上に人々の今の気分を切り取って伝えている。そこで、ニュース記事をテキスト分析することで、記事の対象となっている地域の人々の気分を読み取れれば、今後起こりうる事件などを予測できるのではないかと考
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く