CGMに関するkana0355のブックマーク (37)

  • LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に | ニュース | LINE株式会社

    LINE、NAVERと共同で、世界初、日語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日AIの生成を可能に 従来の特化型言語モデルとは異なる、汎用型言語モデルを実現予定。 処理インフラには世界でも有数の、700ペタフロップス以上の高性能スーパーコンピュータを活用 LINE株式会社(所在地:東京都新宿区、代表取締役社長:出澤剛)はNAVERと共同で、世界でも初めての、日語に特化した超巨大言語モデル開発と、その処理に必要なインフラ構築についての取り組みを発表いたします。 超巨大言語モデル(膨大なデータから生成された汎用言語モデル)は、AIによる、より自然な言語処理・言語表現を可能にするものです。日語に特化した超巨大言語モデル開発は、世界でも初めての試みとなります。 従来の言語モデルは、各ユースケース(Q&A、対話、等)に対して、自然言語処理エンジニアが個

    LINE、NAVERと共同で、世界初、日本語に特化した超巨大言語モデルを開発 新規開発不要で、対話や翻訳などさまざまな日本語AIの生成を可能に | ニュース | LINE株式会社
    kana0355
    kana0355 2020/11/25
    どのデータ使ったんだろう…….
  • 「クソゲー・オブ・ザ・イヤー」を一変させた『四八(仮)』ショックとはなんだったのか? “テキストの量的分析”からクソゲーの定義とレビューの変容を見る

    「クソゲー・オブ・ザ・イヤー」を一変させた『四八(仮)』ショックとはなんだったのか? “テキストの量的分析”からクソゲーの定義とレビューの変容を見る ビデオゲーム文化で「クソゲー」という極めて暴力的な単語が一般化してからどれくらいが経っただろうか。みうらじゅん氏が『いっき』に対して使ったなど起源には諸説あるが、ともかくその言葉は死滅せずに現代まで生きながらえてきた。 制作者が心血を注いで創りあげた一個のゲームという作品。それをたった一言で簡単に断罪できてしまうその言葉は、無残なほどにネガティブなパワーを持っており、ゲームメディアでは忌避すべきワードのひとつである。 しかし口をつぐんだところで、いままでプレイヤー間で何年にもわたり続いてきた「クソゲーを語る」という文化が、無かったものになるわけでもない。たった4文字でゲームを語ることができるこの魔法の言葉は、その時代や個々人の認識によって極

    「クソゲー・オブ・ザ・イヤー」を一変させた『四八(仮)』ショックとはなんだったのか? “テキストの量的分析”からクソゲーの定義とレビューの変容を見る
  • ニコニコ動画の公開コメントデータをDeep Learningで解析する - Qiita

    この記事は第2のドワンゴ Advent Calendar 2015の24日目の記事です。 ドワンゴエンジニアの@ixixiです。 niconicoのデータをDeep Learningなアプローチで解析してみた話です。 nico-opendata niconicoの学術目的用データ公開サイト https://nico-opendata.jp が最近オープンしました。 これまでも、国立情報学研究所にて、ニコニコ動画コメントデータや大百科データが公開されていましたが、 nico-opendataでは、ニコニコ静画のイラストデータの約40万枚のイラストとメタデータが研究者向けにデータ提供されています。 今回は、ニコニコ動画コメントデータ(誰でも取得可能)を用いたDeep Learningによるコメント解析例を紹介します。 超自然言語 ニコニコのコメントデータに限らず、twitterでのtweetや

    ニコニコ動画の公開コメントデータをDeep Learningで解析する - Qiita
  • 食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog

    フランスの希代の美家であるブリア・サヴァランは「ふだん何をべているのか言ってごらんなさい、そしてあなたがどんな人だか言ってみせましょう」といったそうだ。これは、「ドン・キホーテ」の有名な一文「君の友人を教えなさい、そうすれば君がどういう人間か言ってみせよう」をもじったものであるが、示唆に富んだ文である。その人が何をべるか(もっと正確に言えば、何をべないか)によって、その人の育ちや信仰、文化的・民族的背景など様々なことを知ることが出来る。 同様に、口コミもそれを書いた人について多くを物語る。ここで試しに、以下に挙げたべログの口コミを読んで頂きたい。 バラのクリームにたっぷりのフランボワーズをマカロンとともに。ルバーブのアクセント。コレめっちゃカワイイ(*^_^*) 一目ぼれです☆ バラにフランボワーズにマカロンにピンクときたら、女子にはたまらない~! ちょっと高めの価格設定やけど、

    食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog
  • ステマとアフィリエイトの境界 - ny23の日記

    ついでなので,今さらながらステマについても少し書いてみる. 前提: ステルスマーケティング - Wikipedia べログのステマ問題で世間が盛り上がっていた頃,ステマ(のレビュー)を自動判別できるかという話題を見かけた.その少し前に Finding Deceptive Opinion Spam by Any Stretch of the Imagination (ACL 2011) という論文を眺めていて,opinion spam の判別を人間よりうまくできたと見た記憶があったので,さほど難しくないだろうなという印象を持った. 個人的には,ham の再現率を100%にしなければならない E-Mail の spam 判別と違い,opinion spam 判別は(ユーザの立場からは)ham の再現率を100%にする必要が必ずしもない場合が多いので,分類問題として厳密に解くほどの価値はないと

    ステマとアフィリエイトの境界 - ny23の日記
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • 自分たちで歴史を書き残すこと - 「敷居の部屋」シリーズを読む - ただのにっき(2010-01-23)

    ■ 自分たちで歴史を書き残すこと - 「敷居の部屋」シリーズを読む 「年甲斐もなく……」と揶揄されそうな趣味を持つときは、大人の防衛能として「ちゃんと役に立ってる」ように見せかける言い訳を用意しがちだと思うのだけど、ニコマスに関しても「Web屋としてネット時代のCGMについて知見を得るため」みたいな表向きの理由をちゃんと用意してあるわけです。音としては「765プロのアイドル最高です」に尽きるわけだけど(笑)。 冗談はさておき(どっからが冗談だったんだ)、この3年間をとおしてニコマスを通して得たCGMに関するアレコレは実際血肉となっているわけで、お客さんからその手の仕事を振られてもそれなりにこなせるだけの知識と経験を得られたと思ってる。それどころか英語サイトの運営を通してSEO/SEM的な実験までさせてもらって、なんとも有意義な3年間だったよなぁ。以前書いたニコ動のコミュニティに関する記

  • 座談会 ネット時代のこころを探る(ゲスト 近藤淳也)【前編】〜京都大学こころの未来研究センター学術広報誌『こころの未来』〜 - はてな広報ブログ

    年5月、京都大学こころの未来研究センターにて「ネット時代のこころを探る」というテーマの座談会がおこなわれ、はてな代表・近藤淳也(id:jkondo)がゲストとして参加しました。 「異なる学問領域の研究者が集い、こころに関する学際研究を推進する、他に類をみないユニークな研究組織」として様々なプロジェクトを推進する同センターの3人の助教の方々と語り合った模様を3回に分けてご紹介します。 (内容は同センターの学術広報誌『こころの未来 vol.3』掲載記事をセンターの許可を得て全文掲載したものです) 座談会 ネット時代のこころを探る【前編】 インターネット時代を迎え、人のこころのあり方、あるいはこころの捉え方はどのように変わりつつあるのか。常識にとらわれないウェブサービスの会社「はてな」を運営する近藤淳也さんをゲストにお迎えし、センターの助教が縦横に議論する。 参加者 近藤淳也(株式会社はてな

    座談会 ネット時代のこころを探る(ゲスト 近藤淳也)【前編】〜京都大学こころの未来研究センター学術広報誌『こころの未来』〜 - はてな広報ブログ
  • NNDD - ニコニコ動画専用ブラウザ - MineAP’s diary

    プロジェクトのメインページはSoruceForgeのページへ移行しました! NNDDプロジェクトメインページ NNDD - ニコ動専用ブラウザ - SourceForge.JP チケット管理 チケット一覧/検索 - NNDD - ニコニコ動画専用ブラウザ - SourceForge.JP バグ報告・改善要望 WikiBugReport - NNDD - ニコニコ動画専用ブラウザ Wiki - SourceForge.JP 寄付 NNDDを使ってみて、「これは振り込めない詐欺」だと思った方などいらっしゃいましたら、下のボタンを押して寄付をしていただけると開発者が喜びます。 (絶対寄付しなければならない、というものではありません。また、「寄付をしていただいた方の意見を優遇する」といったことはしません。) PayPal PayPalで寄付をしていただける方はこちらから。 Amazonギフト券 A

    NNDD - ニコニコ動画専用ブラウザ - MineAP’s diary
  • [ゆ]: Twitterで話題のサイトをはてブ風に並べる「Twib(ツイブ!)」を公開しました

    サキとは彼女の自宅近く、湘南台駅前のスーパーマーケットで待ち合わせをした。彼女は自転車で後から追いつくと言い、僕は大きなコインパーキングへ車を停めた。煙草を一吸ってからスーパーマーケットへ向かうと、ひっきりなしに主婦的な女性かおばあちゃんが入り口を出たり入ったりしていた。時刻は午後5時になる。時計から目を上げると、待たせちゃったわねと大して悪びれてない様子でサキが手ぶらでやってきた。 お礼に料理を作るとはいえ、サキの家には材が十分足りていないらしく、こうしてスーパーマーケットに寄ることになった。サキは野菜コーナーから精肉コーナーまで、まるで優秀なカーナビに導かれるように無駄なく点検していった。欲しい材があると、2秒間程度それらを凝視し、一度手に取ったじゃがいもやら豚肉やらを迷うことなく僕が持っているカゴに放り込んだ。最後にアルコール飲料が冷やされている棚の前へ行くと、私が飲むからとチ

    [ゆ]: Twitterで話題のサイトをはてブ風に並べる「Twib(ツイブ!)」を公開しました
  • 開発チームが明かす、Google Waveの実装概要 - @IT

    2009/06/01 グーグルが発表した新しいコミュニケーションプラットフォームの「Google Wave」が大きな反響を呼んでいる。技術的な詳細がかなり明らかにされているので、何が可能かはだいたい予想ができそうだが(だからこそ発表時に会場を埋めていた4000人あまりの聴衆は興奮のあまり立ち上がって喝采を送ったのだが)、誰も想像できなかったようなキラーアプリケーションが登場するのかどうか、あるいはWave自体がキラーアプリケーションなのか、それはまだ誰にも分からない。 レポート記事(【詳報】Google Waveとは何なのか?)への反響を見ると、さまざまな疑問を感じている人がいる。そこでここでは、直接Waveのプロジェクトリーダーに話を聞いたり、別セッションで開発チームが行った説明、およびオンラインドキュメントから読み取れたことなど、いくつか追加情報をまとめたい。ちなみに、Google I

  • テキストからの評判分析と 機械学習

    テキストからの評判分析と 機械学習 鍜治伸裕 東京大学 生産技術研究所 講演の前に • 想定している聴衆 – 評判分析について専門的なことを知らない – 機械学習(ML)の素養を持っている • 講演の内容 – 評判分析という分野の解説 – 評判分析における ML の適用事例の紹介 • お断り – 自然言語処理(NLP)の話に特化 – ML を使っている論文を私の好みで選んで紹介 評判分析を概観する 評判分析はこんな技術 • 例: Yahoo!ブログ検索における「VAIO」の検索結果 肯定的評判と否定的評判の 書き込み数を集計して表示 肯定的な書き込みと否定的 な書き込みを分類して提示 背景: CGMの出現 • CGM – Consumer Generated Media のこと – 例えば Amazon に投稿されたレビューやブログなど – 一般人が作成,発信するコンテンツである点がポイン

  • 統計的に正しいランキングを行う方法 - Hello, world! - s21g

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 ポジティブ/ネガティブ投票による正しいランキング方法が以下の記事で紹介されています。 How Not To Sort By Average Rating この計算方法では、投票数が少ない場合には分散が大きく不正確な評価で、 投票数が多くなるにつれて分散が小さく正確な評価が得られているという事を考慮しています。以下数式 これはScoreの信頼区間を表しています。 この信頼区間の下界をランキングのスコアにすれば良い事になります。 ここで、は、 です。全体に占めるポジティブ投票数の割合ですね。 は標準正規分布上の 信頼区間の有意確率です。 さて、五段階評価によるRatingに同様のテクニックを適用する場合はどうしたらいいでしょうか

  • 【2ch】日刊スレッドガイド : 2ちゃん語の言語学

    2ちゃん語と言われる物が大量にある。 しかし、よく考えると書き言葉というのは話し言葉と違って保守性が 強いと言われる。さて、なぜ2ちゃん上では数多くの流行語が現れては 消えるのか、言語学板はどう考える?

  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品

  • 株式会社サイバー・バズ|CyberBuzz, Inc.

    ソーシャルメディアマーケティング支援 独自のインフルエンサーネットワークやSNSアカウント運用の知見を活かした、総合的なソーシャルメディアマーケティング支援を展開しています。

    株式会社サイバー・バズ|CyberBuzz, Inc.
  • ニコニコ動画のデータ分析研究発表会の資料とか見てみる - 傀儡師の館.Python:楽天ブログ

    2009.01.30 ニコニコ動画のデータ分析研究発表会の資料とか見てみる カテゴリ:ことばの処理 グニャラくんの ニコニコ動画データ解析発表会でニコニコ大百科の宣伝を行いました(発表資料もあるよ!) を読む。GLOCOM で行われた ニコニコ動画データ分析研究発表会 について書かれている。「膨大なデータを分析して見えてくること」ニコニコ動画データ分析研究発表会 なども参照。 発表資料一式 をダウンロードしてみてみた。むむ。はっきり言って、材料が材料だけに (ニコニコ動画のデータ分析だから)、それなりにオタク度が高い人でないと、そこに並んでいる言葉の意味が分からないものだらけだったりする。比較的理解可能だと思われる動物のあたりを見ても、「ぬこ」ってなんだよ、「ぬこ」って。Google で「ぬこ」。ぬこ に一致する日語のページ 約 3,080,000 件。ふーん、かなり普通に使われているん

    ニコニコ動画のデータ分析研究発表会の資料とか見てみる - 傀儡師の館.Python:楽天ブログ
    kana0355
    kana0355 2009/02/02
    ”「美希」「Im@sコラボPV」「真」「雪歩」という並びは『ゆきまこ』が『みきまこ』に対して優勢なのをよく表してるなあとか。 まったくわからん。”……(汗).
  • ニコニコ動画の大規模なデータに対するタグ付けとリンク解析 - 武蔵野日記

    ニコニコ動画データ分析研究発表会というのが開催されていたようだ。 タイトルや説明文はノイジーなので、動画につけられたタグを使うと割ときれいなデータとして可視化したりできる、という話は、はてなブックマークの関連エントリー機能のときも聞いたような話で、基的にはインターネットユーザに無料でデータのタグ付けをしてもらっている、という話なんだろうな、と思う。以前紹介したRion Snow の論文 (彼は2005年に Microsoft Research でインターンし、2006年に Powerset (現在は Microsoft に買収済み)、2007年には Google でインターンした人物。ACL という自然言語処理のトップカンファレンスで2006年にベストペーパー受賞)で、 今年の Rion Snow のトークは、Amazon Mechanical Turkというシステムを使って、非常に安価

    ニコニコ動画の大規模なデータに対するタグ付けとリンク解析 - 武蔵野日記
  • 「膨大なデータを分析して見えてくること」ニコニコ動画データ分析研究発表会

    最大の動画投稿サービス「ニコニコ動画」は、動画上を流れるコメントや、自由に編集できるタグ機能といった特徴を持ち、単なる動画共有サービスにとどまらず、コミュニティサイトとしての側面も持つ。多くの人がアクセスする中で「アイドルマスター」「初音ミク(VOCALOID)」「東方プロジェクト」など、いろいろなムーブメントが生まれてきた。 今も毎日多くの動画が投稿されており、各動画は「再生数」「コメント数」「マイリスト数」などの情報がわかるようになっている。すでに投稿動画数は200万を超えるが、これら膨大なデータを分析することで、どんな現象やコミュニケーションが起きているのかを明らかにしようとするのが今回の発表会の目的である。 分析する際の2つの障壁 独自にデータ収集が必要であること しかし、そもそもニコニコ動画自体はデータを分析しやすいように広く提供しているわけではない。1つ1つの動画の再生数

    「膨大なデータを分析して見えてくること」ニコニコ動画データ分析研究発表会
  • クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)