タグ

dataに関するAOI-CATのブックマーク (22)

  • Why are you using Python ? Rによる自動集計ガイド - Qiita

    ※タイトルで煽るのは良くないと思ったのでタイトルを変えました。 まだExcelで消耗してるの?Pythonによる自動集計ガイド 基礎編 - Qiitaを読んでいて(Rのが絶対便利…!)というお気持ちが強まってきたので勢い余って書きました。 はじめに PythonColaboratoryで手軽に試せて非常に良いです。実は、RもColaboratoryから使うことができます。ColaboratoryにはRのカーネルが既に入っているのですが、表から見えないようになっているだけなのです。 そこで、見えるようにしたものを用意しました。 R Example - Colaboratory このノートブックを使えば、Rだってすぐ試せます(もうちょっと詳しい説明はColaboratoryでRやSwiftを使う - Qiitaをどうぞ)。 試して下さい。今すぐ。 使用するパッケージ 主にdplyrを使います

    Why are you using Python ? Rによる自動集計ガイド - Qiita
    AOI-CAT
    AOI-CAT 2019/04/15
  • Orange Data Mining

    Data Mining Fruitful and FunOpen source machine learning and data visualization. Download Orange 3.36.2 Apr 15, 2024 So Sweet and So Fresh … New Text Mining Tutorial is OutA step-by-step guide on how to build a classifier to predict food types. Getting the know the widgets Test and Score, Logistic Regression, Confusion Matrix, Predictions. Jan 11, 2024 Scoring Sheets: Transform Data into Insightfu

    AOI-CAT
    AOI-CAT 2018/11/08
  • 政府統計の総合窓口 GL01010101

    統計データを探す すべて 分野から探す国土・気象人口・世帯労働・賃金農林水産業鉱工業商業・サービス業企業・家計・経済住宅・土地・建設エネルギー・水運輸・観光情報通信・科学技術教育文化・スポーツ・生活行財政司法・安全・環境社会保障・衛生国際その他 組織から探す 内閣官房人事院内閣府公正取引委員会警察庁消費者庁こども家庭庁総務省公害等調整委員会消防庁法務省外務省財務省国税庁文部科学省文化庁スポーツ庁厚生労働省中央労働委員会農林水産省林野庁水産庁経済産業省資源エネルギー庁特許庁中小企業庁国土交通省観光庁海上保安庁環境省防衛省 主要な統計から探す 50音から探す あ い う え お か き く け こ さ し す せ そ た ち つ て と な に ぬ ね の は ひ ふ へ ほ ま み む め も や ゆ よ ら り る れ ろ わ すべて見る 分野から探す 国土・気象人口・世帯労働・賃金農林

    政府統計の総合窓口 GL01010101
  • ニコニコ解析(γ) - ニコニコ動画を「解析してみた」

    2023/03/09 00:48 投稿 蛸責屋烏賊狗斎6:22【コニャックとコンニャクで】ゆかりのふらっと隠れ家 第2期♭169【味実験】再生:101 コメ:45 マイ:3 2023/03/09 20:00 投稿 南瓜ぐてぃ27:23【ロックマン7RTA】49分43秒 ゆっくり実況 part2【南瓜ぐてぃ】再生:4,850 コメ:826 マイ:14 2023/03/08 20:00 投稿 masterarien29:57【MUGEN】旧章X回リスペクト 希望vs絶望 狂と神の輪舞曲 隔離を添えて Part7再生:1,429 47%コメ:400 63%マイ:5 64%2023/03/08 12:00 投稿 いえろーず2:22これこそが模範的な福井県というやつなのだ!【GeoGuessr】再生:2,286 55%コメ:126 58%マイ:2 86%2023/03/08 13:19 投稿 ポリス

    ニコニコ解析(γ) - ニコニコ動画を「解析してみた」
  • JSON Table Schema - Data Protocols - Open Knowledge Foundation

    Language The key words “MUST”, “MUST NOT”, “REQUIRED”, “SHALL”, “SHALL NOT”, “SHOULD”, “SHOULD NOT”, “RECOMMENDED”, “MAY”, and “OPTIONAL” in this document are to be interpreted as described in RFC 2119. Changelog 1.0-pre7: Add contraints.oneOf issue 1.0-pre6: clarify types and formats issue 1.0-pre5: add type validation issue 1.0-pre4: add foreign key support - see this issue 1.0-pre3.2: add prima

    JSON Table Schema - Data Protocols - Open Knowledge Foundation
  • DATA GO JP/open data

    データセット データセットとは、ファイルやURLなどの「オープンデータ」が登録された入れ物を指します。 データポータルでは、複数の切り口からデータセットを探すことができます。

  • 「ニコニコチャンネル」有料ユーザー20万人突破 上位は年3000万円以上稼ぐ

    「ニコニコチャンネル」の有料登録者数が20万人を突破。上位6チャンネルの年間分配額は、3000万円以上に上るという。 ドワンゴは8月22日、企業や著名人、人気ユーザーなどが有料でメールマガジン発行や動画配信などが行える「ニコニコチャンネル」のうち、メールマガジン「ブロマガ」を配信しているチャンネルの有料登録者数が、14日に合計20万人を突破したと発表した。 ニコニコチャンネルは2008年にサービスを開始し、現在、566チャンネルが開設されている。12年8月からは、ブログとメールマガジンを同時配信できる「ブロマガ」機能を提供。13年12月からは、一般ユーザーが開設できる「ユーザーチャンネル」をスタートした。 ニコニコチャンネルの総売上額は約12億5000万円、チャンネル開設者への総分配額は約7億6000万円に上ったという。 有料チャンネルの年間分配額は、3000万円以上が6チャンネル、100

    「ニコニコチャンネル」有料ユーザー20万人突破 上位は年3000万円以上稼ぐ
  • C3.js | D3-based reusable chart library

    Comfortable C3 makes it easy to generate D3-based charts by wrapping the code required to construct the entire chart. We don't need to write D3 code any more. Customizable C3 gives some classes to each element when generating, so you can define a custom style by the class and it's possible to extend the structure directly by D3. Controllable C3 provides a variety of APIs and callbacks to access th

  • BigQueryにTwitterのタイムラインを入れる [Ruby]

    Twitter のタイムラインを保存しておくとなにかと便利なので、色々と保存形式を変えながら 4 年くらい記録し続けている。ツイートの保存が便利すぎるので、ツイセーブというサービス化までした。かつてはテキストで、MongoDBMySQL とか Groonga とかいろいろやってきた。どれも問題ないんだけど、増え続けるログデータを保存する場所として考えると BigQuery が現代にマッチしてるようなのでそちらに移行した。 BigQuery に TL を保存するとできること TL の全てのデータをフルスキャンできる。これはかなり便利で、今回このブログ記事を書くにあたっても ‘BigQuery’ を TL から検索すれば、信頼できるフォローイングの人々の声を見ることができた。これにより「某 CA 社では 5000 台の MongoDB クラスタで BigQuery に対抗している」という

    BigQueryにTwitterのタイムラインを入れる [Ruby]
  • Googleの虎の子「BigQuery」をFluentdユーザーが使わない理由がなくなった理由 #gcpja - Qiita

    「BigQueryは120億行を5秒でフルスキャン可能」は当か? 先日、kaheiさんがGoogle BigQuery(Googleクラウドの大規模クエリサービス)について、こんなエントリを書いていた。 とにかくパフォーマンスがすごい。(Fluentd Meetupでの)プレゼン中のデモで、ディスクに収められた5億件のデータをSQLでフルスキャンするのに3秒しかかからない。9億件のデータを正規表現を含んだSQLでスキャンしても、7秒で終わる(これ、記憶がちょっとあいまい。もう少しかかったかも)。これには驚いた。佐藤さんがGoogleに入社して一番驚いた技術が、一般公開される前のBigQueryだったと言っていたが、その気持ちはわかる。 From Fluentd Meetupに行ってきました これを読んだ時、BigQueryの検索スピードについてちょっと補足したくなった。確かにFluent

    Googleの虎の子「BigQuery」をFluentdユーザーが使わない理由がなくなった理由 #gcpja - Qiita
  • Crossfilter

    Fast Multidimensional Filtering for Coordinated Views Status Crossfilter is not under active development, maintenance or support by Square, its original author Mike Bostock, or the recent contributors (Jason Davies, Tom Carden). We still welcome genuine bug-fixes and PRs but consider the current API and feature-set (~1.3.12) essentially complete. A new Crossfilter Organization has been created on

  • ニコニコ学会βデータ研究会でカップリング表記の発表をしてきました - あまあまくろにくる

    先日こちら→第四回ニコニコ学会βデータ研究会(3月8日) で↓こんな発表をやらせて頂きました。 資料はSlideShareとかにupして終了かなと思っていましたが 内容的に補足がないとさっぱりな気がするので、こちらで。 ニコ生・Twitter・当日頂いたコメント用紙の質問にも 回答しながら振り返ってみようと思います。 ※発表当日は実際のサークルカットを映していましたが、ここでは隠しています (学術目的の引用範囲だと思いますが、念のため) オープニングセレモニー テンプレ通り、自己紹介を。 最近「カップリング表記研究家」を名乗り始めました。 15分と言いながら20分以上やってました。てへぺろ。 事前のTwitterを見ていたら、参加者は男性が多そうだったので 「カップリング表記とは」的な確認を最初に入れてみました。 1.カップリング表記って? 辞書っぽく書くとこうですが、実際に見てみたほうが

    AOI-CAT
    AOI-CAT 2014/03/12
  • 情報学研究データリポジトリ ニコニコデータセット

    ニコニコ大百科データ ニコニコ大百科に2014年2月上旬までに投稿された記事全ての記事ヘッダ,記事文データと,それに付随する掲示板全データです。ただし,ユーザーページ,ユーザーIDは削除されています。 記事ヘッダデータ 記事ID,記事タイトル,記事ヨミ,記事種類(a:単語,v:動画,i:商品,l:生放送),記事作成日時などのデータです。CSV形式のファイルで,1年当たり1ファイル,圧縮ファイルで約4.9MB,展開後は約14.9MBです。 記事文データ 記事ID,記事文,記事更新日時などのデータです。CSV形式のファイルで,1月あたり1ファイル(例外あり),圧縮ファイルで約4.52GB,展開後は約22.7GBとなりますので,ダウンロードされる際はご注意ください。 掲示板データ 記事ID,レス番号,レス投稿日時,レス文などのデータです。CSV形式のファイルで,1年あたり1ファイル,圧縮

  • d3.js API Advent Calendar 2012 - Adventar

    * 全部書きます * API周り書きます

    d3.js API Advent Calendar 2012 - Adventar
  • D3.js

    D3The JavaScript library for bespoke data visualization Create custom dynamic visualizations with unparalleled flexibility

    D3.js
  • ニコ動の動画のつながりを可視化してみた。

    Tell Your Worldを聞いてたら見てみたくなったので。ニコニコ動画の再生数の多い動画についての動画間のつながり(動画説明文中のリンク)を可視化してみた。データは自前の収集。可視化にs.o.c.i.a.r.i.u.mを使用。動画化とかはできないのでキャプチャソフト使用。その他動画の詳細は4分あたりから。s.o.c.i.a.r.i.u.m http://syrinx.q.t.u-tokyo.ac.jp/hashimoto/sociarium/いつも思いつき。 mylist/26417530

    ニコ動の動画のつながりを可視化してみた。
    AOI-CAT
    AOI-CAT 2012/03/14
    s.o.c.i.a.r.i.u.m(ドットがいっぱいで打ちにくい)、あとで使ってみる
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • ニコニコ動画のタグデータ - あたご型護衛艦日記

    以前の日記でお伝えした通り、現在、ユーザスクリプトを用いてニコニコ動画のタグデータの収集を行っています。 ある程度レコード数も溜まって来たので共起ネットワークなどの解析したいのですが、諸々の事情でなかなか出来ないため、とりあえずデータだけ公開しておきます。 解析自体はいつか必ずやりたい… 何か解析してみたいという奇特な方がいらっしゃいましたら、どうぞお使いください。 ダウンロードはこちらから zipファイルの中身はカンマ区切りのCSVファイルです。 動画ID - タグ名 のレコードです。 180万レコード以上あります。間違ってもエクセルで開こうなんて考えないで下さい。 自己責任での使用をお願いいたします。(ウィルスチェックは一応行ってあります) ご意見等ありましたら、ついったーかコメント欄までお願いします。

    ニコニコ動画のタグデータ - あたご型護衛艦日記
  • ニコレク -ニコニコ動画まとめブログ- 各ジャンルにおける最多ウォッチリスト数のうp主

    御三家や音MAD、してみた系などの各ジャンルにおいて、 最もウォッチリストに登録されている数が多いうp主を紹介します。 なお、ウォッチリスト数は2011年2月2日深夜時点での合計数です。 Powered by niconico ranking expectation thread VOCALOID ハチ  15964人 マトリョシカ、パンダヒーローの作者 独特な曲調、イラストで人気沸騰中のボカロP マトリョシカを作った時点ではまだ未成年だったとか 東方Project まことじ 7345人 へんたい東方を始めとした多くの東方手書きシリーズの作者 その投稿スピードは東方手書き界隈でも随一 自身のサイトではオリジナル漫画「楽凡抄」を連載中→まことじの日記とか アイドルマスター ハリアーP  3730人 主にNovelsM@sterを中心に活動する動画投稿者 特徴的な手書きイラストを使ったノベマス

  • データ発見隊 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    データ発見隊 記事一覧 | gihyo.jp