タグ

ブックマーク / repose.hatenadiary.jp (16)

  • 機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン) 読んだ - 糞糞糞ネット弁慶

    www.amazon.co.jp 訳者よりご恵贈いただきました.8年前に kaggle のアカウントを作ったきりの人間であるため,この文章にさほど価値があるとは思えませんが感想を書きたいと思います. ロジスティック回帰や決定木,ランダムフォレストやニューラルネットワークなどの機械学習アルゴリズムにどのようにデータを入力するか,ただのデータをよりアルゴリズムのパフォーマンスが改善するように加工する作業を「特徴量エンジニアリング」と呼びます. 書はその特徴量エンジニアリングの基礎である 変数の値をそのまま使うのか,二値化するのか,区分に分けて離散化するのか,対数を取るのか,値を一定の区間に揃えるのか テキストをどのように特徴量にするのか,どう処理すべきか,どう重み付けるのか カテゴリ変数をどのように扱うのか,カテゴリの数が増えた時にどう対処するか 変数の数が多い時にどう減らせば良いのか k-

    機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン) 読んだ - 糞糞糞ネット弁慶
    Rion778
    Rion778 2019/03/02
  • JSAI 2018 / 2018年度 人工知能学会全国大会(第32回) 行った - 糞糞糞ネット弁慶

    はじめて桜島を見た.「農業とAI」セッションはモチベーションが面白い. [2G3-OS-10c-01] 動画像からの豚体の頭部方向識別に用いる特徴量 JSAI2018/Features values for recognition of swine's head direction from video. 豚の病気検知のために水を飲んでいるか,餌をべているかの判定が必要 豚舎内の画像から尾なのか頭なのかを判定したい データを見続けた発表者の「皆さんはわからないと思うが私は豚の画像を見続けてきたのでこれが尾か頭かすぐにわかる」という言葉には重みがある [2G3-OS-10c-03] 牛の分娩予兆として映像から観測可能な状態の検知 JSAI2018/Detection of Cattle States Relevant to Calving from Video 牛の出産事故は経済

    JSAI 2018 / 2018年度 人工知能学会全国大会(第32回) 行った - 糞糞糞ネット弁慶
    Rion778
    Rion778 2018/09/13
    “「農業とAI」セッションはモチベーションが面白い”
  • 声優統計コーパスの利用事例暫定まとめ - 糞糞糞ネット弁慶

    声優統計学会 にて声優統計コーパスを公開してほぼ一年.個人団体を問わず問い合わせのメールを頂いている. しかしよく考えたら Google Analytics の設定をまともに書いていなかったせいでどれぐらいダウンロードされたのか全く計測できていない.せめて,検索して見つけた範囲で利用されているブログ記事を集めた. 声優統計コーパスを使ってみる - 驚異のアニヲタ社会復帰への道 声優統計コーパスをアライメントしてみる | Hiho's Blog 日声優統計学会の公開データを使って声優さんの声認識 – 京都の技術者ロードローラーさんのブログ 声優統計コーパスを使ったWaveNet音声合成/歌声合成に挑戦します - Monthly Hacker's Blog 声優統計のデータを使った、簡単なGMM声質変換のデモノートブック - Jupyter Notebook @__dhgrs__さんから

    声優統計コーパスの利用事例暫定まとめ - 糞糞糞ネット弁慶
    Rion778
    Rion778 2018/04/18
  • プロの女性声優 3 名が 3 パターンの感情表現で読み上げた音声 2 時間分 を「声優統計コーパス」として無料公開します - 糞糞糞ネット弁慶

    声優統計学会 サークル「日声優統計学会」の最後の活動として,読んでくださった方々への恩返しの意味を込め, id:repose と id:MagnesiumRibbon で声優統計コーパスを上記ページにて公開しました. 概要 声優統計コーパスは diphone の出現頻度を考慮しながら独自に構築した音素バランス文 その音素バランス文をプロの女性声優 3 名が 3 パターンの感情表現(ニュートラル,喜び,怒り)で読み上げた総長約 2 時間,総ファイルサイズ 720 MB,計900個の音声ファイル の 2 つで構成されています. 音素バランス文については表示 - 継承 4.0 国際 (CC BY-SA 4.0)で公開しています. 音声ファイルについては研究・分析目的でのみ無償で利用可能です. 音素バランス文 音素バランス文は日語版 Wikipedia文データを元に構築しています.

    プロの女性声優 3 名が 3 パターンの感情表現で読み上げた音声 2 時間分 を「声優統計コーパス」として無料公開します - 糞糞糞ネット弁慶
    Rion778
    Rion778 2017/06/27
  • 退職します - 糞糞糞ネット弁慶

    先日の大久保瑠美さんのラジオで読まれたメールでも書いたように,9月末で今の職場を退職します. そんなことよりも今は,2015年9月30日で終了する大久保瑠美さんの動画付ラジオ番組「A&G NEXT GENERATION Lady Go!!」の最終回の事を考えたい.

    退職します - 糞糞糞ネット弁慶
    Rion778
    Rion778 2015/09/26
  • というわけでTsukuba.R#9@東京大学に参加してきた & 発表してきた - 糞糞糞ネット弁慶

    Tsukuba.R#9 - Tsukuba.R - Seesaa Wiki(ウィキ) 前回企画から8ヶ月,前回実施から14ヶ月ぶりの実施となったTsukuba.Rをやってきた. One more time in Tsukuba.R (@wakuteka) Rをいきなり使う事になったユーザに対する手引きとして書籍,ウェブサイトの紹介.そして統合開発環境としてHome - RStudioも紹介. RStudio,タイムラインでは散々話題になっていたが「俺にはEmacs + ESSがある」と頑なに拒んでいたので動いているのを見るのははじめてだった.結構良い感じだったので他の人に薦める時はまずRstudioから薦めようと思う.また,SweaveというTeXコードとRのコードをまとめて書けるパッケージも軽く触れられていて@gentlementatu氏が興味を示していた. ポケモンのインターフェース風

  • 少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読

    言いたいことはタイトル. そもそもSIGKDDとはSpecial Interest Group on Knowledge Discovery and Data Miningというデータマイニングや知識獲得のトップカンファレンス.WWWについで読んでて興味が合う論文が多い. How to do good research, get it published in SIGKDD and get it cited!(pdf) 173ページあるスライドだけど良い事ばかり書いてあるし,読者を楽しませるような非常に多くの著者の実体験(成功したものだけでなく,失敗したものも)や,後半になるとダメな論文,間違っている論文,その例が大量に載っていて飽きずに読める.ただKDDに通したい人だけでなく,研究を少しでもやろうとしている人,論文を書こうとしている人,面白いことをやりたい人は必ず読むべき. 適当に面白か

    少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読
    Rion778
    Rion778 2011/11/03
  • Rユーザは「グラフィックスのためのRプログラミング―ggplot2入門」を今すぐ注文しましょう - 糞糞糞ネット弁慶

    グラフィックスのためのRプログラミング―ggplot2入門 作者: H.ウィッカム,石田基広,石田和枝出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2011/07/18メディア: 単行購入: 7人 クリック: 265回この商品を含むブログ (7件) を見る俺のようにggplot2に手を出そう手を出そう俺もggplot2でシャレオツなグラフを作ればウハウハやといつも思い入門用エントリとかブックマークするもそれだけで何かやり遂げた気分になってしまい実際グラフが必要な場面になると面倒くさくなって標準のplot,果てはExcelで済ませてしまうような人こそこのを買うべき.

    Rユーザは「グラフィックスのためのRプログラミング―ggplot2入門」を今すぐ注文しましょう - 糞糞糞ネット弁慶
  • はてなダイアリーのtex記法は綺麗じゃないのでいつもgoogle chart apiを使っている - 糞ネット弁慶

    綺麗じゃないし,場合によっては赤文字の変な画像が出て数式が読めない. しかし,書いている最中ははてなダイアリーのtex記法が楽で良い. よって,いつも論文メモの数式については,書く時はtex記法,更新するときはgoogle chart apiを使って画像を埋めこんでいる. require "cgi" google_url = "http://chart.apis.google.com/chart?cht=tx&chl=" ARGF.each{|l| l.chomp! l.scan(/(\[tex:(.*?)\]){1,}/).each do |e| math = e[1] url_math = CGI.escape(math) l.sub!(/#{Regexp.quote(e[0])}/,"<img src=\"#{google_url}#{url_math}\">") end puts

    Rion778
    Rion778 2011/05/06
  • 「放置系ブラック研究室で楽しく生きるにあたって」の補足 - 糞糞糞ネット弁慶

    これは放置系ブラック研究室で楽しく生きるにあたって - 糞ネット弁慶の補足である. 書いた目的 放置系研究室の存在を世に知らしめたかった そもそも一般的な院生に対して放置系の話をすると全くと言っていいほど通じない.意識高い他大学院生と話していても 意識高い他大学院生(略称:意識高):「修論どうですか?」 私:「や,全然やってないんですけど.」 意識高:「あー,これまでの研究をまとめて修論にしちゃう感じですか?凄いなー.」 私:「え,だから論文とか当に書いてないんですけど.まだテーマも決まってないし.」 意識高:「またまた〜そんなこと言って出してるんでしょ?ところで次の***(学会名)出します?」 私:「(***ってそもそも何だ……知らないとか言っても通じないだろうし……)や,出さないですね.」 意識高:「そうなんですか.僕なんか***と△△△と◯◯◯出さなきゃいけなくて当に忙しいし,そ

    「放置系ブラック研究室で楽しく生きるにあたって」の補足 - 糞糞糞ネット弁慶
    Rion778
    Rion778 2011/02/06
  • 放置系ブラック研究室で楽しく生きるにあたって - 糞糞糞ネット弁慶

    (2/6 補足書きました→「放置系ブラック研究室で楽しく生きるにあたって」の補足 - 糞ネット弁慶) 修士論文を提出し,発表を済ませた.また,これをもって大学院及び研究室に関する全ての行事が終了した(「教授が論文書けってうるさいから春休み潰れるわ〜まじないわ〜」などという学生とは違う).というわけなので三年間の研究室生活について振り返ってみる. 放置系ブラック研究室とは そもそも我が研究室は非常に放任主義の放置系ブラック研究室であった.いくつか例を挙げると 論文紹介や輪講などない M2になってから7回程度しかゼミをやった記憶が無い 研究テーマが上から降ってくることがない 教授が卒論・修論のテーマを提出の一ヶ月前まで把握していない 研究しない 論文(書かない|書けない) (研究会|全国大会|諸々)(出ない|出さない|出せない) そもそも何がいつあって締切りがいつとか知らない 学生が学会に何一

    放置系ブラック研究室で楽しく生きるにあたって - 糞糞糞ネット弁慶
  • TsukubaR#8主催 & 「俺のUseR!解説が45分でわかるわけがない」を発表してきた - 糞ネット弁慶

    というわけで、産業総合技術研究所@つくばでTsukuba.R#8をやってきた。 Tsukuba.R#8 - Tsukuba.R - Seesaa Wiki(ウィキ) 今回は@toddler2009さんことカーネル多変量解析―非線形データ解析の新しい展開 (シリーズ確率と情報の科学)の赤穂昭太郎様をお招きしつつ、会場までご用意していただきました。 録画したUstreamはこちら→http://www.ustream.tv/recorded/9672856 僕のスライドはこちら。今回は「漫画などのネタ画像を使わずに面白いの作れ」とある方から言われたのでネタ画像抜きで作ったら非常に時間がかかって泣いた。 useR!2010 matomeView more presentations from ybenjo.スライドにも書きましたが、UseR!で日人がもっと発表するようになれば面白いと思います。

  • kazusaWCとは何だったのか & Gene indexingを用いた教師なし学習による類似遺伝子の推定をやった - 糞ネット弁慶

    半年近くDBCLSで取り組んできたkazusaWCのまとめを書く。以下続きを読む記法。 kazusaWCとは かずさアノテーションを使った類似遺伝子推定システムの筈だったもの。以下手法解説。 背景と目的 Social Genome Annotation - TogoAnnotation かずさDNA研究所 - 幅広く社会に貢献する研究所をめざしています。が提供しているかずさアノテーションというサービスがある。 このサービスでは生物種別に論文とそこで言及された遺伝子の関連付けが人手で行われ(gene indexing)、公開されている。具体例を挙げると、 この場合、pmid:11589704の論文(Isolation and characterization of photosystem II subcomplexes from cyanobacteria lacking photosyst

    kazusaWCとは何だったのか & Gene indexingを用いた教師なし学習による類似遺伝子の推定をやった - 糞ネット弁慶
    Rion778
    Rion778 2010/08/21
  • Tsukuba.R#7お疲れ様でした&天使ちゃんマジ天使 - 糞ネット弁慶

    Tsukuba.R#7 - Tsukuba.R - Seesaa Wiki(ウィキ) お疲れ様でした。僕のスライドはこれ。 http://www.slideshare.net/ybenjo/tsukubar7-4027417 なんかEmbedが効かない… 今回は技術評論社様が高画質なUst配信を行ってくださったのでその動画もあります。 以下感想 10分で120枚はさすがに多すぎた なんで僕の時のviewerが最大の120人とかになるんですかね これを見て一人でも「Rやってみよう」と思ってくれたら幸いです randomForestにはバグがあるっぽい話、忘れてたしまだ検証してなかった twitterで僕を知ってた人は「声優の事ばかり書いてる頭のおかしい人が発表けどきっとまともなんだろう」みたいな期待をしたと思いますがそんなわけがない。 Tsukuba.R#7が開催されました&雑惑 - yas

    Tsukuba.R#7お疲れ様でした&天使ちゃんマジ天使 - 糞ネット弁慶
  • Tsukuba.R#6お疲れ様でした - 糞ネット弁慶

    Tsukuba.R#6 - Tsukuba.R - livedoor Wiki(ウィキ) 今日の筑波は最高気温が一桁レベルと非常に寒い感じでしたが、お疲れ様でした。 僕はR+機械学習ライブラリで疎行列が扱いたかったので、そのパッケージの導入をLTで喋りました。 silideshare : とある言語の対疎行列<アンチスパースネス> 参考資料はこちら Sparse Matrices in package Matrix and applications あとロゴ画像生成はこちら。 no title

  • Tsukuba.R#5お疲れ様でした - 糞ネット弁慶

    Tsukuba.R#5 - Tsukuba.R - livedoor Wiki(ウィキ) そんな感じでTsukuba.R#5でした。皆さんお疲れ様でした。 僕のスライドを上げました。 大した時間をかけずともさっと分析できて可視化できるのでRは素晴らしいし、連続変数を扱わない場合はtable関数が神がかっているので積極的に使いましょう。あと破滅的に時間を潰した挙げ句「Rのgrepにperl互換あるじゃん」とか言われて泣きそうになったのは内緒。時刻変換の部分はid:Rion778に教えてもらって助かりました。ここに感謝します。 id:yag_yas 回帰分析をやる話 1分もかかりません lmとupdateを使えば見事に重回帰分析もできる nlsを使うと非線形回帰も使えるようになるとか 年齢推定や!! id:bonohu DBCLSの話 ライフサイエンスデータの「上水処理場+下水処理場」 データ

  • 1