タグ

あとで読むに関するshowyouのブックマーク (81)

  • https://www.fun.ac.jp/~sisp/old_report/2018/06/document06_A.pdf

  • 第1回 嫌いになった企業ランキング 集計結果発表【その②】 - くらのすけ調べ

    こんにちは、くらのすけです。 先月就活を終えた19卒です。 この記事は、以前Twitter(@sanposystem)の方で集計した 【就活を経て嫌いになった企業ランキング アンケート】 の集計結果発表の後編です。 詳しい集計手順等については前の記事に記載しておりますので、そちらをご確認ください。 ↓今回集計したデータは以下の4つにまとめました。 ①就職活動のストレスレベルのグラフ →【その①】で発表 ②嫌いになった企業ランキング    →【その①】で発表 ③企業別 嫌いになった理由 ④有害だと感じた就活支援サイトランキング 今回は残りの③と④を発表していきたいと思います!!! ③に関しては非常に皆さんからの熱い熱い意見を頂戴することができ、とても読み応えのあるものになりました。 集計してみたら、なんとPDF29ページに達しました。 しっかり集まってやがる。 集計に当たっては、皆さんの生の

    第1回 嫌いになった企業ランキング 集計結果発表【その②】 - くらのすけ調べ
  • Kaggleとは?機械学習初心者が知っておくべき3つの使い方

    機械学習の基礎用語や初歩的な手法、数学的な理解を深めませんか?環境構築が不要、オンラインで実行が可能な機械学習入門チュートリアルを公開中!機械学習の世界へ飛び込んでみませんか? スクラッチで最小二乗法と最急降下法をPythonでコーディング(線形回帰) ロジスティック回帰の概要や数学的理解と実践に役立つ知識(ロジスティック回帰) まず呼び方ですが、Kaggleと書いて「カグル」と読みます。日でも最近は定着してきましたが、Kaggleに参加している方を「カグラー(Kaggler)」とも呼びます。 Kaggleですが、サイトへ行くと一番上に書かれていますが「The Home of Data Science & Machine Learning」(データサイエンスと機械学習の家)と題されている通り、世界中の機械学習・データサイエンスに携わっている約40万人の方が集まるコミニティーです。 Ka

    Kaggleとは?機械学習初心者が知っておくべき3つの使い方
  • Andrew Ng先生の機械学習講義を解説する勉強会資料を公開 - エンタープライズギークス (Enterprise Geeks)

    シリコンバレーの有名大学であるスタンフォード大学で、Andrew Ng先生の教える機械学習の講義が人気を集めている。この講義は形を変え、courseraという無料のWeb上オンラインコースとしても受講でき、ここ日でも機械学習の勉強がしたい人達の間でも人気の講義となっている。 [Machine Learning by Stanford University] https://www.coursera.org/learn/machine-learning/ 人気の秘密 Andrew Ng先生の講義は内容が非常に実用的であることが人気の理由の1つとして挙げられるだろう。Andrew Ng先生はシリコンバレーの企業を相手に機械学習の指導をしている。おそらくその経験から、理論に走りすぎず、機械学習を適用するプロジェクトにおいて当に有意義な内容に強くフォーカスしていることが感じられるのだ。Andr

    Andrew Ng先生の機械学習講義を解説する勉強会資料を公開 - エンタープライズギークス (Enterprise Geeks)
  • Dockerを使ってGPUも使える分析環境を構築してみた - のんびりしているエンジニアの日記

    皆さんこんにちは お元気ですか。Kaggle Meetup面白かったです!またあいましょう。 今日はDockerを使った分析環境構築の話をしようと思います。 Dockerを使って何を作ろうかと思ったら、分析環境さっさと作りたい・・・ cudnn等の更新が面倒であることが思い浮かびました。 なんとなく、Dockerを使えば解消できるのではないかといったことを思いつき遊んでみました。 Dockerとは Dockerはコードやシステムライブラリ、システムで利用するのを実行するために 必要な全てが含まれているものをラップするソフトウェアらしい。 OS上で仮想環境を立ち上げ、ソフトウェアなどの実行ができます。 www.docker.com Dockerのメリット 公式サイトによれば、次のとおりです。 階層化されたファイルシステムから構築されるので、ディスクやイメージが効率的 DockerコンテナはL

    Dockerを使ってGPUも使える分析環境を構築してみた - のんびりしているエンジニアの日記
  • 文字認識はCNNで終わるのか?

    電子情報通信学会「パターン認識・メディア理解研究会」(2016年2月14日@九州工業大学,福岡県飯塚市)でのプレゼン資料です. 対応する原稿は以下です. 電子情報通信学会技術研究報告, PRMU2015-133 http://www.ieice.org/ken/paper/20160221UbGo/ 以下はアブストラクトです.=========================== 印刷数字,手書き数字,多フォント数字を対象として,畳み込みニューラルネッ トワーク(CNN) による認識実験を試みた.いずれのタスクにも大規模な データセットを用いた.得られた認識率は,印刷数字について99.99%,手書き数字について99.89%,そして多フォント数字について96.4%であった. さらに印刷数字と手書き数字の混合認識という,予想される困難性からか従来あまり試みられなかった課題についても,CNNの利

    文字認識はCNNで終わるのか?
  • 12800円で自宅や小規模オフィスのネットワークセキュリティ監視環境を構築する - Qiita

    自前で用意したもの 以下のものについては自前で持っている、他の機器の余ったものを流用する、などを想定しています。 USBキーボード(Raspberry Piセットアップ用) HDMIケーブル(Raspberry Piセットアップ用) HDMI入力が表示できるディスプレイ(Raspberry Piセットアップ用) USB micro-bのケーブルと電源(Raspberry Pi用) MicroSDに読み書きができる&有線LANが使えるPC(Raspberry Pi、TP-Link TL-SG108E、BUFFALO BBR-4MGのセットアップ用) 環境構築 最終的にこういう構成になります。ネットワーク構築に慣れている方だとこの図を見ただけで何をすればいいのかについて察しがつくかもしれませんが、今回はなるべく広くITエンジニアの方を対象としたいので細かい設定方法を「TP-Link TL-SG

    12800円で自宅や小規模オフィスのネットワークセキュリティ監視環境を構築する - Qiita
  • Webpackってどんなもの? - Qiita

    初めてのWebpack 今回はWebpackについて紹介したいと思います。 私自身は今回初めて使ったのですが、小規模なプロジェクトの途中から導入していて、 使ってみて結構良い感じなので記事にしてみました。 Webpackとは Node.jsでサーバーサイドで動かすモジュールバンドラーツールになります。 Node.jsでモジュールという単語を聞くと、「npmやbowerとかと何が違うの?」みたいな印象を持たれる方もいるかもしれませんが、基的にはそれらとはまた違った役割をもっています。 npmやbowerはJSライブラリのバージョン管理などの目的としてよく利用されますが、WebpackはJSファイルのコーディングの部分で開発者の手助けをしてくれるのです。 Webpackの基的な役割 5枚ほど図を書いてみましたので、画像とともに紹介していきます。 今回出てくるライブラリたちの紹介 今回使うラ

    Webpackってどんなもの? - Qiita
  • 2016年のディープラーニング論文100選 - Qiita

    これはFujitsu Advent Calendar 2016の11日目の記事です。 掲載内容は個人の意見・見解であり、富士通グループを代表するものではありません。なお、内容の正確性には注意を払っていますが無保証です。 はじめに この記事では先月今年発表されたディープラーニング論文(ArXivでの発表時期、発表された国際会議が2016年開催またはジャーナル掲載が2016年のもの)から私が個人的に重要だと思った論文を収集しています。また、2015年末ごろの論文も重要なものは採用しています。 以下の投稿も合わせてご覧ください。 2017年のディープラーニング論文100選 DeepLearning研究 2016年のまとめ 2016年の深層学習を用いた画像認識モデル foobarNet: ディープラーニング関連の○○Netまとめ NIPS2016実装集 ディープラーニングにとっての2016年 20

    2016年のディープラーニング論文100選 - Qiita
  • 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまった論文を読んだ - Qiita

    Deep Learning Advent Calendar 2016の20日目の記事です。 ConvNet歴史とResNet亜種、ベストプラクティスに関連スライドがあります(追記) 背景 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまったようです。 M2の学生が趣味でやっていたCIFAR10とCIFAR100の認識タスクで,現時点での世界最高性能の結果を出したそうだ…趣味でっていうのが…https://t.co/HKFLXTMbzx — ニーシェス (@lachesis1120) 2016年12月7日 府大のプレスリリース 一般物体認識分野で、府大生が世界一の認識精度を持つニューラルネットワークを開発 黄瀬先生の研究室の学生さんだそうです。凄いですね! ちょうどResNet系に興味があったので、読んでみます。この論文を理解するには、ResNet, (Wide

    府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまった論文を読んだ - Qiita
  • 第3回 機械学習のためのベイズ最適化入門|Tech Book Zone Manatee

    応用範囲が広く幅広い視点からの説明になりがちなベイズ最適化について、記事では機械学習のハイパーパラメータ探索に利用することに限定して解説します。 1. はじめに 最近、ベイズ最適化という手法が注目を集めています。 ベイズ最適化 (Bayesian Optimization) とは、形状がわからない関数 (ブラックボックス関数) の最大値 (または最小値) を求めるための手法です。 ベイズ最適化についての入門記事は Web 上にすでにいくつかありますが、ベイズ最適化は応用範囲が広く、入門記事は様々な応用に向けた幅広い視点からの説明になりがちです。 記事では、機械学習ユーザに向けて、ベイズ最適化を機械学習のハイパーパラメータ探索に利用することに限定して説明します。 これにより、機械学習に対して、ベイズ最適化がどのように利用できるのかを分かりやすく解説したいと思います。 2. ハイパーパラメ

    第3回 機械学習のためのベイズ最適化入門|Tech Book Zone Manatee
  • 機械学習ライブラリ Chainerの紹介 - のんびりしているエンジニアの日記

    皆さんこんにちは お元気ですか。私は元気です。 Chainerと呼ばれる機械学習ライブラリを紹介しようと思います。 Chainerについて Chainerとは? ChainerはPreffered Networksが開発したニューラルネットワークを誤差伝播で学習する ライブラリです。(Python)chainer.org 特徴として、Chainer は、「実際に Python のコードを用いて入力配列に何の処理が適用されたかだけを記憶しておき、それを誤差逆伝播の実行に使います」だそう。 Install sudo pip install chainer 基的にこれだけのインストールが非常に簡単なソフトウェアです。 他のライブラリとの比較 ディープラーニングが活かすIoTより抜粋。 個人的に注目した違いは以下の3点 CaffeもTheanoも勉強することが多い。(設定ファイルとか) 短く書け

    機械学習ライブラリ Chainerの紹介 - のんびりしているエンジニアの日記
  • DeepLearningを使った実装を纏めてみた - のんびりしているエンジニアの日記

    皆さんこんにちは お元気ですか。私は全然です。 Deep Learning 一言で言うとただの深層学習ですが、 作り手や用途によって構造が全然違います。 今回は逆引き辞典よろしく、Deep Learningの実装のリンク集を作ってみました。 今回はライブラリは問わず、掲載します。 Caffe、Theano(Lasagne)、Torch7、Chainerなんでもござれです。 後日、追記するかも・・・ Neural Network(Full Connected) Auto Encoder Auto Encoder Denoising AutoEncoder Convolutional AutoEncoder Convolutional Neural Network Convolutional Neural Network R-CNN Fast-RCNN Faster-RCNN Recurren

    DeepLearningを使った実装を纏めてみた - のんびりしているエンジニアの日記
  • Luigi逆引きリファレンス - Qiita

    import luigi class MyTask(luigi.Task): date = luigi.DateParameter() def requires(self): return MyDependentTask(self.date) def run(self): with self.output().open('w') as output: with self.input().open('r') as input: for line in input: ret = do_something(line) output.write(ret) output.write('\n') def output(self): return luigi.LocalTarget('./out2_{0}.txt'.format(self.date.isoformat())) class MyDepen

    Luigi逆引きリファレンス - Qiita
  • SparkSQL を YARN 上で動作させる - Qiita

    日は Hive on Tez の話をしようと思いましたが,昨日の記事 の中でも触れられている Spark かつ SQL on Hadoop である SparkSQL on YARN の話に話題を変更してお届けします. SparkSQL とは 名前通り,Spark をランタイムとした SQL インタフェースです.デザインの特徴として,SparkDSL との親和性と,Hive の Metastore, SerDe, UDF 互換性が保たれているという点があげられます.SparkSQL のドキュメントとしては,以下のものがあります: SparkSQL Spark SQL Programming Guide Spark on YARN での HiveQL 互換クエリの動かし方 ここからは,Hadoop 2 クラスタを既に持っている方のために,Spark on YARN における Spark の動

    SparkSQL を YARN 上で動作させる - Qiita
  • Apache SparkでカスタムStreamingする - もょもとの技術ノート

    はじめに Spark, SQL on Hadoop etc. Advent Calendar 2014 - Qiita 3日目の記事です。 SparkでカスタムStreamingする方法を紹介します。 TwitterやFlumeなどのSpark Streamingの活用例が下記にあります。 spark/examples/src/main/scala/org/apache/spark/examples/streaming at master · apache/spark · GitHub spark/external at master · apache/spark · GitHub これらは、いろいろ利用できそうですね。 一方で、オリジナルのStreaming処理を行いたい場合には、 Sparkが提供するReceiverクラスを拡張する必要があります。 この記事では、Receiverクラス

    Apache SparkでカスタムStreamingする - もょもとの技術ノート
  • Cloudera Blog

    Cloudera customers run some of the biggest data lakes on earth. These lakes power mission critical large scale data analytics, business intelligence (BI), and machine learning use cases, including enterprise data warehouses. In recent years, the term “data lakehouse” was coined to describe this architectural pattern of tabular analytics over data in the data lake. […] Read blog post

  • Foundations of Statistical Natural Language Processing

    This is the companion website for the following book. Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999. Interested in buying the book? Some more information about the book and sample chapters are available. If you are here to look up something that is mentioned in the book, click on the appropriate chapter link below. A l

  • 「ビッグデータ分析には大規模システムが必要」という固定概念を捨て去ろう

    この1年ほど、ビッグデータ分析やデータサイエンティストの活躍が注目を集め、連日メディアをにぎわすようになりました。しかし、そこではどのようなツールが使われていて、どのような環境で分析が行われているのかが、具体的に紹介されているものが少ないと感じています。 そこでこの特集では「ビッグデータをどのようなツールで分析しているのか」と「ビッグデータはどんな手法で分析すればよいのか」に焦点を当てたいと思います。ビッグデータ分析の具体的な「HOW」について紹介していきます。 そのHOWを身に付け、これまで活用できなかったビッグデータを分析すると、どのような効果が得られるのでしょうか。私たちギックスのこれまでのコンサルティング経験のなかでは、以下のような効果が得られたケースがありました(初公開!IBM辞めたギックスの3人はこうやってビューカード400万会員のデータを分析している)。 ・今まで明確ではなか

    「ビッグデータ分析には大規模システムが必要」という固定概念を捨て去ろう
  • 松尾ぐみの論文の書き方:英語論文 | 松尾 豊

    あー、やっぱりこの国際会議は難しいな。日人ほとんど通ってないしなぁ。結構頑張ったんだけどなぁ。でも査読者、なんか良く分からないことを言ってる。こいつ分かってないな。こんな査読者に当たるとは運が悪い。3人中1人はすごくいいコメントなのになぁ。ま、いいや、研究会論文でも書こう。 (※に戻る) 私も以前はこんな感じでした。主要な国際会議のレベルは高いと思ってました。今では、そうは思いません。何といっても、まずは完成度の問題です。 完成度を上げることの重要性 完成度を上げるとは、自分で修正するところがなくなるまで、修正を繰り返すことです。 上の例では、初稿の段階で投稿していますね。これで通せる人は誰もいません。ここで私がよく目安に使っている2つの経験則を紹介しましょう。 執筆時間の法則: 経験上、次のような法則があります。「書こう」と思ってから、初稿ができるまでの時間をa0とします。すると、第2