[B! *business][python] [10ページ] masadreamのブックマーク

masadream id:masadream

*businessとpythonに関するmasadreamのブックマーク (203)

https://qiita.com/yuchi_m/items/ba2148a5bd37a4487f12
masadream 2017/02/04
*ai_ml

*business

*marketing

r

python
リンク
【Python】自然言語処理でラーメン屋を分類してみる - Qiita
はじめにこんにちは、コピペデータサイエンティストです。 3年ぐらい前に「ラーメンと自然言語処理」というおちゃらけLTをしたのですが、今見ると恥ずかしいぐらいショボいので、Pythonで作りなおしてみました。長くなったので3行でまとめると Web上に転がっている口コミとか紹介文を Pythonのライブラリを用いて解析することで好きなラーメン屋に似たラーメン屋を見つける手法を構築した方法統計的潜在意味解析という手法を用います。ざっくり言うと、文書がどんなトピックを持っているか、何に関する文書なのか、を推定してくれるものです。以下の様なイメージで各トピックに割り振られる割合を算出できるため、以下の例ではAとBが近い、ということを計算することが可能です。ラーメン屋A： [0.75, 0.15, 0.10] ラーメン屋B： [0.60, 0.15, 0.15] ラーメン屋C： [0.0
masadream 2017/01/18
*matome

*ai_ml

python

*business

*marketing

*food
リンク
pandas-ply: functional data manipulation for pandas — pandas-ply 0.2.1 documentation
pandas-ply: functional data manipulation for pandas¶ pandas-ply is a thin layer which makes it easier to manipulate data with pandas. In particular, it provides elegant, functional, chainable syntax in cases where pandas would require mutation, saved intermediate values, or other awkward constructions. In this way, it aims to move pandas closer to the “grammar of data manipulation” provided by the
masadream 2017/01/14
*ai_ml

*business

*marketing

python

r
リンク
【Day-17】DeepLearning系ライブラリ、『Keras』の使い方まとめ(2.x対応版) - プロクラシスト
【最終更新 : 2017.12.17】 ※以前書いた記事がObsoleteになったため、2.xできちんと動くように書き直しました。データ分析ガチ勉強アドベントカレンダー 17日目。 16日目に、1からニューラルネットを書きました。それはそれでデータの流れだとか、活性化関数の働きだとか得るものは多かったのですが、Kerasと言うものを使ってみて、何て素晴らしいんだと感動してしまいました今まで苦労して数十行書いていたものが、わずか3行で書ける！正直、スクラッチで書く意味って、理解にはいいけど研究や分析には必要あんまないんですよね。車輪の再発明になるし。と言うわけで、使えるものはどんどん使っていこうスタンスで、今日はKerasの紹介です！ Tutorial+気になった引数を掘り下げて補足のような感じで書いています。ちなみに、各部のコード以下をつなぎ合わせるとmnistの分類器が動くよ
masadream 2017/01/09
*matome

*ai_ml

*business

*marketing

python
リンク
Rodeo のインストールと使い方 – Python でデータサイエンス
Rodeo (ロデオ) とは、Yhat 社によって開発されている Python の統合開発環境 (IDE) です。同様の Python 開発環境には、PyCharm (PyCharm のインストール方法) や Eclipse プラグインの PyDev などがありますが、Rodeo は R の開発環境として広く使われている RStudio に似た UI (ユーザインターフェース) を持っているという特徴があります。このため、RStudio に扱いなれている方が Python を扱う際に、Rodeo を利用すると効率よく扱うことができるでしょう。 Rodeo は以下のように、RStudio と同じ画面構成となっていることがわかります。 Rodeo をインストール本手順では、Windows 10 に Rodeo 2.0.13 (2016 年 8 月現在での最新版) をインストールする方法につ
masadream 2017/01/09
*matome

*ai_ml

*business

*marketing

r

python
リンク
データサイエンティストのための新しい Python 環境 Rodeo がなかなかいい / Watch & try out python new IDE for data scientist - datalove’s diary
** Sorry, this note is Japanese only, but please take a look at some code snippets. Hope it helps you a bit! 唐突ですが、このブログの読者のみなさんってどんな環境でコード書いたりデータ分析したりしてるんでしょうか？たぶん、RStudio が一番メジャーかな？で、Jupyter / IPython notebook がそれに続き、以下、Anaconda とも縁の深い Spyder とかなんでしょうか。最近だと PyCharm とか使ってる人もいるのかも。そんな環境に悩める子羊ならぬデータサイエンティストのみなさん、（これまで R 使ってる人なら特に）朗報です。 Python のデータサイエンティスト向け開発環境に新しい選択肢「Rodeo」が加わりました。英語版しかないせい
masadream 2017/01/09
素晴らしい

*ai_ml

*business

*marketing

python

r
リンク
悩める Web スクレイパーのための一冊 - 技術評論社『Python クローリング & スクレイピング』 - Witch on the Other Shore
このたび、縁あって『加藤耕太 (2016). Python クローリング & スクレイピングデータ収集・解析のための実践開発ガイド, 技術評論社』(以下、本書) を恵贈賜りました。著者並びに出版社の皆様にお礼とご慰労をかねまして、僭越ながら本エントリにて一読後のレビューを掲載いたします。 Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 作者: 加藤耕太出版社/メーカー: 技術評論社発売日: 2016/12/16メディア: 大型本この商品を含むブログを見るなお読者の益となるようなるべく公正な目線でレビューします。掲載されているコードの厳密な正確性については本レビューの対象外とします。総評体系的に「スクレイピングとは」「クローラーとは」について学ぶにはとてもよい書籍です。本書の優れているところは、特に基礎編ともいえる前半部分で、ある事柄を説明する
masadream 2016/12/25
*ai_ml

*business

*marketing

python
リンク
extensionを追加してもっと快適なJupyter環境を構築する - Qiita
Jupyterはすごい便利なんですが、この機能があったらなーと思うことがあります。そんなときにはextensionです。 JupyterにはNotebook extensionsとかいうのがあって、機能の拡張ができるようになっています。公式サイトにもextensionsがあるということはちょこっと載ってるんですが、いくつか使用してみると結構便利。 Jupyterは使っているけどextensionは使っていないというひとに是非試して欲しいです。 Jupyter notebook extensions Jupyterに機能を追加するextensionを集めたレポジトリがGitHub上に公開されています。このレポジトリを利用すると、ブラウザからextensionのactivate/deactivateの切り替えが可能で便利です。 IPythonの公式デベロッパーチームとは関係ないグループで
masadream 2016/12/18
*matome

*ai_ml

*business

python
リンク
https://qiita.com/ksomemo/items/ba0f24daae2276ffd9b2
masadream 2016/12/18
*matome

*ai_ml

*business

python
リンク
scikit-learnを用いたサンプルデータ生成 - データ分析がしたい
機械学習の勉強や新しいアルゴリズムのテストをする場合、irisなどのシステム組み込みのサンプルデータを利用するか、UCIリポジトリなどのネット上の公開データから良さげなものを探すというのが一般的だと思います。しかしながら、irisなどの組み込みデータは一般にデータ数が少なく、分類問題として物足りなかったり、ネット上の公開データを利用するにしても適当なデータ数や特徴量数、問題設定や難度のデータを探すのが難しいですし、前処理が必要なデータも多く手軽に使えるサンプルデータとなると中々見つけられないといったことがあるかと思います。そういった場合、適当なデータ数や難しさのデータを自分で生成して利用すると、後の計算コスト評価や機械学習アルゴリズムの理解において色々と便利です。サンプルデータの作り方としては、何らかの統計モデルに基づいて作る方法もありますが、データの質にこだわらないのであればsci
masadream 2016/12/11
*ai_ml

*business

*marketing

python
リンク
Python（PyStan）で「StanとRでベイズ統計モデリング」の5.1節を実行する - StatModeling Memorandum
StanのPythonバインディングであるPyStanが公開されて久しいですが、検索してもあんまり情報がヒットしません。ちょっと寂しいと思ったので、インストールやtraceplotの出力なども含めて、以下の本の5.1節「重回帰」の一部を実行してみました（ステマです）。 StanとRでベイズ統計モデリング (Wonderful R) 作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本本自体の紹介は以前の記事を読んでいただければと思います。「StanとRでベイズ統計モデリング」松浦健太郎という本を書きました - StatModeling Memorandum インストール Windows 7 64bit、Python 3系でのインストール手順を説明します。 AnacondaでPythonなどをインストールコマンドプロンプトからpip install pystanでpy
masadream 2016/10/20
*ai_ml

*matome

*business

*marketing

r

python
リンク
auto-sklearn — AutoSklearn 0.4.0 documentation
auto-sklearn� auto-sklearn is an automated machine learning toolkit and a drop-in replacement for a scikit-learn estimator: >>> import autosklearn.classification >>> cls = autosklearn.classification.AutoSklearnClassifier() >>> cls.fit(X_train, y_train) >>> predictions = cls.predict(X_test) auto-sklearn frees a machine learning user from algorithm selection and hyperparameter tuning. It leverages r
masadream 2016/09/10
*ai_ml

*business

*marketing

python
リンク
科学技術計算関連Pythonパッケージの概要
こちらが改訂版なので，ダウンロードするならこちらで： http://www.kamishima.net/archive/scipy-overview.pdf 第15回情報科学技術フォーラム (FIT2016) での講演「科学技術計算関連Pythonパッケージの概要」の発表資料です． * 講演ページ： http://www.ipsj.or.jp/event/fit/fit2016/FIT2016program_web/data/html/event/event72.html * 小嵜耕平さん資料「Python とデータ分析コンテストの実践」 https://speakerdeck.com/smly/python-todetafen-xi-kontesutofalseshi-jian * サンプルファイル： https://github.com/tkamishima/fit2016tutor
masadream 2016/09/10
*matome

*ai_ml

*business

python
リンク
ElasticsearchとPython使えば生活圏推定を簡単にできる話 - Qiita
概要なんか書いてみようということで、Elasticsearchに行動履歴の位置情報を登録すれば、いい感じに利用できる上に、いい感じに可視化もできるという話をします。前提知識今回Elasticsearchを利用するので、簡単に紹介。 ElasticsearchはApache Solrとよく比較される全文検索エンジンの一つです。スキーマフリーですべての入出力がREST＆JSONになっています。またJavaで実装されています。詳しくはElasticsearchの紹介と特徴インストールはyumでもbrewでも簡単に出来ます。利用したい環境に合わせて調べてみてください。ちなみにElasticsearchのGUIプラグインのelasticsearch-headが便利なので合わせて入れておくと良いです。 Elasticsearchの設定 Elasticsearchを起動できたら、利用するin
masadream 2015/12/30
*matome

*ai_ml

*business

*marketing

python
リンク
Graham Neubig's Teaching
Classes Spring 2024: Advanced NLP (CS11-711 @ CMU) Fall 2022: Advanced NLP (CS11-711 @ CMU) Spring 2022: Multilingual NLP (CS11-737 @ CMU) Fall 2021: Advanced NLP (CS11-711 @ CMU) Spring 2021: Neural Networks for NLP (CS11-747 @ CMU) Fall 2020: Multilingual NLP (CS11-737 @ CMU) Spring 2020: Neural Networks for NLP (CS11-747 @ CMU) Fall 2019: Machine Translation and Sequence-to-sequence Models (CS1
masadream 2015/12/24
自然言語処理プログラミングのチュートリアル

*ai_ml

*matome

*business

*marketing

python
リンク
The Popularity of Data Science Software | r4stats.com
Table 2. Number of jobs for the search term “statistician” and each software. Next, let’s look at the change in jobs from the 2019 data to now (October 2022), focusing on software that had at least 50 job listings back in 2019. Without such a limitation, software that increased from 1 job in 2019 to 5 jobs in 2022 would have a 500% increase but still would be of little interest. Percent change ran
masadream 2015/02/08
*ai_ml

r

python

*business
リンク
Pythonで時系列解析～ランダム・ウォーク生成、移動平均線描画と AR(1)モデル過程データの生成 - Qiita
これまで、R で時系列解析を行ってきたので、Python でもできるよう手習いまで、コードを手で打ってみる。 1. ランダム・ウォークと移動平均線時系列データ生成（ランダムウォーク系列）（参考）分析技術とビジネスインテリジェンス「Python：時系列分析（その１）」上記サイトからスクリプトを借用します（※ plt.show() を最後に追加） import numpy as np randn = np.random.randn from pandas import * import matplotlib.pyplot as plt #■ランダムウォーク系列データの作成 ts = Series(randn(1000), index = DateRange('2000/1/1', periods = 1000)) ts = ts.cumsum() #■単純移動平均長短のトレン
masadream 2015/01/05
*ai_ml

*marketing

*business

python
リンク
データの前処理や加工に使えるPython csvkit - Librabuch
みなさまこんばんは。Python Advent Calendar 2014 24日目の記事です。先日のpyhackで@atelierhideに教えてもらった、データ前処理スト垂涎のライブラリの紹介をすることにしました。 csvkit とは csvkitは、コマンドラインでCSVやTSVファイルを取り扱うのに便利なライブラリです。データの前処理や加工をLinux/UNIXのコマンドラインで行っている環境もあると思いますが、それを代替する、あるいは組み合わせて使うとよいのがcsvkitです。 csvkit pipでインストール出来ます。Python3.4にもインストールは可能ですが、一部の機能が動作しないことを確認しています。今回は2.7にインストールしました。 pip install csvkit 具体的な使い方を見ていきます。基本的な使い方ここからはiris.csvのデータをcsvk
masadream 2014/12/29
*ai_ml

*business

*marketing

python
リンク
PythonistaのためのJulia100問100答 - りんごがでている
この記事はJulia Advent Calendar 2014の12日目の記事だったはずのものです(遅れてすいません...)。 Pythonユーザーとしての自分に対して100問100答形式で気になるだろうことを列挙したものになっています。全体は以下の様なセクションに分かれています。 Julia 環境データ技術計算言語機能文字列 / 正規表現ファイル / IO システムプロファイリング / ベンチマーク / テストライブラリ Juliaのバージョンはv0.3系を基本としていますが、開発中のv0.4の内容も必要に応じてコメントしています。 Julia Juliaってどういう言語なの? Juliaは高レベルでハイパフォーマンスな技術計算のための動的言語だよ。構文はPythonユーザーならすぐに理解できるよ。公式ウェブページはここ: http://julialang.org/
masadream 2014/12/24
*matome

*ai_ml

*business

python
リンク
R,Python,JuliaをMCで比較 - xfujimonのブログ
2014-12-17 R,Python,JuliaをMCで比較 R Advent Calendar 17日目です。 R Advent Calendar 2014 : ATNDR,Python,Juliaのモンテカルロ法（乱数生成）について自分の備忘録も兼ねて書きたいと思います。私自身はデータ分析というよりもシミュレーションをするほうがメインで特にモンテカルロシミュレーションをよくやります。今はRやPythonを使っていましたが、用途からするとJuliaかなとJapanRを聞いて思ったので挑戦しようと思いました。モンテカルロシミュレーションのために様々な確率分布から乱数を作ることが必要となりますが、中には複雑な分布もありすでに関数として用意されていると便利です。この３つの言語では確率分布が多くありますが使い方は微妙に違うので実際にやってみながら比較します。とりあえず正規分布
masadream 2014/12/23
MCMC

*business

*marketing

*ai_ml

r

python
リンク
前のページ 2 3 4 5 6 7 8 9 10 11 次のページ