タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pythonに関するkaratteのブックマーク (35)

  • 【Python】 機械学習の可視化が捗るライブラリ「Yellowbrick」 - フリーランチ食べたい

    機械学習Podcast「TWiML&AI」で先週取り上げられた可視化ライブラリ「Yellowbrick」が非常に便利だったので紹介します!ちなみにPodcastには作者の1人であるRebecca Bilbroさんが出演しているので興味持った方は是非聞いてみてください。 twimlai.com www.scikit-yb.org Yellowbrickとは 一言で言うと、機械学習に特化した可視化ライブラリです。実装的な面で言うと(こちらの方がわかりやすいかもしれません)、scikit-learnとmatplotlibをラップして、scikit-learnライクなAPIで使うことができるものです。 例えば相関行列のヒートマップをプロットしたい場合は次のように書くだけでグラフを作ることができます。 visualizer = Rank2D(features=features, algorithm=

    【Python】 機械学習の可視化が捗るライブラリ「Yellowbrick」 - フリーランチ食べたい
    karatte
    karatte 2019/05/17
    念のためブクマしたけど、まだ全然このレベルまで機械学習使えてない
  • ゼロからはじめるPython(49) Pythonでブラウザ自動操縦してカード明細を自動でダウンロードしよう(その1)

    クレジットカードの利用明細はこまめにチェックする必要がある。なぜなら、カードの不正使用などの危険があるからだ。しかし、最近ではオンライン明細が推奨されており、カード会社のサイトにログインして、明細をダウンロードしなければならないことも多い。カードが複数枚あるなら、それはかなり面倒な作業となる。そこで、自動でカード明細をダウンロードするプログラムを作ってみよう。今回は、環境の構築をし、簡単なプログラムを作ってみよう。 Webブラウザを自動操縦しているところ Webブラウザを自動操作しよう PythonにはデータをWebから取得する命令がいろいろある。最も簡単なのは、Pythonに標準で用意されているurllib.requestだ。これを使うと任意のURLからデータを取得できる。しかし、最近のWebサイトは、セッションという仕組みを利用していたり、JavaScriptでページをレンダリングした

    ゼロからはじめるPython(49) Pythonでブラウザ自動操縦してカード明細を自動でダウンロードしよう(その1)
    karatte
    karatte 2019/05/06
    BraveでもChromeDriverでいけるのかしら
  • データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust) - Qiita

    データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust)Pythonpandasデータ分析データ可視化pandas-profiling Pythonのpandas-profilingと、pixiedustの2つのライブラリを使うと、データの集計・グラフの作成が、感動的なほど早く終わることを実感したので共有します。 Excelでデータ集計・グラフ作成した場合と比較すると、体感で100倍くらい早く終わります(誇張ではなく) Pythonで爆速でデータ集計する方法(体感所要時間:5分) 前提: 以下の環境が整備されていることは、前提とします。 Pythonのインストール(約30分) データ分析に必要な各種ライブラリのインストール(約30分) →numpy, matplotlib, pandas, jupyter など →Anac

    データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust) - Qiita
    karatte
    karatte 2019/04/28
    見事な釣りタイトル。でもjupyter notebookはちょっと導入したいかも。
  • [Python入門]文字列の操作

    * 稿は2019年4月19日、2022年5月18日に公開/改訂された記事を、Python 3.11.5で動作確認したものです(確認日:2023年9月11日)。 前回は文字列の種類や書き方などを見たが、文字列に対してさまざまな操作を行うことも可能だ。例えば、文字数を数えたり、文字列から指定した位置(インデックス)にある文字を取り出したり、文字列内に特定の文字列が含まれているかを調べたりできる。以下では、これらの操作について簡単に見ていこう。

    [Python入門]文字列の操作
    karatte
    karatte 2019/04/19
    “Pythonの哲学には「Explicit is better than implicit」(暗黙的に何かをするよりも明示的にする方がよい)というものがある”
  • GitHub - arc298/instagram-scraper: Scrapes an instagram user's photos and videos

    This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.

    GitHub - arc298/instagram-scraper: Scrapes an instagram user's photos and videos
    karatte
    karatte 2019/04/15
    “Scrapes an instagram user's photos and videos”
  • ディープラーニング入門:Chainer チュートリアル

    Chainer チュートリアル 数学の基礎、プログラミング言語 Python の基礎から、機械学習・ディープラーニングの理論の基礎とコーディングまでを幅広く解説 ※Chainerの開発はメンテナンスモードに入りました。詳しくはこちらをご覧ください。 何から学ぶべきか迷わない ディープラーニングを学ぶには、大学で学ぶレベルの数学Python によるプログラミングの知識に加えて、 Chainer のようなディープラーニングフレームワークの使い方まで、幅広い知識が必要となります。 チュートリアルは、初学者によくある「まず何を学べば良いか」が分からない、 という問題を解決するために設計されました。 初学者は「まず何を」そして「次に何を」と迷うことなく、必要な知識を順番に学習できます。 前提知識から解説 このチュートリアルは、Chainer などのディープラーニングフレームワークを使ったプログ

    ディープラーニング入門:Chainer チュートリアル
    karatte
    karatte 2019/04/10
    これで挫折したらもう何やっても無理なんじゃないかってくらいハードル下げてきた
  • GitHub - dixudx/tumblr-crawler: Easily download all the photos/videos from tumblr blogs. 下载指定的 Tumblr 博客中的图片,视频

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

    GitHub - dixudx/tumblr-crawler: Easily download all the photos/videos from tumblr blogs. 下载指定的 Tumblr 博客中的图片,视频
    karatte
    karatte 2019/03/23
    TumbleRipperのv2が使えなくなって別のpyスクリプトに乗り換えたんだけど、動画落とせなかったんでこっちにしてみた
  • GitHub - d6o/TumblrDownloader: Download all images from a Tumblr

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - d6o/TumblrDownloader: Download all images from a Tumblr
    karatte
    karatte 2019/03/23
    TumbleRipperのv2がいよいよ動かなくなったんで試しに落としてみたらちゃんと動いたよありがたや
  • Python 3.8 では空dictが小さくなる - Qiita

    Python 3.7 では {} で作った空 dict よりも、 dict.clear() で作った空 dict の方が省メモリでした。 >>> import sys >>> d = {} >>> sys.getsizeof(d) 240 >>> d.clear() >>> sys.getsizeof(d) 72 これは dict オブジェクトを新規作成するときに最小サイズのハッシュテーブルを確保し初期化するのに対して、 dict.clear() は shared key dict の仕組みを使って空 dict 専用の共有テーブル(書き込み禁止)を利用しているからです。 空の dict の数は無視できないくらいにはあるので、Python 3.8 で新規に dict オブジェクトを作るときも dict.clear() の結果と同じ共有領域を使うようにしました。 なお Python 3.7 の

    Python 3.8 では空dictが小さくなる - Qiita
    karatte
    karatte 2019/03/12
    “なお Python 3.7 の dict.clear() のときよりも8バイト小さくなっていますが、これは GC ヘッダを削減した効果で、これも私の功績です(ドヤ)”
  • 習得したい言語で1位のPython、人気沸騰の理由

    かつてないほどPythonが人気だ。最近のプログラミング言語をあまり知らないという“おじさん”のために、人気の理由や基的な特徴を分かりやすく解説しよう。 プログラミング言語「Python(パイソン)」が注目を集めている。情報処理推進機構(IPA)は2020年春から、基情報技術者試験の選択可能なプログラミング言語にPythonを新たに加える。IPAは「2018年にプログラミング言語の使用状況や学習状況を調査したところ、Pythonの活用が広がっていると確認できた」と背景を説明する。

    習得したい言語で1位のPython、人気沸騰の理由
    karatte
    karatte 2019/03/11
    初心者向けの本一冊買って取り敢えずインストールしたけど、Instagramの画像ぶっこ抜くプログラム拾ったくらいでほぼ死蔵状態
  • docs.python.jpでのドキュメント公開終了 - atsuoishimoto's diary

    これまで、python.jpではPythonの日語ドキュメントを公開してきたが、この度、ドキュメントのホスティングを終了し、docs.python.org へのリダイレクトのみをおこなうようになった。 www.python.jp 実に喜ばしいことである。これまで、日語ドキュメントは python.jp においてある私家版でしかなかったが、python.orgで公開されることで、一定の公式っぽさを得ることができる。 また、python.jpは私が一人でほそぼそと、さくらインターネットの一番安いVPSで管理運用してきた。しかし、これからはPython家の運用チームできっちり運用していただけるのである。 別に難しいことをしていたわけではないが、python.jp運営のプレッシャーはちょっとしたものだった。ここ近年のPythonブームも、私がちょっとしくじってドキュメントを参照できなくなる、

    docs.python.jpでのドキュメント公開終了 - atsuoishimoto's diary
    karatte
    karatte 2019/02/27
    “現在、Python関連のニュースや企業からの求人などを無償で公開したり、Pythonの環境構築ガイドを公開したりしているが、もうちょっと良い使いみちがないものかと思っている”
  • Python in Visual Studio Code – January 2019 Release - Python

    Get notified in your email when a new post is published to this blog We are pleased to announce that the January 2019 release of the Python Extension for Visual Studio Code is now available. You can download the Python extension from the Marketplace, or install it directly from the extension gallery in Visual Studio Code. You can learn more about Python support in Visual Studio Code in the documen

    Python in Visual Studio Code – January 2019 Release - Python
    karatte
    karatte 2019/02/21
    “We are pleased to announce that the January 2019 release of the Python Extension for Visual Studio Code is now available”
  • pythonによる日本語前処理備忘録 | ブログ一覧 | DATUM STUDIO株式会社

    はじめにこんにちは。DATUM STUDIOの安達です。 最近社内で日語のテキストを用いた自然言語処理でよく質問を受けるのですが、前処理についてはそこそこ同じような内容になるため、記事では社内共有の意味も込めて前処理に関して用いてきた&用いれそうな手法を列挙します。 比較的同じ内容を扱った既存の記事としては以下のようなものもあり、読者の方はこれらも参考にされて要件に合わせて取捨選択してください。 自然言語処理における前処理の種類とその威力 – Hironsan自然言語処理の前処理・素性いろいろ 記事における使用言語、環境は以下の通りです。 ・osx 10.13.6・anaconda 5.2.0・python 3.5.2Table of contents ・形態素解析段階での前処理 ・文字表現の正規化 ・URLテキストの除外 ・Mecab + neologd 辞書による形態素解析 ・形

    pythonによる日本語前処理備忘録 | ブログ一覧 | DATUM STUDIO株式会社
    karatte
    karatte 2019/01/19
    “形態素解析段階での前処理""形態素解析形態素解析後の前処理""文書ベクトル化段階での前処理”
  • Pythonのパッケージ周りのベストプラクティスを理解する - エムスリーテックブログ

    砲撃する自走砲(PzH2000自走榴弾砲)。自走砲は戦車によく似ていますが、戦車ではありません。*編とは関係ありません。 こんにちは、エムスリー基盤開発チーム小です。 Pythonのパッケージ管理周りでは、 「setup.pyでrequirements.txtを読み込むのが普通なんですよね?」 「pipenv があれば venv はオワコンなんですね?」 「pyenvは要らないんですよね!?」 「Python歴史が古い分、Rubyなどに比べてカオス」 みたいな混乱をよく目にします。 実際、複数のツールがあって(一見)複雑です。また「なぜこうした状況にあるのか」がドキュメント化されているわけでもありません。 なので、私なりに整理してみることにしました。 ※「追伸」を追加しました。この記事では汎用プログラミング言語としてPythonを使うケース(Webアプリとか、CLIツールとか、ライブ

    Pythonのパッケージ周りのベストプラクティスを理解する - エムスリーテックブログ
    karatte
    karatte 2019/01/11
    “自走砲は戦車によく似ているが、歩兵支援兵器として開発された戦車に対し、 自走砲は大砲に移動能力を付加したものである。実際、使用目的や性能は異なる部分が多い”
  • なぜ機械学習にPythonが強いのか、Pythonで並行処理をするコツを伝授【PyData.tokyo】

    10月20日に開催された「PyData.tokyo One-day Conference 2018」では、フリーランスのプログラマで、python.jpの管理人もしている石敦夫氏がPythonやNumPyの歴史Pythonで並行処理を行う時のポイントを解説した。 python.jp管理人 石敦夫氏 PyData.tokyo One-day Conference 2018 「NumPyの歴史Pythonの並行処理」講演資料 なぜ機械学習にはPythonなのか ~NumPyを核に形成された科学技術計算のエコシステム いま「機械学習」でググると「python」が関連キーワードとしてサジェストされるほど、AI機械学習を扱うならPythonは定番の言語だ。2011年にIEEEが発行した雑誌には「科学技術計算においてPythonはデファクトスタンダード」と記述されている。 その理由を示すべく

    なぜ機械学習にPythonが強いのか、Pythonで並行処理をするコツを伝授【PyData.tokyo】
    karatte
    karatte 2019/01/11
    “なぜPython周辺で科学計算ライブラリが増えたのか。主な理由として石本氏は3つ挙げる。NumPyがエコシステムの核だったこと、Pythonからのサポートがあったこと、C拡張ライブラリの作りやすさがあったことだ”