並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 58件

新着順 人気順

dataframeの検索結果1 - 40 件 / 58件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

dataframeに関するエントリは58件あります。 pythonpandasPython などが関連タグです。 人気エントリには 『[python / pandas] DataFrame を扱う人が覚えておきたい、ちょっとレアな便利技16選 - Qiita』などがあります。
  • [python / pandas] DataFrame を扱う人が覚えておきたい、ちょっとレアな便利技16選 - Qiita

    [python / pandas] DataFrame を扱う人が覚えておきたい、ちょっとレアな便利技16選PythonpandasDataFrame 概要 そこまでメジャーではない(?) けど、覚えておくと実装時間やコードの行数を大幅削減できる! という便利な技をご紹介します! 「そういえばpandasってあんなこともできたような気がするな。」 「自力で実装する前に調べてみようかな?」 と気付けると、時短 & コード量削減できる可能性が生まれます。 ではでは、お楽しみください!! Environment 以下の環境で動作確認を行いました。 項目 version など

      [python / pandas] DataFrame を扱う人が覚えておきたい、ちょっとレアな便利技16選 - Qiita
    • GitHub - Kanaries/pygwalker: PyGWalker: Turn your pandas dataframe into an interactive UI for visual analysis

      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

        GitHub - Kanaries/pygwalker: PyGWalker: Turn your pandas dataframe into an interactive UI for visual analysis
      • LLMに表データの解析を手伝ってもらえるLangChainのPandas Dataframe Agentの中身がどうなっているのか調べた - まったり勉強ノート

        最近、LLMを使ったOSSの中身を調べてLLMとどう連携して目的を達成しているのかをいろいろ調べています。今回はLangChainのPandas Dataframe Agentの中身がどうなっているのか気になったので調べたまとめになります。 今回のコードは以下のところにあるので、全体としてどうなっているのか見たい方はこちらをご覧ください。 https://github.com/shu65/langchain_examples/blob/main/LangChain_Pandas_Dataframe_Agent.ipynb LangChainのPandas Dataframe Agentとは LLMを使いやすくwrapしてくれるLangChainにはいくつかAgentというLLMとToolと呼ばれるものを組み合わせて実行する仕組みが用意されています。この中でもPandas Dataframe

          LLMに表データの解析を手伝ってもらえるLangChainのPandas Dataframe Agentの中身がどうなっているのか調べた - まったり勉強ノート
        • 【Python】pandas DataFrameの値を更新 - ITips

          pandasのDataFrameの値を更新する方法がいくつかあるので、後で見返す為にも更新方法をまとめておく。 以下のlocやwhereの他に一括更新の方法がある。 DataFrameの値を更新する方法 pandasのDataFrameの値を更新する方法がいくつかあるが、大きく以下の3つの方法に分けられる。 値を一括代入 条件に合致するカラムを更新 別のDataFrameで上書き 各方法についてDataFrameを用いながら説明する。 import pandas as pd data_list1 = [ [1,2,3], [2,3,4], [3,4,5] ] col_list1 = ["c1","c2","c3"] df1 = pd.DataFrame(data=data_list1, columns=col_list1) print(df1) # c1 c2 c3 # 0 1 2 3 #

            【Python】pandas DataFrameの値を更新 - ITips
          • GitHub - Eventual-Inc/Daft: Distributed DataFrame for Python designed for the cloud, powered by Rust

            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

              GitHub - Eventual-Inc/Daft: Distributed DataFrame for Python designed for the cloud, powered by Rust
            • pandasのDataFrameでカラム末尾に"_x"や"_y"が付いてしまう - ITips

              pandasのDataFrameでカラム末尾に"_x"や"_y"が付いてしまう。 カラム名が変わってしまうと要素にアクセスする際に困るので、"_x"や"_y"を付けたくない。 今回はカラム末尾に"_x"や"_y"が付いてしまう原因と対策を紹介する。 カラム末尾に"_x"や"_y"が付いてしまう原因 pandasのDataFrameでカラム末尾に"_x"や"_y"が付いてしまう原因は、マージ時にカラム重複が発生したから。 以降、カラム重複の発生について説明していく。 まず2つのデータフレームを用意し、結合するために同じ値を持ったカラムを双方に持たせる。 今回は結合用のキーカラムを c3 とする。 import pandas as pd data_list1 = [ [1,2,3], [2,3,4], [3,4,5] ] col_list1 = ["c1","c2","c3"] df1 = p

                pandasのDataFrameでカラム末尾に"_x"や"_y"が付いてしまう - ITips
              • 【Python】pandasでDataFrameの値渡しをする方法 - ITips

                Pythonのデータ処理によく使われるDataFrame。 表形式のCSVやExcelのデータを読むことができ、集計や加工にとても重宝する。 しかし気をつけて使わないと自分の意図しないタイミングでデータが書き換わってしまうことがあるかもしれない。 今回はpandasでDataFrameの中身が変わってしまう原因と、「pandasでDataFrameの値渡しをする方法」について解説する。

                  【Python】pandasでDataFrameの値渡しをする方法 - ITips
                • [Python] Update column value of Pandas DataFrame - ITips

                  There are some ways to update column value of Pandas DataFrame. So I wrote down them for the future reference. I used documents of loc and where below as a reference. There are some ways to update column value of Pandas DataFrame. Common ways are below. Bulk update by single value Update rows that match condition Update with another DataFrame I'll introduce them with using DataFrame sample. import

                    [Python] Update column value of Pandas DataFrame - ITips
                  • JuliaならDataFrameでforループしても十分速い - Qiita

                    うわっ…私のpandas、遅すぎ…?って時にやるべきこと(先人の知恵より) こちらに書かれている通り、pandasはたしかに遅い、特に使い方によっては極端に遅い。かといってforループを回避するためにあれこれ読みにくいコードを書きたくない。……だったらJuliaにしたらいいよ! という記事です。 pandasはどのくらい遅いか? 元記事のデータは非公開のコードで加工されたもののようなので、ここでは他の公共データセットのデータを使わせてもらいます。Scikit-learnに入っているCalifornia Housingを使いましょう。約2万件しかデータがないのはちょっと物足りないので10回連結して約20万件に水増しします。 import sklearn from sklearn.datasets import fetch_california_housing import pandas as

                      JuliaならDataFrameでforループしても十分速い - Qiita
                    • pandas.DataFrameの構造とその作成方法 | note.nkmk.me

                      pandas.DataFrameは二次元の表形式のデータ(テーブルデータ)を表す、pandasの基本的な型。 DataFrame — pandas 2.0.3 documentation pandas.DataFrame — pandas 2.0.3 documentation ここでは、はじめにpandas.DataFrameの構造と基本操作について説明し、そのあとでコンストラクタpandas.DataFrame()による作成方法およびファイルからの読み込み方法について説明する。 一次元データであるpandas.Seriesからpandas.DataFrameを生成する方法については以下の記事を参照。 関連記事: pandas.DataFrameとSeriesを相互に変換 本記事のサンプルコードのpandasのバージョンは以下の通り。バージョンによって仕様が異なる可能性があるので注意。N

                        pandas.DataFrameの構造とその作成方法 | note.nkmk.me
                      • 超高速DataFrameライブラリー「Polars」について

                        はじめに ここ最近、Polarsについて調べる中で色々と面白そうだと思い現在勉強中です。今回の記事では勉強内容の整理も兼ねて、Polarsの特色を紹介できればと思っています。 Polarsとは RustとPythonで使える[1]超高速("Blazingly fast")DataFrameライブラリー、つまりデータ解析に使えるライブラリーとなります。pandasに対するPolars(しろくま)であり洒落ているなと思います。 Core部分はRustで実装されており、インターフェースとしてPythonからも呼び出せるようになっています。RustからPythonパッケージへのビルドはmaturin(PyO3)を使っています。 環境 記事作成時のOSや言語、ライブラリーのバージョンは以下になります。関連が強そうなもののみ抜粋しています。 Ubntu 22.04 Python 3.10.6 (mai

                          超高速DataFrameライブラリー「Polars」について
                        • 逆引き DataFrameのデータ抽出(選択)処理 - Qiita

                          DataFrameのデータ抽出処理のまとめ。こういうのでいいんだよ的なものなので、細かい内容は他の方の記事を参考にしてください。データ入出力処理はこちら。 逆引き用の分類 何(インデックスor列名or値)を対象にどうやって(抽出条件)データを抽出したいのかにマッチする方法が何かを整理しています。おすすめの選択方法をリンク付きにしました。 抽出条件 インデックス(ラベル) 列名 dfの値

                            逆引き DataFrameのデータ抽出(選択)処理 - Qiita
                          • Python: PandasのDataFrameを横持ち・縦持ちに変換する - け日記

                            PandasのDataFrameを縦持ちから横持ちにする方法とその逆(横持ちから縦持ちにする方法)についての備忘録です。 縦持ちと横持ち 縦持ちは、以下のように、カラム固定で1行に1つの値を持たせている表です。カラムをおいそれと変更できないDBのテーブルなどはこういった形かと思います。 customer_id product_id count C1 P1 1 C1 P2 2 C2 P2 2 C2 P2 1 C3 P3 3 一方で、横持ちは、カラム数が可変で1行に複数の値をもたせている表です。行列はこういう形になるでしょう。 P1 P2 P3 C1 1 2 0 C2 0 3 0 C3 0 0 3 縦持ちから横持ちへ変換する それでは縦持ちとなっている以下のデータを横持ちへ変換します。 import pandas as pd import numpy as np orders_df = pd.

                              Python: PandasのDataFrameを横持ち・縦持ちに変換する - け日記
                            • 空DataFrameの作成パターン : showeryのブログ

                              作成パターン空のデータフレームを作って、レコードを追加していくパターン新たに空のデータフレームを作成既存データフレームから空のデータフレームを作成行だけ確保した空のDataFrameを作って、後からカラムを加えていくパターン空のデータフレームを作って、レコードを追加していくパターン新たに空のデータフレームを作成 import pandas as pd cols = ['col1', 'col2'] df = pd.DataFrame(index=[], columns=cols) record = pd.Series(['hoge', 'fuga'], index=df.columns) for _ in range(5): df = df.append(record, ignore_index=True) print(df)

                                空DataFrameの作成パターン : showeryのブログ
                              • pandas.DataFrameで重複行を検出・削除する方法 - ITips

                                表形式のデータを扱うのに便利なpandas.DataFrame。 DataFrameで扱うデータには重複した要素を含んでいることがある。 重複データは場合によっては必要ないことがあるので、重複データがあるか確認して削除したい。 しかしどうやって重複行を検出して削除すればいいのか。 そこで今回はpandas.DataFrameで重複行を検出・削除する方法について紹介する。

                                  pandas.DataFrameで重複行を検出・削除する方法 - ITips
                                • How to keep column order in case of concatenate pandas DataFrame - ITipsUs

                                  When I concatenate pandas DataFrame, column order was changed. I want to keep original column order. Pandas DataFrame is useful for data handling in Python. But when we concatenate DataFrame, sometimes column order changes. If column order is changed, it seems weird. If possible, we want to use original column order. So today I will introduce about "How to keep column order in case of concatenate

                                    How to keep column order in case of concatenate pandas DataFrame - ITipsUs
                                  • GitHub - lux-org/lux: Automatically visualize your pandas dataframe via a single print! 📊 💡

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      GitHub - lux-org/lux: Automatically visualize your pandas dataframe via a single print! 📊 💡
                                    • pandasのDataFrameを元に、画像入りの表をつくる - Qiita

                                      概要 機械学習をしていると、データの可視化をしたいことが多く、ときたま画像も入った表を出したくなることがある。 (↓例えばこんなの。画像認識したときのネコである判定スコアとか。) データ可視化はExcelとか、pandasとか使うことが多いが、数値や文字列程度ならいいものの、画像の入った表はパパっと作る方法がすぐには思いつかなかったりする。 今回はpandasのDataFrameを元データとして、画像入りの表をできるだけ簡単に作る方法を検討したので、メモしておく。 今回メモする方法は下記3つ。 1. DataFrame.to_html() を使ってHTMLにする 2. DataFrame.to_dict() とjinja2を使ってHTMLにする 3. DataFrame.to_excel() を使って作ったExcelファイルにopenpyxlで画像を入れる 1. DataFrame.to_

                                        pandasのDataFrameを元に、画像入りの表をつくる - Qiita
                                      • Jupyter Notebook と Pandas で DataFrame を全て表示するオプション設定 - kakakakakku blog

                                        Jupyter Notebook で Pandas のコードを実装しているときに同じような表示関連設定を繰り返し使うため,メモも兼ねてまとめておく.オプションは他にも多くあり,詳細はドキュメントに載っている.今回は Python 3.9 と Pandas 1.2.4 を前提とする. pandas.pydata.org オプション一覧を取得する 🎯 まず,Pandas では options でオプション一覧(名前空間)を取得できる.例えば display など.また options.display でオプション一覧(display 名前空間)を取得できる.例えば chop_threshold や colheader_justify など多くある. dir(pd.options) # ['compute', 'display', 'io', 'mode', 'plotting'] dir(p

                                          Jupyter Notebook と Pandas で DataFrame を全て表示するオプション設定 - kakakakakku blog
                                        • pandas.DataFrameに1行ずつ書き足す早い方法を調べた - Qiita

                                          何故やったか pandas.DataFrameに1行ずつデータを書き出して行く処理を書いていたんですが、10万行ほど書き出すと結構遅くなっちゃいました。今後行数が増える予定なので、これを期にどう書くと早くなるか確認しておく事にしました。 やったこと pandas.DataFrame.iloc[i, j] = hoge で1つずつ記入 pandas.DataFrame.append(hoge) で1行まとめて追加 pandas.DataFrame.iloc[i,:] = hoge で1行まとめて追加 1列ずつリストで作ってDataFrameに変換する※ ※ 2018.11/12 kishiyamaさんに教えて頂いたやり方を追記 試した環境 windows10 64bit cpu: Ryzen7 1700X gpu: GTX1080Ti python3.6 jupyter 1.0.0 jupy

                                            pandas.DataFrameに1行ずつ書き足す早い方法を調べた - Qiita
                                          • pandasのDataFrameから期間を範囲指定して抽出する - Qiita

                                            記事の概要 pandasで時系列データを扱う時に長時間の欠損値や異常値があった場合、補間ではどうにもできないので、既にあるDataFrameから日付を指定して抽出したい事がありました。 本記事はDataFrameのカラムに時間情報がある時に日付(あるいは時刻)で範囲指定して時系列データを抽出する方法を備忘録がてら記述したものになります。 また扱うテーブルの情報によって変換の仕方が違うためそれに関しても言及しています。 DataFrameから日時データの抽出 データの下準備になります。長いので必要ない場合この節は飛ばしても大丈夫だと思います。

                                              pandasのDataFrameから期間を範囲指定して抽出する - Qiita
                                            • pandas.DataFrame.queryによるデータ抽出10選 - Qiita

                                              はじめに この記事ではpandasの関数の1つであるqueryを用いた様々な条件抽出について紹介します。 筆者の経験の中で、データ前処理時に高頻度で遭遇する10つの例を元に実際のコードを記載します。 実行環境 mac OS Mojave Python 3.7.3

                                                pandas.DataFrame.queryによるデータ抽出10選 - Qiita
                                              • DataFrameでSettingWithCopyWarningの意味と対処法 - Qiita

                                                Pandasの DataFrame でSettingWithCopyWarningの警告の意味と対処方法について書きます。 DataFrame使っているとSettingWithCopyWarningによく遭遇していました。その度にその場しのぎの修正をして対応していましたが、さすがにそろそろ根本的に理解しないと時間がもったいないと思い、この記事で整理しました。 公式Pandasのヘルプと偉大な先人が書いてくれた以下の記事が非常にわかりやすいです。この記事では、簡潔に内容を書きます。 結論 結論から先に述べます。 暗黙のCopyをやめる。そのためにChain Indexingをやめる。警告をなくすにはそれだけです。 現象 SettingWithCopyWarningが起こる一例を最初に紹介します。 シンプルなDataFrameを作ります。 import pandas as pd df = pd

                                                  DataFrameでSettingWithCopyWarningの意味と対処法 - Qiita
                                                • pandas.DataFrame, Seriesを辞書に変換(to_dict) | note.nkmk.me

                                                  Posted: 2018-05-14 / Modified: 2019-10-31 / Tags: Python, pandas, 辞書 to_dict()メソッドを使うとpandas.DataFrame, pandas.Seriesを辞書(dict型オブジェクト)に変換できる。 pandas.DataFrameの場合、引数orientによってpandas.DataFrameの行ラベルindex、列ラベルcolumns、値valuesをどのように辞書のkey, valueに割り当てるかの形式を指定できる。 pandas.DataFrame.to_dict — pandas 0.22.0 documentation pandas.Seriesの場合は、ラベルがキーとなる辞書に変換される。 pandas.Series.to_dict — pandas 0.22.0 documentation

                                                    pandas.DataFrame, Seriesを辞書に変換(to_dict) | note.nkmk.me
                                                  • PandasのDataFrameを使ってElasticsearchにデータを投入 - YOMON8.NET

                                                    PandasのDataFrameをそのままElasticsearchに入れた方法書きます。 元データ準備 データの前処理 Elasticsearchへの接続確認 Elasticsearchへインデックスのスキーマテンプレートの定義 Elasticsearchにデータ投入 確認 参考URL 元データ準備 CSVのデータないかなとググったら一番最初に出てきたこちらのデータ使います。 男女別人口-全国,都道府県(大正9年~平成27年) www.e-stat.go.jp ダウンロードしたら、とりあえずShift_JISからUTF-8に変換しました。 中身のデータはこんな感じです。 データの前処理 簡単に前処理かけます。 # CSV読み込み df = pd.read_csv("c01.csv") # 不要な列を削除 df = df.drop('注',axis=1) df = df.drop('和暦(

                                                      PandasのDataFrameを使ってElasticsearchにデータを投入 - YOMON8.NET
                                                    • 【Pandas基礎】dataframeの並べ替えの基本 - Qiita

                                                      はじめに 自己紹介 Python勉強中の大学院生です。自分が詰まったところを記録していきます。 記事を書くに至った経緯 pandasのdataframeの並べ替えをしたいときに、どうやるんだっけと迷うことが多かったので、ここで記事にして整理しようと思いました。 本記事の概要 どんな人に読んでほしいか Pythonのpandasを学び始めた人 pandasのdataframeの並べ替えのやり方をうまく整理できていない人 この記事に書くこと、わかること dataframeの並べ替えのやり方がわかります。具体的なメソッドは以下の2つです。 df.sort_values() (列の要素で並べ替え) df.sort_index()(インデックスで並べ替え) 具体的な方法 まずは適当にdataframeを作成します。 import pandas as pd data = [[4, 2, 3, 1],

                                                        【Pandas基礎】dataframeの並べ替えの基本 - Qiita
                                                      • DataFrameレシピ: データ抽出条件 - Qiita

                                                        PandasのDataFrameはたまにしか使っていませんでした。いつもググりながら使っていましたが、本格的に使うに当たり、整理をしてみました。query関数でできることや注意点、ブールインデックスとの比較などを整理しています。 似た内容として記事「DataFrameレシピ: 行列指定して出力」にloc、ilocプロパティなどを使った行列指定方法も書いています。 まとめ(早見表) 私が参照したい部分を一番上に持ってきました。全般的にquery関数の方がシンプルに記述できますが、文字列はブールインデックスの方がやや読みやすいです。 文字列・数値共通 条件 query ブールインデックス

                                                          DataFrameレシピ: データ抽出条件 - Qiita
                                                        • pandas.DataFrameの型を変えたいけど例外レコードがあってastypeできない時の対処法 - Qiita

                                                          pandas.DataFrameにおけるString型列をfloatやint形式に直したい時がある。欠損値がある場合でも、astype(float)をすることによりfloat形式に変換することは可能だ。しかし、実データを扱う際には例外レコード(数値が入っているはずなのに記号が入っているなど)が紛れ込んでいることも多く、astype変換ではできないことがある。 そんな時にはpandas.to_numericを使おう。 df["数値変更したい列"] = pd.to_numeric(df["数値変更したい列"], errors='coerce') errosに対応するパラメータには3種類存在し、それぞれ以下の役割を持つ。 raise:例外データがあることを表示し、エラーを返す coerce:例外データ部分をNaNで返し、他の行は数値変換する ignore:例外データがある場合には数値変換はせず、

                                                            pandas.DataFrameの型を変えたいけど例外レコードがあってastypeできない時の対処法 - Qiita
                                                          • GitHub - jmcarpenter2/swifter: A package which efficiently applies any function to a pandas dataframe or series in the fastest available manner

                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

                                                              GitHub - jmcarpenter2/swifter: A package which efficiently applies any function to a pandas dataframe or series in the fastest available manner
                                                            • DataFrameの値の更新 - pandas [いかたこのたこつぼ]

                                                              pandasは、DataFrameの値の取得方法がいろいろあるため、値の代入更新もつい「この書き方でいいんだっけ」と混乱する。 基本的には(一般的な代入と同じく)左辺で更新するデータ範囲を、右辺で値を指定するのだが、左辺のデータ範囲の指定方法が様々あるのに加え、右辺での値の指定にも複数方法がある。 df.loc[df['col1']==3, ['col2', 'col3']] = df['col4'] col1 が 3 である行の col2,col3 列を、ともに同行の col4 の値にする 大別すると以下の感じ。 左辺のアクセス関数に例えば配列を渡しても、関数の種類や配列の中身によって、名前か、添字か、どのように解釈されるか異なってくるのがややこしさの元となる。

                                                              • 【Python】PandasのDataFrameで特定の行を爆速で更新する方法 | ゆとって生きたい。

                                                                【Python】PandasのDataFrameで特定の行を爆速で更新する方法 2019.12.26 Pyhon NumPy, pandas, python, Python3 すみません、タイトルはちょっと誇張表現含んでます。 あまりpandasに慣れていない人が書いていたと思われるコードで実行すると、 数十分かかる処理が1秒以下で終わるようになるという事はざらにあります。 pandasは便利ではあるのですが、何も考えずに書くとPythonという言語の特性やpandasのデメリットばかりを享受するようなコードになりがちです。 本来の実力をpandasに発揮してもらえるようになったらいいなあという記事になります。 環境 Python: 3.7.4(Anaconda環境) numpy:1.16.5 pandas:0.25.1 実行時間の計測はjupyterで「%%timeit」を使用しています

                                                                  【Python】PandasのDataFrameで特定の行を爆速で更新する方法 | ゆとって生きたい。
                                                                • [pandas超入門]DataFrameオブジェクトの作成と行や列、要素の選択

                                                                  [pandas超入門]DataFrameオブジェクトの作成と行や列、要素の選択:Pythonデータ処理入門(1/2 ページ) DataFrameオブジェクトを生成する方法とその際に指定可能なオプション、DataFrameから特定の行や列、個別の要素をiloc属性とloc属性で選択する方法を見ていきます。

                                                                    [pandas超入門]DataFrameオブジェクトの作成と行や列、要素の選択
                                                                  • LangChainのPandas Dataframe Agentをつかって自然言語でテーブルデータの分析をしてみる - NRIネットコムBlog

                                                                    こんにちは、堤です。 前回のブログでLangChainの基本的な使い方を試してみました。 tech.nri-net.com その中で今回はPandas Dataframe Agentを使ってみて、面白いなと思ったので使い方をご紹介します。 Pandas Dataframe Agentとは LangChainにはAgentという要求されたクエリに対して、ToolとLLMを使用しながら繰り返し結果を得て最終的な回答を導き出す機能があります。 python.langchain.com その中でPandas Dataframe AgentはPandasのデータフレームに特化したAgentとなっています。このAgentをつかうことでCSVなどのファイルをPandasで読み込んで分析を行うことができます。 python.langchain.com 試してみる 実際にCSVファイルに対してPandas

                                                                      LangChainのPandas Dataframe Agentをつかって自然言語でテーブルデータの分析をしてみる - NRIネットコムBlog
                                                                    • Pandas DataFrameを徹底解説!(作成、行・列の追加と削除、indexなど) - AI-interのPython3入門

                                                                      Pandas(パンダス)とは、データを効率的に扱うために開発されたPythonのライブラリの1つで、データの取り込みや加工・集計、分析処理に利用します。 Pandasには2つの主要なデータ構造があり、Series(シリーズ)が1次元のデータ、DataFrame(データフレーム)が2次元のデータに対応します。 実務で利用するデータは2つの軸で表される2次元のデータが多いので、DataFrameを利用する機会は非常に多く、DataFrameを理解することは、データを効率的に扱う上でとても重要になります。 この記事では、まずはDataFrameの基本的な使い方を確認した上で、最後にDataFrameを用いたデータ分析の事例を確認していきましょう。 DataFrame(データフレーム)とはDataFrameは2次元のデータに対応するデータ構造で、次のように行と列で表現され、複数の行と列が存在します

                                                                        Pandas DataFrameを徹底解説!(作成、行・列の追加と削除、indexなど) - AI-interのPython3入門
                                                                      • `pandas.DataFrame`の`columns`引数にtupleのlistを渡しても、MultiIndexな列にはらない - Qiita

                                                                        環境 Python 3.11.2 pandas 2.0.2 起きたこと pandas.DataFrameにkeyがtupleであるdictを渡すと、MultiIndexな列を持つDataFrameを生成できます。 In [94]: data = {("japan","male"):[1,2,3], ("japan","female"):[11,12,13], ("u.s.","male"):[2,3,4]} In [94]: data Out[95]: {('japan', 'male'): [1, 2, 3], ('japan', 'female'): [11, 12, 13], ('u.s.', 'male'): [2, 3, 4]} In [96]: df1 = pandas.DataFrame(data) In [97]: df1 Out[97]: japan u.s. male

                                                                          `pandas.DataFrame`の`columns`引数にtupleのlistを渡しても、MultiIndexな列にはらない - Qiita
                                                                        • How to remove none from pandas DataFrame - ITipsUs

                                                                          Pandas is very useful to handle table data. In table data, sometimes it contains None data. In that case we would like to remove None from specific column. So how can we remove None ? Today I will introduce about "How to remove none from pandas DataFrame". How to remove none from pandas DataFrame In order to remove None data, use dropna() method. As its name, dropna() drops None data. We can use i

                                                                            How to remove none from pandas DataFrame - ITipsUs
                                                                          • Analyse 100 GB of data with the Vaex dataframe library in Python

                                                                            Analyse 100 GB of data with the Vaex dataframe library in Python Learn how to explore, visualise and analyse 100s of Gigabytes of tabular data with the Vaex open-source dataframe library in Python. Many organizations are trying to gather and utilise as much data as possible to improve on how they run their business, increase revenue, or how they impact the world around them. Therefore it is becomi

                                                                              Analyse 100 GB of data with the Vaex dataframe library in Python
                                                                            • 図解!Pandas DataFrameのmergeによる結合(JOIN) - ビジPy

                                                                              データを分析する上では、通常は1つのDataFrameだけではなく、複数のDataFrameを組み合わせて、データを確認・分析していく必要があります。その際に必要となるのが、結合の処理です。 DataFrameの結合方法を、データベースにおけるSQLでのテーブルの結合方法に例えると、結合には行単位の連結であるUNION(ユニオン)と、列単位の連結であるJOIN(ジョイン)の2種類があり、それぞれ次のようなものになります。 行単位の連結(UNION):同じ列をもつDataFrameを縦(行を増やす)方向に連結する。列単位の連結(JOIN):結合するキーとなる列を元に、DataFrameを横(列を増やす)方向に連結する。 この記事では、DataFrameの結合方法の1つである列単位の結合(JOIN)について学んでいきましょう。Pandasではmerge()を利用して、DataFrameに対して

                                                                                図解!Pandas DataFrameのmergeによる結合(JOIN) - ビジPy
                                                                              • I wrote one of the fastest DataFrame libraries - Ritchie Vink

                                                                                I wrote one of the fastest DataFrame libraries February 28, 2021 by Ritchie Vink 1. Introduction At the time of writing this, the coronavirus has been in our country for a year, which means I have been sitting at home for a very long time. At the start of the pandemic, I had a few pet projects in Rust under my belt and I noticed that the “are we DataFrame yet”, wasn’t anywhere near my satisfaction

                                                                                  I wrote one of the fastest DataFrame libraries - Ritchie Vink
                                                                                • pandas DataFrameで整形後Redshiftにロードする時はInt64を使おう | DevelopersIO

                                                                                  こんにちは、平野です。 久しぶりにブログ書く時間が確保できました。 在宅で仕事しているとちょこちょこ家事が発生したりで、なかなかブログまで手が回らない...。 と言っていても仕方ないので、定期的なアウトプットは再開して行きます! 閑話休題。 Redshiftへのデータロードする際にSTL_LOAD_ERRORが発生して何か失敗してるなぁ、と思ったら、 pandasの意外と面倒な仕様に当たっていて、解決までに結構苦労したのでブログにしておきます。 今回、既存システムの移行ということでpandasでのデータ整形に初めて触ったのですが、 比較的あるあるなハマり方なのかな、ということで参考にして頂ければと思います。 状況 今回想定しているケースは以下のような状況です。 S3上のファイルをread_csvでpandas DataFrameに取り込む DataFrameで値の整形などを行う(この記事で

                                                                                    pandas DataFrameで整形後Redshiftにロードする時はInt64を使おう | DevelopersIO

                                                                                  新着記事