不均衡データ分類問題をDNNで解くときの under sampling + bagging 的なアプローチ - BASEプロダクトチームブログ

テクノロジーカテゴリーの変更を依頼記事元:

devblog.thebase.in

48 usersがブックマークコメント

コメント

3

記事へのコメント3件

注目コメント
新着コメント

misshiki “テキストデータを特徴量にもつ不均衡データ分類問題をDNNで解きたくなった際、下記の論文を参考にしたのでその内容を紹介します。 https://users.cs.fiu.edu/~chens/PDF/ISM15.pdf”

2020/03/02 リンク

h_taiji これはとても良さそう。試す

2020/02/29 リンク

shunk031 Pytorchのsamplerをカスタマイズしてunder sampling + baggingを実現してる例。良さそう

2020/02/29 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

不均衡データ分類問題をDNNで解くときの under sampling + bagging 的なアプローチ - BASEプロダクトチームブログ

はじめにこんにちは、Data Strategy所属の岡です。グループ会社BASE BANKで分析/モデリングなども兼務... はじめにこんにちは、Data Strategy所属の岡です。グループ会社BASE BANKで分析/モデリングなども兼務しています。テキストデータを特徴量にもつ不均衡データ分類問題をDNNで解きたくなった際、下記の論文を参考にしたのでその内容を紹介します。 https://users.cs.fiu.edu/~chens/PDF/ISM15.pdf 不均衡データ分類問題ってなに？何かしらのカテゴリを機械学習などで分類予測しようとする際、カテゴリごとのデータ件数に偏りがある、特に正例のデータが極端に少ないケースで予測精度が上がりにくい、という問題をこのように呼んでいます。例: 不正決済と正常な注文、不正商品と健全な商品、がん患者と正常な患者普通はどうやって対処するの？ベースとなるアプローチは下記3つにまとめられます。アプローチ内容デメリットアンダーサンプリング多数派データを

ブックマークしたユーザー

techtech05212024/03/23
Tawara2022/02/06
shimao-ma2020/03/09
Hiro_Matsuno2020/03/07
tachibanana382020/03/06
laiso2020/03/02
okumuraa12020/03/02
misshiki2020/03/02
knok2020/03/02
clavier2020/03/02
okayama11112020/03/01
Gln2020/03/01
machupicchubeta2020/03/01
yuhei_kagaya2020/02/29
Makots2020/02/29
sakito09022020/02/29
Caat2020/02/29
peketamin2020/02/29

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx