[B! 機械学習] gadie_8107のブックマーク

メディカルAI専門コース | 日本メディカルAI学会x株式会社キカガク

メディカルAI専門コースは AIを医療の領域で活用するための知識・技術を学ぶ機会とその知識の証明のための資格試験を提供します。

gadie_8107 2023/12/09

リンク

2023年版データ分析の100冊 - Qiita

【データ分析の必読10冊+差をつける10冊＋100冊超】データサイエンス、データ分析、機械学習関連の本がご好評いただいてましたが古くなりごちゃごちゃしているので新たに作り直しました本記事のめあて IT系の技術者の方がデータ分析関連の仕事をするために役立つ本を紹介する（私が学び始めた時にあれば欣喜雀躍したであろう）記事として書いております。本記事作者の青木はバイオインフォマティクス（ゲノムデータのDB化中心・Perl・MySQL）からRで時系列分析→Pythonでデータ分析一般と業務をしてまいりました。ですので研究者目的の本はありません。また、データ分析の基礎は主にRで学んだのですが、昨今の流行に合わせてPython 本を中心に、Rの本は参考程度にしています（本記事のR版のご要望があれば爆裂書きます！）こういうリストをあげる奴は大抵読んでいない、と過去にも言われたのですが、ほとんど読ん

gadie_8107 2023/08/27

リンク

画像生成AIが「トレパク」していた？　学習画像と“ほぼ同じ”生成画像を複数特定　米Googleなどが調査

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: ＠shiropen2 米Google、米DeepMind、スイスのETH Zurich、米プリンストン大学、米UC Berkeleyに所属する研究者らが発表した論文「Extracting Training Data from Diffusion Models」は、テキストから画像を生成する拡散モデルが学習データとほぼ同じ画像を生成していたことを実証した研究報告である。これは学習データの各画像を拡散モデルが記憶し、生成時にほぼ同一を出力していたことになる。個人を特定できる顔写真や商標登録されたロゴも含まれていたため、今回の結果はプライバシーや著作権の問題も深く絡むことになる

gadie_8107 2023/02/08

リンク

創作に用いられる生成モデル発展の4段階と、ChatGPTに見る現在と今後｜piqcy

ChatGPTやStable Diffusionを代表として、知性や経験を持つ人間かのように画像やテキストを生成する「生成モデル」が注目されています。Gartnerの2022年のレポートでは、これまで人間が経験や思考に基づき行っていたアウトプットを、それらなしに生成できる破壊的なテクノロジーと定義されています。本記事では、こうした創作に用いられる生成モデルの発展を4段階で定義し、ChatGPTを先端とし現在と今後の在り方を展望します。創作に用いられる生成モデルの発展段階本記事では、Gartnerが提唱するような人間の創作を模倣する用途で使われる生成モデルについて議論します。人間がアウトプットを行うプロセスを次図のように企画、調査、設計、制作、推敲の5段階で定義します。制作のプロセスと、生成モデルの対応範囲「制作」から「推敲」に使える生成モデルを1.0、「設計」から「制作」、場合によって

gadie_8107 2023/02/03

リンク

画像の機械学習が劣化する理由 - Qiita

前書き注意：ここに書いていることは2020年代としては、古すぎる見解になっている。近年の自己教師あり学習の大幅な進展で、ここで述べているようなアプローチは大幅に古めかしいものになっている。・自己教師あり学習の進展は、画像認識タスクに対する共通のbackbone を作り出しており、後段で個々の画像認識タスクに対するfine-tuningをするアプローチに変わってきている。・そのため、ラベル付きの限られたデータで特徴量の抽出をしていたのが、自己教師あり学習に基づく特徴量の抽出になっている。・各人、自己教師あり学習について調べることをお勧めする。主旨単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。はじめに画像認識の機械学習を改善するためにはデータを追加すればよい。そう思っている人が大半だろう。ただ、

gadie_8107 2022/05/01

リンク

真面目なプログラマのためのディープラーニング入門

はじめに: 本講座は「機械学習ってなんか面倒くさそう」と感じているプログラマのためのものである。本講座では「そもそも機械が『学習する』とはどういうことか?」「なぜニューラルネットワークで学習できるのか?」といった根本的な疑問に答えることから始める。そのうえで「ニューラルネットワークでどのようなことが学習できるのか?」という疑問に対する具体例として、物体認識や奥行き認識などの問題を扱う。最終的には、機械学習のブラックボックス性を解消し、所詮はニューラルネットワークもただのソフトウェアであり、固有の長所と短所をもっていることを学ぶことが目的である。なお、この講座では機械学習のソフトウェア的な原理を中心に説明しており、理論的・数学的な基礎はそれほど厳密には説明しない。使用環境は Python + PyTorch を使っているが、一度原理を理解してしまえば環境や使用言語が

gadie_8107 2022/03/21

リンク

AIプロジェクトにおける説明可能性の方針 - techtekt

こんにちは。デジタルテクノロジー統括部でアナリストをしているY・Nです。パーソルキャリアのデジタルテクノロジー統括部は、一般社団法人データサイエンティスト協会が定める「データサイエンティストに求められるスキルセット」を基に、以下の3つのグループが組織されています。ビジネスグループアナリティクスグループエンジニアグループ出典：データサイエンティスト協会これらの3グループが互いに連携しあい、AI（ここでは機械学習による予測モデルを指すことにします）によって様々な業務を自動化させたり、意思決定の補助に利用させるプロジェクトに取り組んでいます。その際、「AIの判断根拠をどの程度（どの様に）見せれば良いか」ということが常にビジネスグループで議題に上がります。殊にAIの予測結果を人間（特に営業部門の人）が見た上で意思決定の補助として利用する場合に顕著で、判断根拠が表示されないブラックボッ

gadie_8107 2022/02/09

リンク

機械学習の評価指標 | 機械学習のモデル性能を評価する感度・特異度・偽陽性などについて

機械学習モデルの評価指標機械学習モデルを評価する指標は以下のように多くの種類がある。どの指標を重視すべきかは、実際に解決しようとする問題によって決める。例えば、機械学習によるがん診断などで、正常者をがん患者と間違って予測してても、がん患者を見逃ししたくなければ、感度や適合率に着目すればいい。感度 sensitivity / 検出率 recall 感度 sensitivity は、陽性のデータを正しく陽性と予測した割合である。検出率 recall または True positive rate (TPR) ともいう。感度の計算には、陰性データの予測結果が含まれていない。そのため、すべてのデータを陽性と判定すれば（FN = 0）、感度を 100% にすることができる。 \[ TPR = \frac{TP}{TP + FN} \] 特異度 specificity 特異度 specificity

gadie_8107 2021/08/23

リンク

Hiroshi Takahashi

Skip to the content. 機械学習の研究者を目指す人へ機械学習の研究を行うためには、プログラミングや数学などの前提知識から、サーベイの方法や資料・論文の作成方法まで、幅広い知識が必要になります。本レポジトリは、学生や新社会人を対象に、機械学習の研究を行うにあたって必要になる知識や、それらを学ぶための書籍やWebサイトをまとめたものです。目次プログラミングの準備 Pythonを勉強しよう分かりやすいコードを書けるようになろう数学の準備最適化数学を学ぼう基本的なアルゴリズムとその実践機械学習の全体像を学ぼう基本的なアルゴリズムを学ぼう深層学習の基礎を学ぼう scikit-learnやPyTorchのチュートリアルをやってみようサーベイの方法国際会議論文を読もう Google Scholarを活用しよう arXivをチェックしようスライドの作り方論文の

gadie_8107 2021/05/09

リンク

機械学習、深層学習のプラットフォームの整理 - Qiita

PaaSサービスの簡単な説明各ベンダーの提供サービスには予め学習されたモデルの翻訳や画像・動画認識などが用意されています。 Google Cloud Platform Google社が提供する機械学習プラットフォームになります。サイズを問わず、あらゆるデータの機械学習モデルを簡単に構築できるマネージドサービスです。クラウド上に用意されたTensorFlowも使えます。 ※サイトより抜粋機械学習の内容・Cloud Machine Learning Engine 教師ありの回帰・分類、教師なしのクラスタリングなどさまざまなデータから学習ができます。使用アルゴリズムは非公開。 Azure Machine Learning Azure Machine Learning は、クラウドの予測分析サービスであり、分析ソリューションとして予測モデルを迅速に作成し、デプロイできるようにします。

gadie_8107 2021/04/12

リンク

キャラクター画像一枚でより表情豊かなアニメーションを生成するシステムを作ってみた

上の動画中のキャラクターはバーチャルYouTuberまたはそれに関連したキャラクターです。この記事中の画像や映像は彼らのファンアート・二次創作です。[footnote] ほとんどの動画内のバーチャルYouTuberはいちから、カバー、774 inc.、のりプロ、KMNZ等の企業様に所属してます。しぐれうい様、神楽めあ様、伊東ライフ様、兎鞠まり様、ノート竹花様、なつめえり様、名取さな様、ユキミお姉ちゃん様、聖女れりあ様、楪穂波様、幽ヶ崎海愛様、花雲くゆり様、ケリン様、ふくやマスター様の画像も使わせていただきました。誠に申し訳ございませんが、切り抜き動画やMADや同人ゲーム等の二次創作と同じように使用許可は全く取っておりません。2019年の記事を（まだ世に出ていない）学術論文にした時は一部の企業様に連絡して許可を頂きましたが、この記事で使用する許可は取っておりません。私は２０１９年に一枚のキ

gadie_8107 2021/02/06

リンク

「いらすとや」は要らなくなっちゃう？テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい

小猫遊りょう（たかにゃし・りょう） @jaguring1 毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI 技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。小猫遊りょう（たかにゃし・りょう） @jaguring1 うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた（DALL-EとCLIP）。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/

gadie_8107 2021/01/07

その“「いらすとや」は要らなくなっちゃう？”が要らないだろ

リンク

全ての機械学習の論文は新しいアルゴリズムを提案しているのですか？

回答 (2件中の1件目) 悲しいことにその通りです。そしてこれこそがこの分野の最も深い問題です。私の推定では、機械学習では毎年10,000以上の論文が発表されています(一日に30本程度)。2020年は私が機械学習で活発に論文を発表してから35年目の年なので、私も機械学習の研究者と同じようにこの罪を犯しています。なぜそれが問題なのかを理解してみましょう。警告：以下の議論は、MLの研究者や実践者として、あなたに深い不安を与えてしまうかもしれません。私の推論に少しでも我慢していただければ、私が得られなかった大きな利益を得ることができるかもしれません。私は40年間機械学習について考えてきまし...

gadie_8107 2020/09/15

リンク

Ml system in_python

https://www.youtube.com/watch?v=krnaOxKRhoQ&feature=youtu.be Machine learning system in Python. https://github.com/mercari/ml-system-design-patternRead less

gadie_8107 2020/09/02

リンク

Self-Attentionを全面的に使った新時代の画像認識モデルを解説！ - Qiita

08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします！(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransf ormerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ

gadie_8107 2020/08/31

リンク

機械学習の勉強を始めて1年以内にkaggleで2位になったので、やったこと全部書く - kaggle日記

皆さん初めまして！先日kaggleのARCコンペで2位になったのですが、 2位で終了しました！みなさんお疲れさまでした。コード書くの楽しかった。 pic.twitter.com/dLxl6Mlgoe — Aryyyyy (@aryyyyy13) 2020年5月28日僕のkaggle歴が浅めということもありtwitterでも結構反響があって、何人かの方にはわざわざDMまで頂いてどんな勉強をしたか聞いていただきました。なるほど需要があるならということで、今までのことをまるっと振り返ってみようと思います。これからkaggle始める方のためになれば幸いです。機械学習を始める前のスペック準備期間：2019年7月〜 kaggle初参加：2019年9月〜 kaggleちゃんと始める：2019年10月〜 DSB参加：2019年10月〜会社を休職して本格的に勉強開始：2020年1月前半〜手頃な

gadie_8107 2020/06/06

リンク

【機械学習に役立つ3つのAWSサービス】SageMaker・Athena・Glueについて解説 - Qiita

AWSで機械学習を行うときに、役に立つサービスを紹介します！なお当記事の読者として、以下の知識がある方を想定しています。・ EC2、S3及びRDSといったAWSの基本的な機能・機械学習のおおまかな流れについて・ Jupyter notebookとは？この記事では、特に使用頻度の多い「SageMaker」「Athena」「Glue」の三つのサービスについて、それぞれの特徴と使用場面をざっくり理解していただけたらと思います！ AWSで機械学習を行うメリットライブラリを標準装備しているため、環境設定を行う必要がない学習に時間がかかる場合でも、インスタンスの性能を引き上げることで高速化が可能既にAWSを使っていて、S3などのストレージに学習データがある場合、処理がスムーズデータベースや学習の実装、デプロイまでを一貫してAWS上で行うことができるローカルマシンではなく、AWS上

gadie_8107 2020/04/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (11)

機械学習に関するgadie_8107のブックマーク (17)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス