タグ

arxivに関するZAORIKUのブックマーク (3)

  • Backpropしないニューラルネット入門 (2/2)

    1. 概要下記のarXiv論文を紹介します。 Jinshan Zeng, Tim Tsz-Kit Lau, Shaobo Lin, Yuan Yao (2018). Block Coordinate Descent for Deep Learning: Unified Convergence Guarantees.arXiv:1803.00225 現時点では投稿されて間もない論文ですが、個人的には機械学習の論文を読んでいて久々に楽しい気持ちになれました。 論文の提案手法はgradient-free methodと呼ばれる手法の一種なので、記事はそのあたりのレビューも少し兼ねます。 2. 勾配法の収束条件ニューラルネットの構造をひとつ固定し、その構造を使って表せる関数の全体を $\mathcal{F}$ と書きます。ニューラルネットの学習とは、与えられた損失を最小化する関数を見つけることで

  • 翻訳アルゴリズムで化学反応を予測、IBMの研究者が発表

    有機化学を原子や分子ではなく、単語や文と考えることで、人工知能AI)アルゴリズムを用いて化学反応を予測する方法が発見された。 IBMの研究者がアーカイブ(arXiv)に論文を掲載し、神経情報処理システム(Neural Information Processing Systems:NIPS)学会で発表した研究によると、化学反応の予測を翻訳問題として扱うと、従来のモデルよりも高い確率で正しい反応を導き出せるという。 「直感的に言って、化学者の化合物に対する理解と、言語学者の単語に対する理解の間には類似性があります」と研究者は書いている。 研究者は、機械翻訳でしばしば使われるニューラル・ネットワークを用いて、39万5496件の化学反応を含んだデータセットでシステムを訓練。ニューラル・ネットは、未見の化合物を予測できるようになるために、そのデータから化学反応の「構文」を学習した。学習済みのアルゴ

    翻訳アルゴリズムで化学反応を予測、IBMの研究者が発表
  • Latest Papers – arXiv Vanity

    The Chosen One: Consistent Characters in Text-to-Image Diffusion Models 16 November 2023 Recent advances in text-to-image generation models have unlocked vast potential for visual creativity. However, these models struggle with generation of consistent characters, a crucial aspect for … computer vision graphics learning JaxMARL: Multi-Agent RL Environments in JAX 16 November 2023 Benchmarks play a

  • 1