ｼﾞｮｲｼﾞｮｲｼﾞｮｲ[B!]新着記事・評価

松井・熊谷『転移学習』の感想 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

20 users

joisino.hatenablog.com

講談社サイエンティフィク様より『転移学習』をご恵贈いただきました。一通り読み終えたので感想を書きます。転移学習 (機械学習プロフェッショナルシリーズ) 作者:松井孝太,熊谷亘講談社Amazon 全 414 ページとかなりの重厚感。しかも決して引き伸ばした跡がなく、むしろ原液のような濃さを感じる中身です。原理に基づいて本質的な事項が解説されており、しっかり読むととても力のつく一冊だと思いました。転移学習の難しさを直視する本書の大きな特徴は転移学習の難しさを誤魔化さずに正面から取り扱っている点です。転移学習とは、元ドメインのデータと目標ドメインのデータが与えられたときに、目標ドメインでの性能が高いモデルを獲得する技術です。鍵になるのは元ドメインのデータであり、これをうまく活用することで従来の学習よりも「ラクに」良いモデルを得ることを目指します。ここでいうラクとは、必要な目標ドメ

テクノロジー
2024/04/10 22:42

あとで読む

大学で読んだ情報科学関連の教科書 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

721 users

joisino.hatenablog.com

先日、博士（情報学）になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を思い出を振り返りつつここにまとめます。私は授業はあまり聞かずに独学するタイプだったので、ここに挙げた書籍を通読すれば、大学に通わなくてもおおよそ情報学博士ほどの知識は身につくものと思われます。ただし、特に大学院で重要となる論文を読み書きすることについては本稿には含めておりません。それらについては論文読みの日課についてや論文の書き方などを参考にしてください。 joisino.hatenablog.com 凡例：（半端）とは、数章だけ読んだ場合か、最後まで読んだものの理解が浅く、今となっては薄ぼんやりとしか覚えていないことを指します。☆は特におすすめなことを表します。学部一年寺田文行『線形代数増訂版』黒田成俊『微分積分』河野敬雄『確率概論』東京大学教養学部統計学教室『統計学

テクノロジー
2024/03/27 18:24

拡散モデルと最適輸送 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

40 users

joisino.hatenablog.com

『最適輸送の理論とアルゴリズム』が重版して第 5 刷となりました。皆さまありがとうございます！漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。本稿では、最近話題の拡散モデルと最適輸送の関係を直観的に解説します。拡散モデルは画像の生成によく用いられる生成モデルです。モデルはノイズ入りの画像を受け取り、ノイズを除去することを目指します。生成時には、完全なノイズ画像からはじめて、モデルによりノイズを除去することと、微小なノイズを加えることを繰り返して洗練させていき、自然画像を得ます。拡散モデルの動作の図示このように、ノイズから自然画像までゆらぎながら変化する過程をブラウン橋 (Brownian bridge) と言います。ブラウン運動 (Brow

テクノロジー
2024/03/08 18:07

モデルパラメータの算術 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

44 users

joisino.hatenablog.com

深層モデルのパラメータを一列に並べてベクトルにします。このベクトルは大規模なモデルであれば何十億次元にもなります。一見、意味のない数値の羅列のようですが、このベクトルはベクトルとして深い意味があることが分かってきています。例えば、とを異なるパラメータベクトルとすると、やをパラメータとして持つモデルはちゃんと機能します。本稿では、このようなモデルパラメータの算術を用いた手法とその背後にある理論について解説します。モデルスープタスクベクトルモデルパラメータとニューラルタンジェントカーネルおわりにモデルスープモデルスープ [Wortsman+ ICML 2022] は複数のモデルパラメータを平均することで性能を上げる手法です。事前学習モデルからはじめて、様々なハイパーパラメータで訓練した結果のパラメータをとします。これらを平均したベクトルは個々のモデルよりも性能が高く、

テクノロジー
2024/01/09 19:30

『Human-in-the-Loop 機械学習』 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

38 users

joisino.hatenablog.com

共立出版さまより『Human-in-the-Loop 機械学習』をご恵贈いただきました。一通り読み終えたので感想を共有します。映り込みが激しくて写真を撮るのが難しいことで有名な表紙本書は機械学習モデルを訓練するためのデータを人間がどのように用意するかという問題を扱っています。本書の前半では能動学習というラベル付けデータの選び方の技法が、本書の後半では人間が付けたラベルの管理方法やラベル付けのための適切なインターフェースが紹介されています。機械学習におけるデータをいかに作るかということは私自身とても注目している領域です。『Active Learning from the Web（能動学習を使ってウェブから機械学習データを収集する）』という論文を書いたこともありますし、PDF 翻訳サービスの Readable では能動学習に基づいたアノテーションを実際に行っています。そのため本書は非常に

テクノロジー
2023/12/27 18:16

2023 まとめ - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

2 users

joisino.hatenablog.com

2023 も色々やりました。 ↓去年 joisino.hatenablog.com 研究今年はあまり論文を出版できませんでした。去年 10 本出版しましたとか言って調子に乗っていたのに……。優しい内臓先生の「私は過去の自分と比較するのが好きです。高確率で勝てるので。」という言葉が好きなのですが、私は負けました。悔しい。調子良かった年だけ貼るのも良くないのでちゃんと今年も貼ります（偉い）。本の執筆去年一年ずっと執筆していた『最適輸送の理論とアルゴリズム』が無事出版されました。買っていただいた皆様ありがとうございます。まだ買っていない方も、まだこの本を読む人生の楽しみがあるということでおめでとうございます。最適輸送の理論とアルゴリズム (機械学習プロフェッショナルシリーズ) 作者:佐藤竜馬講談社Amazon また書きたいな〜と言っていましたが早速執筆の機会をいただき、同じ機械学習プロフ

テクノロジー
2023/12/21 19:36

君たちはどう研究するか - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

99 users

joisino.hatenablog.com

IBIS 2023 のパネルディスカッション「君たちはどう研究するか」にて研究の取り組み方についてお話しました。この記事はそこでお話した内容を編集したものです。 🔍研究テーマの決め方について 📆 研究プロジェクトの進め方 😵‍💫 研究がうまくいかないときの対処法 📝 論文の書き方おわりに 🔍研究テーマの決め方について僕は研究テーマ選びはあまり重要ではないと考えています。どういうテーマにめぐり合うかは運なので、そこで思いつめても仕方がありません。なので、僕は自分から積極的にテーマを探しにいくということはしていません。それよりも、テーマを決めたあとの掘り下げ方という自分でコントロールする部分に集中して研究に取り組んでいます。その人の地力によって、テーマとして成立させられるストライクゾーンが決まってくると考えています。初心者うちは、王道のテーマで王道のストーリーでしか成立させら

テクノロジー
2023/10/29 16:54

シュトラッセンのアルゴリズムとその導出の仕方 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

1 user

joisino.hatenablog.com

よりも小さい時間計算量で行列積を計算するシュトラッセンのアルゴリズムとその導出方法を紹介します。シュトラッセンのアルゴリズムの行列積を考えます。まずを $$ \begin{pmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{pmatrix} \begin{pmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{pmatrix} = \begin{pmatrix} C_{11} & C_{12} \\ C_{21} & C_{22} \end{pmatrix} $$ というように行列に分解します。が奇数のときは余った行、列を適当にどちらかに分けてあげてください。まずつの行列積 $$ \begin{align} P_{1} &= ( A_{11} + A_{22} ) ( B_{11}

テクノロジー
2022/04/29 22:19

自分の研究を自腹で広告した体験談 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

17 users

joisino.hatenablog.com

皆さんは自分の研究成果をどうやって広めていますか？ひとつの研究は実働時間だけでも最低数ヶ月、全出版プロセスを考えると一年単位で取り組むこととなります。そうして手塩にかけて育てた研究が誰にも認知されない、というのはなんとも悲しいことです。僕が所属している機械学習分野は人工知能ブームにより、日々洪水のように論文が発表され、その中で存在感を発揮するのは難しくなっています。一昔前であれば、名のある国際会議やジャーナルに採択されればそれなりに存在感を発揮できたようですが、今では一つの会議に数千本の論文が採択されるため、採択された後にも競争に勝たなければ目立てないという事態になっています。論文のクオリティを上げて名のある国際会議に採択されるだけでは不十分、となれば一体どうすれば良いでしょう。有望な策は無く、天に祈って運に任せる、というのが最も一般的なパターンではないでしょうか。広く読まれる論

テクノロジー
2022/04/26 17:19

まんがタイムきらら系列誌の発売日をSlackに通知する - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

1 user

joisino.hatenablog.com

皆さん、忙しい日々の生活に追われ、まんがタイムきらら系列誌を買い忘れてしまうことはありませんか？まんがタイムきらら系列誌を買い忘れると QOL が大きく低下してしまうので、これだけはなんとしても避けたいものです。そこで、買い忘れないように発売日に Slack に通知してくれるスクリプトを書きました。レポジトリ github.com レポジトリです。先行研究 github.com 先行研究としては @tyage さんの dokidokivisual-bot が挙げられれます。まんがタイムきらら系列誌は月刊誌なので、基本的にはこのように発売日を固定としても問題無いのですが、発売日が日曜日や祝日と被ると実際の発売日が前倒しになります。例えば、まんがタイムきららキャラットは毎月 28 日に発売が予定されていますが、 2018/01/28 は日曜日なので、 2018 年 3 月号は 20

テクノロジー
2019/11/16 23:32

Batch Normalization - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

1 user

joisino.hatenablog.com

Batch Normalization [1] を chainer で実装しました。色々な場合に適用できて、学習速度が速くなったり汎化性能が上がったりするすごいテクです。 Batch Normalization の説明上層（出力層に近い層）の入力は、当然下層（入力層に近い側）のパラメータに依存します。学習が進むにしたがって下層のパラーメータは変化するので、それにしたがって上層の入力の分布が変化します。このような中間層の入力の分布の変化を Internal Covariate Shift と呼びます。入力の分布が変化した層はそれに合わせてパラメータも学習しなおさなければなりません。これが、学習の速度を下げる要因になります。 Batch Normalization は、Internal Covariate Shift が起きないように各層の入力の分布を一定に保とうとするテクです。

テクノロジー
2019/10/10 12:44

前処理O(n)クエリO(1)のLCAと静的RMQ - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

1 user

joisino.hatenablog.com

時間計算量 <O(n), O(1)> の LCA(Lowest Common Ancestor) と RMQ(Range Minimum Query) を C++ で実装しました。アルゴリズムの解説はDさんのスライド [1] LCA and RMQ ~簡潔もあるよ！~ がとても分かりやすいのでそちらを参照してください。概要だけ説明します。 LCA の概要 LCA は頂点を dfs 順で訪れた順に並べると深さの列の RMQ に帰着されます。このことは [2] 蟻本などに載っています。この列は隣り合う数の差がちょうどになっています。この列を個ずつのブロックに分け、それぞれのブロック内の最小値を求めます。ブロックの数は個になるので、ブロックの区間の最小値を求めるクエリは sparse table を使うと前処理、クエリで処理できます。ブロックの中についてですが、各ブロック

テクノロジー
2018/09/10 22:43

ケイリーの公式の証明6種類 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

1 user

joisino.hatenablog.com

ケイリーの公式の証明たちの紹介です。ケイリーの公式とはケイリーの公式とは頂点のラベル付きの木の総数がであるという公式のことです。ここで、ラベル付きであるとは、それぞれの頂点を区別するということです。たとえばのとき、頂点を区別しない場合は長さのパスのみの通りですが、ラベル付きの木の場合は , , の通りです。証明 1 (プリューファーコード) [1] おそらく一番有名な証明です。頂点のラベル付きの木の集合からへの全単射を以下のように構成します。最もラベルが小さい葉を木から取り除き、その葉と繋がっていた頂点のラベルを数列の最初の値とします。続けて、最もラベルが小さい葉を木から取り除き、その葉と繋がっていた頂点のラベルを数列の番目の値とします。以下同様に頂点がつになるまで操作を続けます。こうしてできた数列が木の値となります。この数列をプリューファー

テクノロジー
2018/04/15 11:38

Programming

Convolutional LSTM - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

4 users

joisino.hatenablog.com

大学の実験で必要になって実装したのでメモしておきます。 Convolutional LSTM の説明名前で完全にネタバレしてる感が否めないですが、Convolutional LSTM とは、LSTM の結合を全結合から畳み込みに変更したものです。例えば画像を RNN に食わすときに、位置情報が失われないので便利です。動画の次フレームの予測や天気予報などに使えます。具体的には、以下のような構造になっています。 x は要素ごとの掛け算、 * は畳み込みを表します。通常の LSTM との差分を赤で書きました。といっても、一部の掛け算が畳み込みになっているだけですが。 peephole の部分だけ要素ごとの掛け算になっていることに注意してください。実装 Convolutinoal LSTM と、それをビルディングブロックとして使って画像予測のネットワークを実装しました。 github.

テクノロジー
2018/01/10 17:37

LSTM

ディープラーニングで櫟井唯ちゃんに喋ってもらう - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

37 users

joisino.hatenablog.com

この記事はゆゆ式 Advent Calendar 2017 - Adventar 24 日目の記事です。はじめに joisino.hatenablog.com 前回、唯の画像を無限に生成することに（部分的に）成功した訳ですが、画像ができたら今度は声が欲しくなってきます。そこで、 [1710.08969] Efficiently Trainable Text-to-Speech System Based on Deep Convolutional Networks with Guided Attention を chainer で実装して、唯の声で学習させてみました。レポジトリ github.com レポジトリです。結果正直そこまでクオリティの高い声は生成できませんでした。学習データが足りないのが一番の原因のようです。詳しい考察や解説は後回しにしてとりあえず結果を載せていきます

テクノロジー
2017/12/24 00:10

機械学習

櫟井唯ちゃんの画像を無限に生成する話りぴーと - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

39 users

joisino.hatenablog.com

joisino.hatenablog.com ▲昔の記事前回の試みから二年以上経ちましたがまだゆゆ式二期は発表されません。(*1) 二期が発表されないためこの記事のタイトルものんのんびよりさんから拝借することになりました。やはり今話題のディープラーニングでなんとかするしかなさそうです。三行で説明して Progressive Growing GAN (Tero Karras et. al. 2017) を chainer で実装して櫟井唯さん（ゆゆ式）の画像を生成しました。こんな感じのができました。（下の方にスクロールするともっとたくさんあります。） github.com レポジトリです。 Progressive Growing GAN とは浅いネットワークで小さい画像を生成・識別することからはじめ、段階的にネットワークと画像を大きくしていく手法です。太古に流行った AE の事前学

テクノロジー
2017/11/07 20:09

ArtClass(IOI2013)をディープラーニングで解く - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

4 users

joisino.hatenablog.com

はじめに IOI 2013 オーストラリア大会に Art Class という問題があります。この問題は、画像データが与えられるのでその画像が様式１（新造形主義の現代芸術）様式２（印象派の風景画）様式３（表現派のアクション・ペインティング) 様式４（カラーフィールド・ペインティング）のいずれであるかを判定する問題です。正答率が 0.9 以上になると満点が得られます。 IOI にしては珍しい機械学習的な問題であることと、ジャッジが壊れて結果が返ってこなくなったことなどで有名なので、知っている人も多いかもしれません。問題文やデータは、 http://www.ioinformatics.org/locations/ioi13/contest/ から手に入ります。普通の解法例えば 3x3 と 65x65 の大きさの窓を作って分散を計算して、それらを使って手で決定木を作るなどすると解

テクノロジー
2017/10/04 09:28

Programming

Dilated Convolution - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

10 users

joisino.hatenablog.com

Dilated Convolution を chainer で実装しました。 Dilated Convolution の説明 Dilated Convolution は、フィルターとの積を取る相手の間隔をあける畳み込みのことです。例えば、以下のような画像において、 12 を中心に 3 x 3 の普通の畳み込みフィルターを適用すると、 6, 7, 8, 11, 12, 13, 16, 17, 18 との積を取って和を取ると思います。 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 3 x 3 の dilate = 2 の Dilated Convolution フィルターを 12 を中心に適用すると、0, 2, 4, 10, 12, 14, 20, 22, 24 と 1 つおきに取ってきて、それらに 3 x

テクノロジー
2017/07/26 15:04

計算機科学実験及演習3ハードウェア（CPU製作）記 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

271 users

joisino.hatenablog.com

先日、長いようで短かった実験がついに終わったので記録を残しておきます。はじめに京都大学情報学科の計算機科学コースでは計算機科学実験及演習（以下、実験）という必修科目が 2 回生前期 / 後期、 3 回生前期 / 後期の計 4 つあります。実験 1 はプログラミングの入門みたいな内容実験 2 はマリオ AI の作成と電子回路実験 3 は CPU 製作とインタプリタ製作実験 4 はいくつかの分野から選択という感じです。僕たち 2015 年入学の学生から実験の内容が少し変わったのですが、実験 3 の CPU 製作は昔からあるみたいです。 CPU を製作する学生実験といえば某大学某学科の CPU 実験が有名で知っている人も多いと思います。 CPU 実験でググるとすごい人の製作記がたくさん出てきて面白いのですが、いまググるとこの記事が霞んで見えるので読み終わってから調べてください（参

テクノロジー
2017/06/04 20:13

ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

2 users

joisino.hatenablog.com

2024-04-25 『グラフニューラルネットワーク』を上梓しましたグラフニューラルネットワーク (機械学習プロフェッショナルシリーズ)作者:佐藤竜馬講談社Amazon 講談社より『グラフニューラルネットワーク（機械学習プロフェッショナルシリーズ）』を上梓しました。グラフニューラルネットワークはグラフデータのための… 2024-04-10 松井・熊谷『転移学習』の感想講談社サイエンティフィク様より『転移学習』をご恵贈いただきました。一通り読み終えたので感想を書きます。転移学習 (機械学習プロフェッショナルシリーズ)作者:松井孝太,熊谷亘講談社Amazon 全 414 ページとかなりの重厚感。しかも決して引き伸ばした… 2024-03-27 大学で読んだ情報科学関連の教科書先日、博士（情報学）になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を

テクノロジー
2015/10/08 03:11

櫟井唯ちゃんの画像を無限に生成する話 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

41 users

joisino.hatenablog.com

いくら待てどゆゆ式二期の発表がないのでそろそろ僕の櫟井唯ちゃん資源が枯渇してしまいそうですそこで今話題のニューラルネットワークに唯ちゃんの画像を無限に生成してもらうことにしましたとりあえずこちらがデモです（設定の読み込みにかなり時間がかかります） Mugen Yuichan ランダムに生成したサンプルです一応はっきりと唯ちゃんだと分かる使ったのはDenoising Autoencoder(DAE) ふつうのAutoencoderの入力にノイズを加えて学習させるだけです（今回はガウス分布のノイズを加えました）ノイズ除去に使えたり生成モデルを作れたりします DAEについては深層学習 (機械学習プロフェッショナルシリーズ)を参考にしました作り方まずはゆゆ式の本編から唯ちゃんの顔部分だけ切り抜きますこの作業はこのページを参考にさせていただきましたご注文はDeep Learning

テクノロジー
2015/09/17 21:23

はてなブックマーク

はてなブックマーク

『ｼﾞｮｲｼﾞｮｲｼﾞｮｲ』

『グラフニューラルネットワーク』を上梓しました - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

松井・熊谷『転移学習』の感想 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

大学で読んだ情報科学関連の教科書 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

拡散モデルと最適輸送 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

モデルパラメータの算術 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

『Human-in-the-Loop 機械学習』 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

2023 まとめ - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

君たちはどう研究するか - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

論文読みの日課について - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

2022 まとめ - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

論文の書き方 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

シュトラッセンのアルゴリズムとその導出の仕方 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

自分の研究を自腹で広告した体験談 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

実対称行列が直交行列で対角化できる直感的な証明 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

合同な凸図形でn要素ベン図を構成する方法 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

まんがタイムきらら系列誌の発売日をSlackに通知する - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

Batch Normalization - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

Parikhの定理 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

前処理O(n)クエリO(1)のLCAと静的RMQ - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

ケイリーの公式の証明6種類 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

Convolutional LSTM - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

ディープラーニングで櫟井唯ちゃんに喋ってもらう - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

櫟井唯ちゃんの画像を無限に生成する話りぴーと - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

神絵師がtwitterに上げた神絵を収集する - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

ArtClass(IOI2013)をディープラーニングで解く - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

Dilated Convolution - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

計算機科学実験及演習3ハードウェア（CPU製作）記 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

櫟井唯ちゃんの画像を無限に生成する話 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『ｼﾞｮｲｼﾞｮｲｼﾞｮｲ』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません