機械学習初心者です。機械学習やディープラーニングでは、「確率的勾配降下法」というアルゴリズムがよく出てきますが、そのメリットがいまいちピンとこなかったので考えてみました。素人のポエムなのでトンチンカンなこと書いていると思います(そこそこ長いよ!)。 二次関数の最小値 全てはここから始まります。今回の確率的勾配降下法も、それのもととなった最急降下法も全てこれの応用です。 例:$ y=x^2-4x$ の最小値とそのときの$x$を求めなさい 参考:二次関数の最大値,最小値の2通りの求め方 数学的解法(1)~平方完成~ 高校数学でおなじみ(?)の平方完成をします。 $$y = (x^2-4x+4)-4 = (x-2)^2-4 $$ したがって、x=2のときに最小値-4です。簡単ですね。 しかし、次数や次元が増えていくと簡単に平方完成できなくなります。もう少し一般的に使える方法を考えます。 数学的解
![確率的勾配降下法のメリットについて考えてみた](https://cdn-ak-scissors.b.st-hatena.com/image/square/2ec822de6b01806080dd59f01bf9ab50d164225f/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUU3JUEyJUJBJUU3JThFJTg3JUU3JTlBJTg0JUU1JThCJUJFJUU5JTg1JThEJUU5JTk5JThEJUU0JUI4JThCJUU2JUIzJTk1JUUzJTgxJUFFJUUzJTgzJUExJUUzJTgzJUFBJUUzJTgzJTgzJUUzJTgzJTg4JUUzJTgxJUFCJUUzJTgxJUE0JUUzJTgxJTg0JUUzJTgxJUE2JUU4JTgwJTgzJUUzJTgxJTg4JUUzJTgxJUE2JUUzJTgxJUJGJUUzJTgxJTlGJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1kYWJmN2VlNjNiZjkwMTFmNzAwMTM5YmY2MzVmZDBlMQ%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwa29zaGlhbjImdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTE0NzVlN2RlNzIyNDdlNDY0ZjFkZTRkMWJjYWVkY2E5%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D5e7a6b5ad6fabda302503b8801f6cf05)