あるデータともう1つのデータがどれだけ似通っているかを計算する方法はたくさんある。 http://wikiwiki.jp/cattail/?%CE%E0%BB%F7%C5%D9%A4%C8%B5%F7%CE%A5 その中でもユークリッド距離、ピアソンの積率相関係数、Jaccard係数をpythonで実装する。 集合知プログラミング第2章参考。 https://www.oreilly.co.jp/books/9784873113647/ ユークリッド距離 中学や高校の数学でならうような一般的な距離。2次元か3次元なら図で表せるしイメージもできるが、それ以上の次元はイメージできない。けどやっていることは基本的に3次以下と同じ。
![pythonでデータ間の類似度を計算する方法いろいろ - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/bbca272dfeb6a0e522b46c0c88d26731574cce3e/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9cHl0aG9uJUUzJTgxJUE3JUUzJTgzJTg3JUUzJTgzJUJDJUUzJTgyJUJGJUU5JTk2JTkzJUUzJTgxJUFFJUU5JUExJTlFJUU0JUJDJUJDJUU1JUJBJUE2JUUzJTgyJTkyJUU4JUE4JTg4JUU3JUFFJTk3JUUzJTgxJTk5JUUzJTgyJThCJUU2JTk2JUI5JUU2JUIzJTk1JUUzJTgxJTg0JUUzJTgyJThEJUUzJTgxJTg0JUUzJTgyJThEJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1jMTJlYWNhMWM4MmU2YTM0Yjg5NzQ2YWQ0ZGY4ZmMxZg%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwc2hpbTBtdXJhJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz01MmE2N2E5OTQzODQ4NzMxOGI2YTU4Yzg3ZmZkZTFkOQ%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Dc37eb2f79e44713da75bdc96c7550ee0)