はじめに MySQL8 には IN NATURAL LANGUAGE MODEというものがあり、これを使うと文字列の自然言語処理を実行することができます。 今回の記事では、簡単に類似文字列の抽出やその類似スコアの出し方などをまとめていきたいと思います。 筆者の環境 MySQL 8.0.30 テスト用のテーブルを作成する まずはテスト用のテーブルを作成します。 CREATE TABLE articles ( id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, title VARCHAR(200), body TEXT, FULLTEXT (title, body) ) ENGINE=InnoDB; テーブルが作成されたか確認 mysql> show tables; +---------------------+ | Tables_in_s