Googleは10月20日(米国時間)、「Google Developers Japan: Budou: 日本語のための自動折り返し制御ツール」において、日本語テキストの折り返しを意味のある単語単位で折り返しするように変換する技術「Budou」を発表した。この技術により、Cloud Natural Language APIを利用して日本語テキストを解析し、意味のある単語単位で改行が実施されるようになると説明がある。 現在主に使われている日本語テキストは語の区切りに空白を挟む必要性が低く、すべてつなげて表記することが多い。これは日本語が漢字、ひながら、カタカナ、アルファベットといった複数の表記体系の組み合わせで記述されるため、語の区切りを空白で明示しなくても区切りを認識できる率が高いことに理由がある。 一方、英語のような表記体系を持った言語は空白を使って語の区切りを指定しないと区切りを認識す