html2textはHTMLをMarkdownフォーマットに変換するPythonスクリプトです。 html2textを使うと普段見ているWebサイトや既存のHTMLページをMarkdownフォーマットに変換できます。Markdownの練習にも良さそうです。 実行しました。引数にURLを渡すだけの簡単実行。確かにMarkdownのテキストが出力されています。 ちょっと余計な情報も出ていますが、きちんとテキスト化されています。 コマンドオプションです。画像やリンクを除いたりすることもできます。 html2textを使うとHTMLをシンプルなテキストにしてくれるのはもとより、Markdown記法であるために可逆的にHTMLにすることもできます(class指定などは飛んでいるのでデザインは戻りませんが)。HTMLで書いてしまったためにメンテナンス性が悪くなった文書を再利用したりするのにも使えそうで