COM(Component Object Model)を使用してWordファイル内のテキストをテキストファイルへ抽出・変換するスクリプト。 ソースコード # coding: utf-8 import fnmatch, os, sys, win32com.client if __name__ == '__main__': wa = win32com.client.gencache.EnsureDispatch("Word.Application") try: for path, dirs, files in os.walk(sys.argv[1]): # コマンドラインより探索ディレクトリpathを取得 for filename in files: if not fnmatch.fnmatch(filename, "*.doc"): continue # wordファイルの拡張子かをパターン