タグ

自然言語処理と*まとめに関するDrunkarのブックマーク (2)

  • テキスト自動要約メモ - Negative/Positive Thinking

    はじめに 前から気になっててほっといてた自動要約についてメモ。 文短縮とか試してみたい。 テキスト要約 与えられたテキストをより短いテキストに簡潔にまとめること 要約率 = (要約後の文字数or文数) / (与えらえたテキストの文字数or文数) 要約の過程 以下の3つがある(とされている) 1.テキストの解析と理解 2.要約の内部表現への変換/変形 3.内部表現から要約テキストの生成 ただし、これらをすべてきちんとやるのは難しい 人間の場合は、以下のような行為が行われているとか 不要句の削除 文の結合 構文的変形 句の言い換え 句の置き換え 文の並び替え 考慮すべき点 長さ ジャンル/分野 単一文/複数文 なんのための要約か?利用方法 出力形式 重要文抽出 テキストから重要な文を抜き出す要約手法 なんらかの情報をもとに重要度を計算 要約率などの条件を満たすまで文を選択する 機械学習や確率値

    テキスト自動要約メモ - Negative/Positive Thinking
  • 自然言語処理にはやっぱりPythonがいちばん - nokunoの日記

    Quoraで「自然言語処理に適したプログラミング言語はどれか?」という質問をしたところ,やっぱりPythonが一番人気のようです.What programming language is suitable for natural language processing? - Quora理由として以下が挙げられていますNLTKがあるから正規表現ライブラリ(re)が強力だからnumpyとscipyがあるから スクレイピングにBeautifulSoupやScrape.pyが使えるから Django / Pylons / TornadoのようなWebフレームワークがあるから また,機械学習のライブラリを言語別にまとめた質問もありました.こちらもJava, Python, Rが多いですね.Which programming language has the best repository of ma

  • 1