NLPに関するsagarのブックマーク (8)

  • 「シンポジウム『生成文法の可能性』レポ」への言語脳科学からの応答 - スウィングしなけりゃ脳がない!

    2008 年 11 月 9 日に専修大学で行なわれたシンポジウム「生成文法の可能性」に参加し、いつもブログ上でお世話になっている id:dlit さんともお会いすることが出来ました。お会いした感想としては同じく、若け〜というのと、やっぱり言語学の方はきれるな〜という。シンポジウム後はお互い多忙で、ゆっくりお話も出来ませんでしたが、またお会いする機会はあると思いますので、今後ともよろしくお願いいたします。 レポートは dlit さんがこちら (シンポジウム「生成文法の可能性」レポ - 誰がログ) で丁寧にやってくださっているので、僕は、そこで挙げられている質問にお答えしたいと思います。ちなみにここでの回答はあくまで僕個人の見解でありまして、所属する研究室や共同研究者の意見とは関係があるかもしれませんし、ないかもしれません(笑)。 さて、dlit さんのご質問として ある刺激に対して言語能力に

    「シンポジウム『生成文法の可能性』レポ」への言語脳科学からの応答 - スウィングしなけりゃ脳がない!
    sagar
    sagar 2008/11/11
  • SoSaiSo

    sagar
    sagar 2008/07/25
  • http://www.smalltown.ne.jp/~usata/diary/?date=20080219

    sagar
    sagar 2008/02/20
  • http://www.smalltown.ne.jp/~usata/diary/?date=20080218

    sagar
    sagar 2008/02/20
  • MeCab の開発経緯

    形態素解析歴史 オープンな形態素解析器として Juman, ChaSen が存在する. それぞれの 基的な開発理念は以下である Juman Juman 以前の商用的に配布されていた形態素解析器は, 辞書や品詞体系 連接規則はほぼ固定されており, ユーザ自身自由に定義できなかった. Juman は これらの定義すべて外部に出し自由な定義が可能になった. 辞書は比較的入手しやすいが, 連接コストや単語生起コストの定義は 人手によって行わざるをえなかった. 解析ミスを発見するたびに副作用が無い範 囲で連接コストを修正する必要があり, 開発コストが大きい. また, Juman は日語の形態素解析として開発されていたので, 未知語処理が日語に特化されており, 未知語処理の定義を 自分で与えることはできない. また, 品詞は2階層までに固定されており, 品詞体系には一種の制限がある. Ch

    sagar
    sagar 2008/02/18
  • MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析エンジン)

    MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった 一部のコンパイラで正しくコンパイルできなかった問題の修正 部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-

    sagar
    sagar 2008/01/08
  • DO++

    2012年の個人的な総括を以下にまとめます。 子供が生まれました 無事子供が7月に生まれました。毎日子育てに翻弄していますが想像していたよりも大変で楽しい時間を過ごしています。 また、が実家に里帰り出産したため夏の間は、毎週末の実家に帰り車を運転して病院・お店に行くという、まるでの実家で生活して月〜金は東京で働いているような感覚で過ごしていました。 高速文字列を出しました 高速文字列の世界を12/27に出しました。 2012年の目標としてをだすということを考えていました。2010年夏頃からの話はいただいていましたが、結婚、会社(途中から経営陣に入ってさらに時間確保が困難に)、子育てと時間確保がどんどん困難になっていきずるずると伸びてしまっていました。 しかし、文字列解析の話は小さいころから扱っていた話(もう10歳ぐらいからの付き合い)で一度まとめてみたかったというのもありますし

    DO++
    sagar
    sagar 2008/01/08
  • きまぐれ日記

    2010年04月21日 MeCabがiPhone,OSXに載っていると言うのは止めようと思う iPhoneのSDKの条項に変更が加わり、Flashのクロスコンパイルを含む 純正開発ツール以外で作成されたバイナリの配布が禁止となるようです。 世間でも散々言われていますが、この変更は正直とても残念です。 Apple的には「製品のクオリティーが保てないから」という理由だそうですが、 WindowsiTunesが意味もなくQuickTime入れたり、Windows非標準のUIを 使いまくっていて、お世辞にもクオリティーが高いとは言えないのを棚にあげて、 クオリティー云々と言い訳できるのでしょうか。アプリなんて所詮 玉石混淆。決めるのはユーザです。 MeCabは以前GPL/LGPLでした。Appleを含む複数の方からこのライセンスでは 使いにくいと言う指摘をうけ、前職の同僚と協議をしながらBSD/

    sagar
    sagar 2008/01/08
  • 1