タグ

corpusに関するodzのブックマーク (4)

  • 青空文庫検索「青検」

    ヤフー経由で「青空文庫」を検索します。検索例:ぢゃないか, 紳士淑女, 伊勢参り, 極楽浄土, 名探偵, 猜疑心, ルパン, 洋行, 攘夷, 与力, 脚気, 堕落, 涅槃, 阿片, 朕, 雁, 妾さうだらう, 著作権, 桜の木, わが国, 英国

    odz
    odz 2007/07/29
    本文情報とメタデータを公開してくれないかな
  • 聞いてきました:Googleの大規模日本語データ公開に関する特別セッション - のほほん徒然

    第四十七回 写真はGigazineのマネです(笑) 3月に滋賀で行われる言語処理学会全国大会で、グーグルが 特別セッションをやるそうです。大規模日語データについて。 たつをさんのブログで知ったGoogleの特別セッション. グーグル株式会社では、日語の言語処理研究推進のため大規模日語データの公開を検討しています。つきましては仕様を決定するにあたり、実際にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺いしたく存じます。今回、言語処理学会様の御好意により、下記のとおりデータ仕様に関する特別セッションを設けて頂ける事になりました。 はてなブックマークでも話題になっているGoogleの大規模日語データ公開に関する特別セッション@NLP2007に,家が近いこともあり参加してきましたので,その詳細を書きます. セッション概要と要旨 Googleは日語の言語処理研究のためにW

    聞いてきました:Googleの大規模日本語データ公開に関する特別セッション - のほほん徒然
  • Googleが大規模日本語データを公開するという話

    Googleが大規模日語データを公開するという話 2007-03-13-1 [NLP] 3月に滋賀で行われる言語処理学会全国大会で、グーグルが 特別セッションをやるそうです。大規模日語データについて。 Google: 大規模日語データ公開に関する特別セッション http://www.google.co.jp/events/anlp2007.html グーグル株式会社では、日語の言語処理研究推進のため大規模日語 データの公開を検討しています。つきましては仕様を決定するにあたり、実際 にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺い したく存じます。今回、言語処理学会様の御好意により、下記のとおり データ仕様に関する特別セッションを設けて頂ける事になりました。 日時: 2007年3月20日(火) 18:30 〜 19:00 会場: 龍谷大学 瀬田学舎 言語処理学会

    Googleが大規模日本語データを公開するという話
    odz
    odz 2007/03/14
    なんだってー
  • NAIST Text Corpus

    We annotated the same portion of Mainichi Shimbun Newspaper, which is used for Kyoto Text Corpus. It contains all articles (ca. 20,000 sentences) which start from 1 January 1995 and end with 17 January 1995, and all editorial articles (ca. 20,000 sentences) from January to December. We annotated predicate-argument relation (surface case: nominative, accusative, and dative cases), event noun and it

    odz
    odz 2006/10/25
    NAIST の照応・共参照コーパス。要毎日新聞95年版。
  • 1