タグ

NLPに関するssezeのブックマーク (9)

  • 「入門自然言語処理」を読む準備をする

    うーむ。あんまり時間かけたくないので、この記事を参考にyumでpython26としてインストールした。 RPM置き場はこちら。記事の時点とはファイル名が変わってるので注意。 % wget http://dl.iuscommunity.org/pub/ius/stable/Redhat/5/i386/epel-release-1-1.ius.el5.noarch.rpm % wget http://dl.iuscommunity.org/pub/ius/stable/Redhat/5/i386/ius-release-1.0-6.ius.el5.noarch.rpm % sudo rpm -i epel-release-1-1.ius.el5.noarch.rpm % sudo rpm -i ius-release-1.0-6.ius.el5.noarch.rpm % sudo yum in

  • 言語処理100本ノック - 東北大学 乾研究室 / Inui Lab, Tohoku University

    FrontPage / 言語処理100ノック 3 秒後に NLP 100 Drill Exercises に移動します。 (移動しない場合は、上のリンクをクリックしてください。) © Inui Laboratory 2010-2018 All rights reserved. 研究室紹介/About Us 過去に在籍したメンバー Members 研究室環境 Lab Facilities ↑研究会/Research Meetings 概要 Overview 総合研究会 Research Seminar 意味研究会 SIG Semantics 談話研究会 SIG Discourse 知識獲得研究会 SIG Knowledge Acquisition Embedding研究会 SIG Embedding KIAI Knowledge-Intensive Artificial Intellige

  • 特集「言葉を理解するコンピュータ」(1)

    いまでは仕事や生活に欠かせなくなった日語ワープロ・ソフト。日語でキーワードを指定すると,その言葉を使っているWebサイトを見つけてくる検索サービス。また,パソコンを購入すると簡単な翻訳ソフトが付いてくることも多く,それを使うと英文サイトの内容をある程度意味の通じる日語に翻訳してくれる。コンピュータが日語を扱う場面は,いまではごくありふれた風景になった。 このように,人間が使う言葉をコンピュータに処理させようとする分野を,自然言語処理と呼ぶ。自然言語とは,コンピュータのプログラミング言語のような記述形式の定まったものと区別して,人間が普通に用いる言語を指すときに使う表現である。およそ言葉で表せるデータの存在するところ,すべてその応用範囲である。 自然言語処理研究の歴史は長く,コンピュータの登場とともに始まったと言ってもいいだろう(表1[拡大表示])。この種の知的なシステムは期待と失望

    特集「言葉を理解するコンピュータ」(1)
    sseze
    sseze 2011/10/17
    自然言語処理の講義で画像が取り上げられていた
  • 第7回自然言語処理勉強会で発表してきました - 蝉々亭

    第7回自然言語処理勉強会で文書要約に関するお話をさせていただきました。その際に用いましたスライドを公開します。今回は入門編(初級編)なので、そのうち中級編をやるかもしれません。 Introduction to Automatic Summarization View more presentations from Hitoshi NISHIKAWA 毎回、スライドのレイアウトがおかしくなっていましたが、今回はpdfに変換してアップロードしました。こうすれば良かったのですね。今回はレイアウトが乱れていないはずです。過去のスライドもpdf化してアップロードしなおすつもりです。 次はグーグルによるザガットサーベイ買収の話か、NLP若手の会第6回シンポジウムの話を書きます。

    第7回自然言語処理勉強会で発表してきました - 蝉々亭
  • [python][cgi][テキストマイニング] ブラウザからtf-idfで特徴語抽出ができるプログラムを書きました - gepuroの日記

    http://future.ddo.jp/cgi-bin/tm.cgiに置いてあります。シンプルな構成になっています。 操作方法は、 分析したいテキストデータをアップロードする。 特徴語抽出をクリックする。 です。 現在は、tf-idfによる分析しか出来ませんが、随時増やしていく予定です。テキストデータの容量は、サーバの性能を考慮して1MB以下のデータのみです。 精度は、現在調整中の為に優れていませんが、ニュースの記事は、うまく分析できているようです。

    [python][cgi][テキストマイニング] ブラウザからtf-idfで特徴語抽出ができるプログラムを書きました - gepuroの日記
  • シリコンの谷のゾンビ

    前回の5年間を振り返るから5年が経っていたことに気づき、あわてて5年間を振り返ってみることにする。 2019年 ほとんど記憶に残っていないので、写真やら色々ひっぱり出して記憶を呼び起こす。プレCOVID最後の年。 学会に2つほど参加。まず、NAACL2019 in Minneapolis。昨年のインターン生との共著ポスターを発表。東北大に移ったSさんと元同僚のNTT Nさんとディナーをべて5年間かかった論文の採択お祝い。財布を店に忘れて店員さんが持ってきてくれて思わずハグしてサンキュー。翌日ふたりと一緒に散歩しながら見たミシシッピ川がかなりの濁流でちょっとびっくりした。別の日に前年のインターン生たちと同僚とジャズレストランに行き、ジャズの生演奏を聴きながらカリフォルニアではべられないフォアグラをべる。翌年亡くなる同僚と最後の学会参加になってしまった。 続いてACL2019@Flore

    シリコンの谷のゾンビ
  • yokkunsの日記

    前回の書籍「ビジネス活用事例で学ぶデータサイエンス入門」の姉妹つくりました。 今回のはライト層向けの啓蒙的書籍です。 コードは一切ないです。 統計処理の解説をつけました。 用語解説を充実させました。 データサイエンスってなにしているの?的なことを軽く読みたい方ぜひ! 以下、「はじめに」を抜粋します。 はじめに 人間の感覚はとても優れています。ときにはデータでわかること以上のことに実感を伴って理解していたりします。しかしながら一方で、ある部分ではいいかげんなため、ある一面においてデータ分析がビジネスで効果をあげているのではないかと。 そのある一面とは他人の気持ちを想像するという一面になると考えます。経験することで生まれた感覚がデータを超えた、とても優れている機能であることは間違えないのですが、どこまでいっても自分の感覚という域をでません。ビジネスでは他人の気持ち、みんなの気持ちを上手に理解

    yokkunsの日記
  • 第1回データ構造と情報検索と言語処理勉強会で発表してきました - 蝉々亭

    夏休みの宿題はいつも、泣きながら8月末に取り組むタイプでした。今となっては懐かしいその気持ちをちょっと思い出しました。7月23日に、第1回データ構造と情報検索と言語処理勉強会にて「自然言語処理における argmax 操作」なるタイトルで発表させていただきました。その際に用いましたスライドを(漸く)公開いたします。 Argmax Operations in NLP View more presentations from Hitoshi NISHIKAWA 線形計画問題を解くシンプレックス法のアルゴリズムについて加筆しています。ちょっと時間がかかり過ぎてしまいましたね。 A* 探索についても加筆しようと思いましたが、すぐに第7回自然言語処理勉強会がやって参りますので、流石に多重スライド務者は避けたいので公開します。

    第1回データ構造と情報検索と言語処理勉強会で発表してきました - 蝉々亭
  • あらびき日記

    2010年3月からお世話になっているはてなダイアリー・ブログですが、この度移行することにしました。今まで当にありがとうございました。 移行先は https://abicky.net/ です。 その際、既存のページをどうするか悩んだのですが、 「あらびき日記」という名前で同じ著者のブログが複数存在するのは混乱を招く 同じコンテツを残しておくと重複判定でペナルティを受ける はてなダイアリー・ブログの方を削除するとリンクやブックマークしてくださった方々に迷惑がかかる(リンクやブックマークからアクセスできない) という思考を経て、全てのページの内容を新しいページへのリンクに変更しました。これはこれで気が引けましたが…。 何はともあれ、今後ともよろしくお願いします。 この記事は abicky.net の Redshift の UDF では非 ASCII 文字を含む unicode 型を返すとエラー

    あらびき日記
  • 1