今年もご愛顧いただき、ありがとうございました。 新年も皆様のご来店をスタッフ一同心よりお待ちしております。 ※全店舗 1月3日(水)より通常営業となります ※営業時間 10:30〜20:00 (閉店は20:30となります)
今年もご愛顧いただき、ありがとうございました。 新年も皆様のご来店をスタッフ一同心よりお待ちしております。 ※全店舗 1月3日(水)より通常営業となります ※営業時間 10:30〜20:00 (閉店は20:30となります)
言語処理学会第20回年次大会(2014/3)のチュートリアル講義資料です。 - 要旨 - 文法圧縮とは,入力テキストをよりコンパクトな文脈自由文法(CFG)に変換する圧縮法の総称である. 文法圧縮の強みは圧縮テキストを展開すること無く,検索等のテキスト処理を効率よく行える点にある. 驚くべきことにその処理速度は,元テキスト上での同じ処理を理論的に,時には実際にも凌駕する. また近年,ウェブアーカイブやログ,ゲノム配列等の大規模実データを高効率に圧縮できることで注目を集めている. しかしながら,文法圧縮についての初学者向けの解説資料はまだまだ少ない. そこで本チュートリアルでは,文法圧縮の歴史的背景から最新動向までを幅広く紹介する. 具体的には文法変換アルゴリズム,圧縮テキスト上での文字列パターン検索,文法圧縮に基づく省メモリデータ構造等の解説を行う.Read less
動機 前々からtwitterのデータを使って何かやってみたいな、と思っていました。そこで、MeCabとcabochaを入れるところから、SQLiteを活用した簡単な分類器を作るってみた次第です。 (遊びでやってみただ(ry ) 以下、やったことを適当にまとめていきます。 インストールしたもの MeCab 0.996 mecab-python-0.996 Virtual C++ 2008 Express Edition(vcvarsall.batが必要なためです) Cabocha(今回は使いませんので説明も全くしませんが、今後のために...) インストール方法などに関してはWindowsにmecab-pythonを導入を参考にして下さい。 このサイトでも太字で書いてあるのですが、mecab.hを書き換える時は必ず管理者権限で開いて変更を行って下さい。でないと、変更されたと認識されません。僕も
min2fly @min2fly “【2014.2.19京都】公開シンポジウム+チュートリアル:翻デジ2014:クラウドソーシングによる近デジ資料のデジタル翻刻 | リブヨ・ブログ” http://t.co/3WBERjmul1 #science #university #エレクトリック #図書館 #本 2014-02-12 17:32:09 もずやま @mozyama ほお。「翻デジ2014:クラウドソーシングによる近デジ資料のデジタル翻刻」 http://t.co/rf3pm6nfcK ちょっと話が違うけど、みんなのPCの中にある翻刻文を、たとえ未完成なままでも、どっかに集めておけるといい。翻刻無謬主義には経緯をはらいつつ。 2014-02-18 14:15:46
英単語の語彙をどうやって増やしたらいいだろうか。やみくもに単語集みたいなものを順に覚えていくのも道程が長そうだ。また、一般論ではなく自分がよく書く分野に特化して語彙を増やしたい。ということで、テキストマイニングを使ってやる方法を考えてみた。方針は以下の通りである: 自分が今までに書いたすべての(英語)の文書を解析して、品詞ごとに出現回数でソートする。 つぎに、自分の所属するコミュニティの文書(たとえば自分がよく参加する学会に掲載される論文など)をなるべく大量にあつめて、同じように品詞ごとに出現回数でソートしておく。 両者を比較して、そのコミュニティでは使用頻度が高いにも関わらず、まだ使ったことのない単語を抽出して自分専用の「単語集」をつくる。 こうやって抽出された単語集を勉強すれば、一般的な単語集を使うよりも効率がいいのではないだろうかという目論みだ。対象となる分野を選んでいるのは、たとえ
400年の時を超えて、ある数学の命題が証明された。こう書くと、すぐさま「フェルマー予想(最終定理)」を思い出す人もいるだろう。しかし本書に取り上げられているのはフェルマー予想ではない。フェルマー予想よりもさらに長い歴史をもち、1900年にパリで開催された国際数学者会議では、大数学者ヒルベルトが重要な未解決問題のひとつとして提起した「ケプラー予想」である。 ケプラー予想は「大きさの等しい球をもっとも効率よく三次元空間に詰め込む方法は、果物屋の店先にオレンジが積まれるときの方法と同じである」と述べている。小さな子どもでさえ、直観的に「正しいのでは?」と思いそうな命題だ。ところが、一見当たり前のようなこの命題の正しさを明らかにすることが、とてつもなく難しかったのだ。 球を規則的に並べるという条件つきでなら、この予想が成り立つことは数学の王者ガウスがエレガントに証明してみせた。しかしそのときすでに
背景 Tumblr, Twitter, iPhone, MacBookなどいろんなWebサービスや機器を使って生活している。 問題 自分の普段の作業をEvernoteに集約して振り返りたい。 すべてのツイートをEvernoteに入れるのは多すぎる。 個別の記録がたくさんのノートにばらつくのは避けたい。 そのほか個々のWebサービスごとに細かい調整をしたい。 解法 IFTTTを使う。 詳細(結城の場合) iPhoneでTumblr(作業予定) Tumblrには作業予定を書き込んでいる。 IFTTTで「新しいpostをEvernoteの指定ノートブック(DIARY)中の新規ノートに書く」というレシピを使う。 MacBookでTwitter(作業記録) Twitterでは作業記録とふだんのツイートが混在している。 TwitterでEvernoteに集約させたい情報(作業記録)は、#hyuki_d
SEOの文脈における良質なコンテンツとは、検索ユーザーの疑問や困りごとを解消したり、検索ユーザーがしたいことをできるようにする役に立つコンテンツです。検索ユーザーの役に立つために、そのコンテンツが扱っているトピックの専門家が十分な労力を費やして作る必要があります。 良質なコンテンツの大前提結論から先に述べると、良質なコンテンツとは、検索ユーザーの疑問や困りごとを解消したり、検索ユーザーがしたいことをできるようにする役に立つコンテンツであり、そのコンテンツが扱っているトピックの専門家が十分な労力を費やして作ったコンテンツを意味します。 Google 検索品質評価ガイドライン1では、そのコンテンツが作られた目的を理解することで、そのページを評価するための基準を理解できるとしています。また、コンテンツが作られた目的は「人々の役に立つため」であるべきで、そうでないものは最低品質と評価してよいかもし
土木工学の歴史とそのユニーク性 岩手大学工学部建設環境工学科 宮本 裕 1) Yutaka MIYAMOTO 岩崎正二 2) Syouji IWASAKI 出戸秀明 3) Hideaki DETO まえがき 土木学会では以前に、土木改名論が真剣に扱われたことがある。 ここでは土木工学を考えるために、言葉の観点から、フランス語、英語、ドイツ語、 ロシア語、中国語、日本語における土木工学の意味を、歴史的にふりかえってみたい。 また土木工学のユニーク性についてもふれてみる。 言葉からみた土木工学の歴史 土木技術は昔から<技術の中の技術>と呼ばれてきた。人類の生活の始めから、原 始的な通路や橋の建設、飲水を得る泉の整備が必要であった。農業の開始とともに大 規模な潅漑、排水の作業が必要となり、これから巨大な労働集団、それを支配する権 力者としての王、さらにその政治組織としての古代国家の発生したことな
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く