Page Scrolling Vertical Scrolling Horizontal Scrolling Wrapped Scrolling
ストップワードの除去は自然言語処理やテキストマイニングにおける重要な作業です. 解析の精度を上げるために不要な記号や単語を等をデータセットから除去します. ストップワードの選定にはタスクに特化した分析が必要ですが,ある程度整理されているデータがあるととても助かります. そこで,今回は私が自然言語処理のタスクでよく行う,日本語のストップワードについてまとめました. また単語の分布などから,品詞ごとのストップワードに対する考察も行いました. このことからストップワードを介して自然言語処理のあまり語らることのない知識などをご共有できればと思います. (この記事の考察部分は主に自然言語処理の初心者を対象とした入門記事です.) 目次 1. 自然言語処理・ストップワードとは 2. 分析の対象 3. 単語の分布に対する考察 ┣ 出現頻度 上位300件 ┗ 出現頻度と単語 4. 品詞ごとに考察 ┣ 名詞
LPIC取り扱い停止に関するお知らせ LPI-Japanでは長期にわたりLinux技術者認定試験として「LPIC」の普及活動を行ってまいりましたが、下記の理由からその取り扱いを基本的には停止することといたしました。 今後のLinux技術者認定試験においては、2018年3月から提供をしておりますLinuC(リナック)をご利用いただけますよう、よろしくお願いいたします。 取り扱い停止の理由 1. LPICの試験問題は、インターネットで検索し第三者のサイトから購入ができてしまう状況になってしまいました。このような状況はLinux技術者認定資格としてのLPICの公正性・信頼性が毀損されている状態であると言え、この状況を解決するためにLPI-JapanはLPICの開発元であるLPI Inc.(本拠地:カナダ)に対して早急な試験問題の差し替えを含む改善依頼をしてまいりました。 しかしながらLPI-Ja
最近、コンピュータサイエンスにおける様々な厳しい問題を解決するツールとして、ニューラルネットワークが選択肢の1つになってきています。Facebookでは写真に含まれる顔を識別するために、Googleでは写真に写る 全て を識別するために、それぞれニューラルネットワークが使われています。さらに、AppleではユーザがSiriに話しかけた内容を理解するために、IBMでは運用ビジネスのユニットの相乗効果を生み出すために、同じくニューラルネットワークが使われています。 どれもとても素晴らしいことです。しかし、現実の問題はどうでしょうか? ニューラルネットワークは、あなたが????という絵文字を本当に必要としているときに、それを見つけてくれますか? もちろん、答えはイエスです。Yes, they can.???? 本記事では、実世界における私たちの絵文字の使い方を自動的に何億通りでも学ぶことができる
.app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads
先日、 Tornado の使い方を解説しました。本日はその続きで、デプロイについて書きます。 Tornado で構築したアプリケーションを本格的にデプロイするためには、プログラムをデーモン(バックグラウンドプロセス)化する必要があります。 Tornado 自体にはその機能がないのでググってみると、どうやら Supervisor というプログラムを利用するのが一般的なようです。 この Supervisor がまた便利で、複数の通常アプリケーションをバックグラウンドで起動でき、その開始・終了を個別に管理できます。汎用的に作られているので Python 以外で構築されたアプリケーションも管理できますし、異常終了時の再起動やログのローテートの面倒もみてくれます。覚えておけばなにかと役に立ちそうですから、 Tornado アプリケーションのデプロイを題材にして使い方をまとめることにしました。 Sup
なぜ衝動買いしてしまうのか? 蓄積されるあなたの思考(嗜好) この1冊で推薦システムの体系を網羅 本書は、推薦システムに関する基本的な技術から最先端のトピックまでを体系的にまとめられており、情報推薦分野の概観を把握するのに最適の入門書である。推薦システムは、情報検索や情報フィルタリング、文書分類など、さまざまな研究領域における基礎となり、機械学習やデータマイニング、知識ベースシステムなど、異なる分野の手法が用いられている。本書では、これらの分野の概説が丁寧に説明されている。学生から社会人までにお勧めする。日常から経験している情報推薦技術とは何か、いかにして推薦内容を決めているのかについて体系的に学べる入門書! 第1章 はじめに 1.1 第1部:基本概念への手引き 1.2 第2部:最新動向 第2章 協調型推薦 2.1 ユーザベースの最近傍推薦 2.2 アイテムベースの最近傍推薦 2.3 評価
タイトルで何の本だかわかる人はある程度以上の年齢の人だろう。オルグとはorganizerの略で、 大衆や労働者の中に入って、政党や組合の組織を作ったり、その強化や拡大をはかったりすること(人)。[狭義では、共産主義のそれを指す]」(新明解国語辞典第三版) 私が大学生の頃には細々とながらキャンパスでこういう人たちが活動していたものだ。ほとんど誰にも相手にされてなかったけど。 つまり本書は、共産主義系勧誘・洗脳マニュアルなのである。著者は大正8年生まれの東洋大学社会学科の教授。帯の惹句はこうだ。 大衆を組織化し、より強力なパワーを発揮させることがオルグの目的である。勘や経験のみに頼る試行錯誤から脱し、普遍妥当な学としてのオルグ技術の開発を目指す画期の書 洗脳本は多々あれど、これほど、その正当性を確信した立場から書かれた本も珍しい。しかも、勁草書房といえば、思想書などを出してる出版社ではないか。
こんにちは、堀(@jojihori)です。 最近、ここやここなどで、自分がシャノンに来てやったことについて振り返る機会があったので、ちょっと文章として書いてみようと思います。主にこれからB2Bの中でなんかやってみようとかそういうベンチャーに行ってみようとか思う人向けです。 ちょっぴり長いです。まったくもって技術ブログじゃないですね... ■Oracleからシャノンに 僕がシャノンに来たのは2005年末なのですが、前職ではOracleでアプリケーションサーバのエンジニアをしており、後半3,4年ぐらいはアプリケーションサーバ(アプリケーション開発支援ツールや、J2EEコンテナを担当してました)のメンテナンス部隊で日本を含めたアジアやヨーロッパ向けの障害解析やパッチのコードを書いたりしていました。 その時に、「こんなにWebサービスが流行っているのに、パッケージソフトなどは絶対なくなる。しかも、
※本ページはアフィリエイトプログラムによる収益を得ています 「APPTAG LASER BLASTER」という海外のオモチャがゲーマーたちの注目を集めている。まだコンセプト段階の商品だが、クラウドファンドサイト「Kickstarter.com」で資金を募ったところ、目標の3万ドル大きく上回り、現在までに5万5000ドルを集めることに成功。すでに製品化されることは決定しており、公式サイトではまもなくプレオーダーを開始する予定としている。 AppTag Laser Blaster from Jon Atherton on Vimeo. どんな製品かは、公式サイトの動画を見てもらうのが手っ取り早い。要するに銃のオモチャなのだが、単体では遊べず、専用のアプリを立ち上げたスマートフォンを本体にセットすることではじめて遊べるようになる。 面白いのはここからだ。スマートフォンの画面には、正面カメラの映像
「Webエンジニアのためのデータベース技術実践入門」を献本いただきました。著者の松信さんはMySQLの専門家で、これまでも数々の良書を執筆されています。ここ1,2年でデータベースの設計や運用の考え方は大きく進化したのですが、そのあたりが分かり易く解説されており、期待を裏切らない良本でした。 Webエンジニアのための データベース技術[実践]入門 (Software Design plus) 作者: 松信嘉範出版社/メーカー: 技術評論社発売日: 2012/03/09メディア: 単行本(ソフトカバー)購入: 20人 クリック: 480回この商品を含むブログを見る 目次は松信さんのブログエントリにありますが、データベース技術の背景にある考え方から、具体的な概念、MySQLでの実践的な運用、データベースに適したハードウェアの特性まで記述されており、Webアプリケーションエンジニアはこの一冊を読ん
pytest で初めてテストを書いてみました。 今度こそ帰るー、py.test を使って初めてテストを書いた、評判通りすごく良い 2012-02-07 19:48:52 via TweetDeck @t2y noseと比べた感想とか聴きたいです。 2012-02-07 19:55:04 via web to @t2y @methane @t2y テストがこけたときまともなレポートをはくのがpy.testのいいところ 2012-02-07 19:56:34 via twicca to @methane nose と比べて、データ駆動テスト *1 *2 の違いが大きかったのでまとめてみます。 準備 以下の素数判定を行うテスト対象関数があるとします。 PRIME = {2: True, 3: True, 4: False, 5: True, 6: False, 7: True} def is_p
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く