タグ

研究に関するoverlastのブックマーク (8)

  • [O] UniDic に固有表現やUnicode 絵文字などを足す mecab-unidic-NEologd を公開しました

    UniDic に固有表現やUnicode 絵文字などを足す mecab-unidic-NEologd を公開しました Tweet [NLP] 今年3月中旬 [2015-03-13] に mecab-ipadic-NEologd をリリースして以来、mecab-ipadic-NEologd はとても順調に普及しています。 さて、今回は UniDic に新語や固有表現、Unicode 絵文字などを足すことができる mecab-unidic-NEologd を公開しました。 mecab-ipadic-NEologd を生成する手法を使っています。 https://github.com/neologd/mecab-unidic-neologd/blob/master/README.ja.md シードデータの性質上、構築されるシステム辞書には国語研短単位の条件を満たさないエントリも入りますので、あら

    overlast
    overlast 2015/05/29
    よろしければお試しください😄🎉IPA辞書ユーザの方はmecab-ipadic-NEologdで👌です
  • 食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog

    フランスの希代の美家であるブリア・サヴァランは「ふだん何をべているのか言ってごらんなさい、そしてあなたがどんな人だか言ってみせましょう」といったそうだ。これは、「ドン・キホーテ」の有名な一文「君の友人を教えなさい、そうすれば君がどういう人間か言ってみせよう」をもじったものであるが、示唆に富んだ文である。その人が何をべるか(もっと正確に言えば、何をべないか)によって、その人の育ちや信仰、文化的・民族的背景など様々なことを知ることが出来る。 同様に、口コミもそれを書いた人について多くを物語る。ここで試しに、以下に挙げたべログの口コミを読んで頂きたい。 バラのクリームにたっぷりのフランボワーズをマカロンとともに。ルバーブのアクセント。コレめっちゃカワイイ(*^_^*) 一目ぼれです☆ バラにフランボワーズにマカロンにピンクときたら、女子にはたまらない~! ちょっと高めの価格設定やけど、

    食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog
  • 日本のITが永久にアメリカに勝てない理由 | BLOG HOMME

    こんにちは,落合です.いまシアトルのMicrosoft Researchで研究しています. のぐたくとアメリカにいったら日常的な話もブログ更新するって約束したので,思い立ったので書いてみます.研究まとめ以外もよろしくね.思ったことをちょろちょろ書こうと思うのです. そして,いかにも挑発的なタイトルでごめんなさい. 僕は永久に勝てないとは思ってませんが,少なくとも今のままじゃアカデミックもビジネスサイドも太刀打ち出来ないんじゃないかなと思います. 僕は日文化が好きです.日文化が好きだから,研究とかコンピュータカルチャーに関わる面では日人にも頑張ってほしいと思っています. あと,専門外のところほとんどわかんないので,触れません.でも,僕ダメなところだけあげつらうのは嫌いなので,つたないながら,しっかり改善点も書こうと思います.よろしくお願いします. さて,今回の要点をまとめると,日

    日本のITが永久にアメリカに勝てない理由 | BLOG HOMME
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • 8万字に対応 富士通研が手書き漢字入力技術

    富士通研究所は4月24日、8万字超の漢字に対応した手書き入力技術を開発したと発表した。1~2万字程度だった従来技術に比べ対応字数が大幅に向上しており、多数の字に対応する必要がある自治体向け電子戸籍システムなどに搭載する予定。 画数や筆順に関係なく、部首など字の一部をマウスなどで手書き入力することで、読み方が不明な漢字でも検索して入力できるようになる。約8万2000字に対応した。 従来も同様の技術はあったが、実際の手書き文字を採取し、認識辞書に学習させる必要がある。8万字の中にはほとんど使われない漢字も多数含まれ、手書き文字を収集すること自体が困難だった。また筆順や画数が正しくない場合に検索精度が下がるのも課題だった。 新技術では、既存の文字フォントからOCR技術を利用して文字を分解し、部品と、部品の位置関係を抽出する。手書きデータは部品についてのみ収集し、最終的な字形データは部品データと位

    8万字に対応 富士通研が手書き漢字入力技術
  • リアルとWebのネットワーク分析:先端研ブログ - CNET Japan

    先端研レポート第一弾は、2月にヤフー社内で開催された安田雪先生のセミナーのレポートをお届けします。 人脈づくりの科学 : 関係構造の不思議 - リアルとWebのネットワーク分析  講演者:安田雪(やすだ ゆき) GBRC社会ネットワーク研究所所長 概要: 現実の人間関係と、Web上にみられる人間関係は、表裏一体である。現実社会では観察できない関係構造がWebから可視化できる一方、Web上の情報には反映されない関係が現実には存在する。リアルな社会での人や組織のつながりと、WEB上での単語や概念のつながりを対比しながら、その特徴を考えてみたい。論点は、人々は当にWebを通じてつながっているのか、そして、つながりの検索は可能かである。 GBRC社会ネットワーク研究所所長、東京大学ものづくり経営研究センター特任助教授の安田雪先生は、数理社会学が専門で、関係構造の分析、数量化、可視化などが

  • °æ¾å

    http://dev.ariel-networks.com/Members or http://dev.ariel-networks.com/Members/inoue ¤Ç¤¹¡£ ²áµî¤Îblog¤Ïºï½ü¤·¤Ê¤¤¤Î¤Ç¡¢¥ê¥ó¥¯¤Ï¼«Í³¤Ë¤·¤Æ¤¯¤À¤µ¤¤¡£ EoE (Ethernet over Ethernet) http://itpro.nikkeibp.co.jp/article/COLUMN/20051216/226378/ 狼¤«¤é¸ýƬ¤Çʹ¤¤¤Æ¤¤¤¿¤é¡¢¾éÃ̤À¤È»×¤Ã¤Æʹ¤­Î®¤·¤¿¤È»×¤¤¤Þ¤¹¡£ Ethernet¤Ë¤è¤ëËܳÊŪ¤Ê¥ë¡¼¥Æ¥£¥ó¥°¤¬¹Ô¤ï¤ì¤Æ¤â¡¢ÉԻ׵ĤǤϤʤ¤À¤¤ÎÃæ¤Ç¤¹¡£ TCP/IP¤òC¸À¸ì¤ËÎ㤨¤ë¤

  • 産総研センター長の9論文 ねつ造の可能性否定できず

  • 1