タグ

ブックマーク / huixing.hatenadiary.org (6)

  • https://huixing.hatenadiary.org/feed

    tsupo
    tsupo 2009/07/11
    pubsubhububはオープンなプロトコルで,これまで使用してきたRSSやATOMにもそのまま適用できる → バブバブバブー?
  • twitterがrubyからscalaへスイッチ - huixingの日記

    twitterが2007年後半に先進的なユーザーに急速に受け入れられて以後、そのruby on railsアーキテクチャーはたびたびトラブルに見舞われてきた。しかし2008年中盤にtwitterがこっそり一部コードをscalaにポートして以来トラブルはなくなった。Twitterの開発者であるAlex Payneによれば普通に考えられているRuby on RailsPHPPythonなどいわゆるアジャイルな言語はすばやい変化に対応するには見合っているが非同期的プロセスのような力仕事には、スイス連邦工科大学ローザンヌ校のマーティン・オダースキーMartin Oderskyにより開発されたscalaが合っているという。2007年のある時点でtwitterにおけるrubyベースのメッセージ・キュー・システムが増えるプロセスに対応できずに壁にぶちあたったことに気付いた。2008年中盤にはメッセー

    twitterがrubyからscalaへスイッチ - huixingの日記
  • 騰訊のtwitterクローン騰訊滔滔 - huixingの日記

    qqの騰訊がtwitterクローンである騰訊滔滔をリリースした。しかしqqをサポートするのみでMSNやGtalk上で読むことは出来ない。以前にも中国には飯否など多数のクローンが存在しているが、膨大なqqユーザーを抱える騰訊の騰訊滔滔の登場でこれらクローンの将来が危うくなった。 http://www.taotao.com/

    騰訊のtwitterクローン騰訊滔滔 - huixingの日記
    tsupo
    tsupo 2007/08/15
    qqの騰訊がtwitterクローンである騰訊滔滔をリリースした。しかしqqをサポートするのみでMSNやGtalk上で読むことは出来ない。 → qq というのはチャットツール?
  • googleの中国語分詞処理 - huixingの日記

    機械翻訳か音声識別などの応用別によって中国語の分詞処理は異なるように、google中国語分詞処理は葛顕平や朱安による独自の分詞処理系統を使っている。中国語分詞処理の意外な応用方法としては、英語の手書き書体識別がある。英語の単語間のスペースが判別しにくいので中国語分詞処理の助けを借りることになる。またgoogleでは言語処理のアルゴリズムを設計する際には100以上になる他の自然言語にも適用できないかを考えながら設計している。 用 “查字典” 法,其实就是我们把一个句子从左向右扫描一遍,遇到字典里有的词就标识出来,遇到复合词(比如 “上海大学”)就找最长的词匹配,遇到不认识的字串就分割成单字词,于是简单的分词就完成了。这种简单的分词方法完全能处理上面例子中的句子。八十年代,哈工大的王晓龙博士把它理论化,发展成最少词数的分词理论,即一句话应该分成数量最少的词串。这种方法一个明显的不足是当遇到有

    googleの中国語分詞処理 - huixingの日記
    tsupo
    tsupo 2006/04/11
    googleでは言語処理のアルゴリズムを設計する際には100以上になる他の自然言語にも適用できないかを考えながら設計している。
  • イスラエル人学生の検索アルゴリズムorion - huixingの日記

    オーストラリアのニューサウス・ウェールズ大学の博士課程のイスラエル人学生の検索アルゴリズムがgoogleによって買われた。Ori Alonが考え出したことからorionと呼ばれるこの検索アルゴリズムは現在英語での検索にしか対応していないが以前のアルゴリズムに比べ検索語の相互の関連性を正確に理解できるのが特徴。現在のgoogleが検索語しか検索結果に表示しないのに対し、将来検索語に関連したサイトも探し出してくれるようになるものらしい。 Orion works as an add-on to existing search engines to improve the relevance of search and won praise from Microsoft founder Bill Gates last year. The algorithm is a problem-solving

    イスラエル人学生の検索アルゴリズムorion - huixingの日記
    tsupo
    tsupo 2006/04/11
    現在のgoogleが検索語しか検索結果に表示しないのに対し、将来検索語に関連したサイトも探し出してくれるようになるものらしい
  • CJKV日中韓越情報処理セミナー - huixingの日記

    CJKV日中韓越情報処理というセミナーがあったらしく,その内容はと言えば目新しいものが何もなさそうだが,一つだけ気になった点が,docomoの顔文字が標準化の阻害になっているということ。utf-8の普及が進まないのも携帯がそれに対応しないからというような話もある。標準化には携帯がネックになりそうだ。 DoCoMoの絵文字の弊害が,思ったよりも大きいのを感じた.実は,これに関して私を含めて何人も正式にアクションを起こしたことがあるがダメだった…何故か?(←これは,よい子への宿題.ただし,調べた結果は決して公開してはいけない点に注意) 携帯メーカキャリア各社にもお願いしたいことがあります。早く多言語対応して下さい。容量の問題もあるでしょうから、購入後にフォントやIMEをダウンロードして、自分でセッティングするかたちでもいいのでお願いします。ワタクシ、Blogサービスやツールの多言語対応があまり

    CJKV日中韓越情報処理セミナー - huixingの日記
    tsupo
    tsupo 2005/06/02
    docomoの顔文字が標準化の阻害になっている。utf-8の普及が進まないのも携帯が対応しないからという話も。標準
  • 1