[B! dev] [9ページ] kazuhookuのブックマーク

Reddit - Dive into anything

kazuhooku 2009/03/15

リンク

Google WSDM'09講演翻訳：大規模な情報検索システム構築における課題（２） - llameradaの日記

GoogleのFellowであるJeffrey Dean氏のWSDM'09における講演"Challenges in Building Large-Scale Information Retrieval Systems"のスライドの翻訳の第2回です。Googleの検索システムの10年間の進化の軌跡が紹介されており、今回は2000年から2001年ぐらいまでの検索システムの一部の紹介となっています。個人的には転置インデックスの詳細な符号化方式が公開されているのが印象に残りました。Googleにとっては過去のインデックス構造でしょうが、商用の全文検索エンジンの詳細な仕様が公開されるのは珍しい気がします。なお、イタリック体で一部解説・感想をいれています。翻訳は素人なので詳しくは元の資料を参照してください。第1回：Google WSDM'09講演翻訳：大規模な情報検索システム構築における課題（１）

kazuhooku 2009/03/15

dev

リンク

Archived MSDN and TechNet Blogs | Microsoft Docs

Archived MSDN and Tech Net Blogs 2/7/2020 2 minutes to read MSDN and Tech Net blog sites have been retired, and blog content has been migrated and archived here. Archived blogs are grouped alphabetically by the initial letter of the blog name. Blogs and blog posts can be searched by their names, using the Search box at the top of the page. Actively updated blogs have been moved to other blog sites,

kazuhooku 2009/03/12

dev

リンク

プリファードインフラストラクチャー、高速全文検索エンジン「Sedue 24」の新バージョンでSSDに対応 --- 大規模検索システムをPCサーバ1台で実現可能に ---

報道関係者各位プレスリリース 2009年3月10日株式会社プリファードインフラストラクチャー ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ プリファードインフラストラクチャー、高速全文検索エンジン「Sedue 24」の新バージョンでSSDに対応 --- 大規模検索システムをPCサーバ1台で実現可能に --- ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 株式会社プリファードインフラストラクチャー(本社：東京都文京区本郷、代表：西川徹)は、圧縮接尾辞配列方式を実装した世界初の商用検索エンジン「Sedue 24」の新バーションを販売開始いたします。新バージョンでは、ハードディスクドライブに代わる高速ストレージとして注目されているSSD(Solid State Drive)向けに最適化されたインデックスエ

kazuhooku 2009/03/10

dev

リンク

Azul Systems - Cliff Click Jr.âs Blog

And now some Hardware Transactional Memory comments... February 25, 2009 (sorry for the long gap between postings; work's gotten interesting and I got busy)I recently attended the Bay Area Workshop on Transactional Memory at Stanford generously hosted by HP. Slides are here; my slides are helpfully titled "2009_TMW.pdf". In this workshop I gave a brief overview of Azul Systems' Hardware Transac

kazuhooku 2009/03/02

dev

リンク

Technical Note TN2166: Secrets of the GPT

kazuhooku 2009/02/23

「We align partitions to 4 KB to accommodate limitations of the HFS Plus file system implementation on Mac OS X」

dev
mac

リンク

perl - Text::Tx now released! : 404 Blog Not Found

2009年02月22日00:15 カテゴリ perl - Text::Tx now released! 以前作って放置してあったText::Tx を、CPAN にも Release したのでお知らせします。 /lang/perl/Text-Tx/L/trunk - CodeRepos::Share - Trac Dan Kogai / Text-Tx/ - search.cpan.org http://www.dan.co.jp/~dankogai/cpan/Text-Tx-0.02.tar.gz 404 Blog Not Found:perl - Text::Tx も一応作った CPANにまだ上げない理由その一。txはlibraryとして素直に使うにはちょっと問題があるのです。もう一つは、なぜか Mac OS X v10.4.11 の gcc 4.0できちんとcompileしないこと。

kazuhooku 2009/02/22

dev
perl

リンク

CPANモジュールをスクリプト一発で依存解決しつつrpm化する - とあるはてな社員の日記

少し前にmizzyさんにそういえば、まっさらなサーバを30分で本番投入できるようにするで stanaka さんが「CPANの依存関係を解析してrpm化する手製スクリプトで、CPANモジュールのrpm化が、ほぼ自動化されています」と書いてるんだけど、これって公開してくれないのかなー。 HowToRpmizeCpanModules - mizzy.org - Trac と突かれたので、githubで公開してみます。 http://github.com/stanaka/cpan-dependency/tree/master 突かれたついでにmizzyさんに軽く動作確認してもらったところ、それなりに動いているようです。また、はてなでは、このスクリプトを利用して、日々それなりの数のCPANモジュールのrpm化を行っていますので、だいたいうまく動くのではないかと思います。 CentOSやFedor

kazuhooku 2009/02/19

リンク

perl - HTMLをXMLとして扱う : 404 Blog Not Found

2009年02月19日08:30 カテゴリLightweight Languages perl - HTMLをXMLとして扱うそのXML::Liberalが test でこけまくっていたところから旅が始まった。ゆーすけべー日記: 壊れた Premiere (映像編集ソフト) のプロジェクトファイルが XML::Liberal (Perlモジュール) で直ったということは、なんとかして壊れたプロジェクトファイルを「well formed」な XML にすればいいじゃないのか！と思ったわけ。そこで活躍したのが「XML::Liberal」という miyagawa プロダクトな Perl モジュール。やりたかったのは、XHTMLでないHTMLを、XML::*なモジュールで扱うこと。例えばXML::LibXMLを使えば、JavaScriptみたいな感覚でDOMを操作できるし、XML::Sim

kazuhooku 2009/02/19

dev
perl

リンク

perl - package と stash を理解する : 404 Blog Not Found

2009年02月18日01:00 カテゴリLightweight Languages perl - package と stash を理解する以下に触発されて。 CPAN 長いネームスペース大会 - にぽたん研究所 CPAN 階層の深いモジュール王選手権 - id:kazuhookuのメモ置き場パッケージの階層はどこまで深く出来るかそれを調べるために、以下のスクリプトを用意した。 #!/usr/local/bin/perl use strict; use warnings; use Data::Dumper; my $maxdepth = shift || 1024; my $ns = 'P'; sub dummy { 1 } print Dumper \%P::; for my $i ( 1 .. $maxdepth ) { no strict 'refs'; local *{ $

kazuhooku 2009/02/18

perl
dev

リンク

DBMによるテーブルデータベースその五 - mixi engineer blog

ついに発売されたスト4のコンシューマ機版をやりたくてしょうがないけど筐体を買ってもらえないので、駅前のゲーム屋のディスプレー前で垂涎するばかりのmikioです。今回は連載の最終回で、各種スクリプト言語を使ってお手軽にテーブルデータベースを操作する方法について説明します。 TokyoCabinet::TDB まずは、TCのPerlバインディングとRubyバインディングの最新版を入手してください。それぞれテーブルデータベースを扱うための TokyoCabinet::TDB というクラスが加わっています。以下のようなIDLによるガイドラインに準拠したインターフェイスが提供されますので、使い方は言語にかかわらず同じようになるはずです。 module TokyoCabinet { interface TDB { boolean open(in string path, in long omode);

kazuhooku 2009/02/16

リンク

myfinder's blog: Q4Mを使うときにやってはいけない一つのこと

ある日Q4Mを利用したシステムを運用していたところ、プログラマの方から「Q4Mのテーブルが壊れたっぽいのだけども。。。」との報告があり、状況を聞いてみた。どうも、Queueに突っ込んだけども処理したくないデータがあったという理由で一部の行をDELETEしたとのこと。で、早速DBを調べてみると、全部queue_waitで取り出したにも関わらず行数が0にならなかったり、発行しているqueue_endが実行されずにずっとプロセスが残っていたりして大変カオスな状態になっていた。 (insertも止まっていた) その場ではMySQLを強制的に再起動して、tableやschemaをdropして再作成してもらうことでことなきを得た。が、今日帰ってきてQ4Mのページを見て謎が解決。 Q4Mの「Limitations and Known Issues」に removal of multiple

kazuhooku 2009/02/13

直したいけど再現条件がわからない... ToT

q4m
dev

リンク

http://www.paragon-cs.com/mag/

kazuhooku 2009/02/11

mysql
dev

リンク

DBMによるテーブルデータベースその四 - mixi engineer blog

コアライブラリを一生懸命書くとユーティリティやバインディングなどの周辺機能がおろそかになり、逆も然りで、工数割り当てのジレンマが歯がゆいmikioです。今回は余談として、Tokyo Cabinetのテーブルデータベース（TCTDB）を作る途中で思いついた更新機能と性能検証について述べます。アトミックな更新再び TCTDBで好評だったっぽいアトミックな更新機能をその他のデータベースでも実装してみました。例えばハッシュデータベース（TCHDB）では以下の関数が提供されます。 typedef void *(*TCPDPROC)(const void *vbuf, int vsiz, int *sp, void *op); bool tchdbputproc(TCHDB *hdb, const void *kbuf, int ksiz, const char *vbuf, int vsiz,

kazuhooku 2009/02/09

mikio++

dev

リンク

Global Perspectives: Enhancing Cultural Understanding in a Connected World – Viewpoint Vault

kazuhooku 2009/02/04

これだけなら swapppiness でって気もするけど

リンク

MySQLに対するDrizzleの答え #1 スレッド管理編 - mixi engineer blog

先日、Drizzleのスレッド管理を担うコアの一部分がモジュール化され、勉強がてらMySQLのスレッド管理の設計を調べてみました。その時のメモ（だから文が少し固いかも）と、Drizzleでの戦略を今回のエントリーで公開します。最後のDrizzleでは？セクションまではプログラミングの教科書に載っている様な典型的なセオリを述べているだけなので、MySQLのインターナルに詳しい方は最後まで飛ばした方が良いかもしれません。ちなみにソースはMySQL 5.1とMySQL 6.0のドキュメントです http://dev.mysql.com/doc/refman/6.0/en/connection-threads.html http://dev.mysql.com/doc/refman/5.1/en/connection-threads.html 現在の仕組みと制限現在のMySQLでは新たなクラ

kazuhooku 2009/02/03

dev
mysql

リンク

満足せる豚。眠たげなポチ。:大規模サービスの運用事例まとめ

ここ数年の大規模サービスのシステム運用について調べてみたので参照したページやファイル、本へのリンクをまとめておく。PDF へのリンクも多数含まれているのでご注意を。時代が時代なら企業のノウハウとして隠されていたような情報がこれだけ公開してもらえているというのが非常にありがたい。公開してくれている各企業や公開してくれている人に感謝。あとで気付いたが、Google や Facebook の事例も探しておけばよかった。Thrift とかあったのに。「こんな情報もあったよ」などあればぜひ教えてください。追記していきます。 youtube http://d.hatena.ne.jp/stanaka/20070427/1177651323 digg http://d.hatena.ne.jp/stanaka/20070427/1177651323 livedoor http://labs.cybo

kazuhooku 2009/01/30

web
dev

リンク

拡張メソッドの邪悪な用途

目次ホーム連絡をする RSS Login Blog 利用状況投稿数 - 1078 記事 - 2 コメント - 26195 トラックバック - 363 ニュース著作とお薦めの品々は著作とお薦めの品々は東方熱帯林へ。わんくま東京勉強会#2 C++/CLI カクテル・レシピ東京勉強会#3 template vs. generics 大阪勉強会#6 C++むかしばなし東京勉強会#7 C++むかしばなし東京勉強会#8 STL/CLRによるGeneric Programming TechEd 2007 @YOKOHAMA C++・C++/CLI・C# 適材適所東京勉強会#14 Making of BOF 東京勉強会#15 状態遷移名古屋勉強会#2 WinUnit - お気楽お手軽UnitTest CodeZine Cで実現する「ぷちオブジェクト指向」 CUnitによるテスト駆

kazuhooku 2009/01/29

dev
c++

リンク

革命の日々！ LKML名言集

As far as I'm concerned, digital cameras have been more useful than kernel dumps to kernel debugging. -- Linus Torvalds

kazuhooku 2009/01/27

ネタ
dev

リンク

Welcome to Apache Pig!

Apache Pig is a platform for analyzing large data sets that consists of a high-level language for expressing data analysis programs, coupled with infrastructure for evaluating these programs. The salient property of Pig programs is that their structure is amenable to substantial parallelization, which in turns enables them to handle very large data sets. At the present time, Pig's infrastructure l

kazuhooku 2009/01/19

dev

リンク

はてなブックマーク

タグ

関連タグで絞り込む (108)

devに関するkazuhookuのブックマーク (474)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス