タグ

hadoopに関するkireifishのブックマーク (7)

  • クックパッド株式会社を卒業します - (゚∀゚)o彡 sasata299's blog

    2013年01月31日18:37 その他 クックパッド株式会社を卒業します 私事ですが、このたびクックパッド株式会社を退職することになりました。 有給消化の関係でまだしばらく所属はしていますが、日1/31が最終出社日です。2009年の8月に入社したので、約3年半お世話になったことになります。ついこの間JOINした気がするのに早いものですね。 短い間でしたが、クックパッドの素晴らしい環境と素晴らしい仲間に恵まれて当に幸運でした。美味しいご飯もべられるし。僕の人生の中で、クックパッドJOINすることに決めたのはかなり上位にい込む素晴らしい決断だったと思います! やってきたこと せっかくなので振り返ってみます。クックパッドでは以下のようなことをやってきました。 ・HadoopやEMRを利用した大規模データ分析クックパッドという巨大なサイトへの機能追加、改善 ・新規事業へのチャレンジ

  • ビッグデータ活用は事業戦略そのものだ

    「今の時点で、ビッグデータで何が変わるのだろうと考えているとしたら、危機感を持ってほしい」。分散バッチ処理ソフトのHadoopおよびHadoopディストリビューション「Cloudera's Distribution including Apache Hadoop」を掲げ、ビッグデータを活用したシステム構築を促進するNTTデータ 基盤システム事業部 シニアエキスパートの濱野 賢一朗氏に、ビッグデータ活用の重要性について聞いた。 これまでを振り返ってみると、企業戦略としてのビッグデータ活用が最初からあったわけではない。「大量のデータを蓄積して解析したい」という顧客からの要望が、Hadoopおよびビッグデータに取り組むきっかけだった。 2007年ごろ、テレコム系のある顧客から、大量のログを蓄積して活用することで、新たなサービスを創出したいという要望があった。その要望に応えようとしたときに、ペタ

    ビッグデータ活用は事業戦略そのものだ
    kireifish
    kireifish 2012/07/31
    「Linux教科書 LPIC レベル2」著者。活用事例は国立国会図書館、KDDI、リクルート。ビッグデータ活用は1件1件のデータに意味がある。 ビッグデータ活用は事業戦略と密接に関係するので、対外的に事例を公表しずらい。
  • Hadoopでレコメンドシステムを作ろう 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    Hadoopでレコメンドシステムを作ろう 記事一覧 | gihyo.jp
  • 1000万件のバッチを2分で実行

    Hadoop(ハドゥープ)は複数のサーバーでクラスターを構成し、MapReduceという実行環境や、HDFS(Hadoop Distributed File System)という分散ファイルシステムなどによって、効率的な並列分散処理を実現するミドルウエアである。 MapReduceでは、データを整理・抽出するMapタスク、Mapタスクの出力を基にデータを集計するReduceタスクを、クラスターの各ノードで分散処理することで性能を高める。 現状では、Hadoopは主にログ分析やBI(Business Intelligence)に使用され、大量データを分析するための基盤ソフトと理解されることも多いが、それにとどまらず企業の基幹システムを大きく変える可能性を持っている。 Hadoopは分散処理を容易かつ高速に実現するため、割り切った作りになっている。基的に処理中のデータの外部からの更新や複雑な

    1000万件のバッチを2分で実行
    kireifish
    kireifish 2011/08/22
    みてわかるクラウドマガジンvol.1と併せて読む。
  • オライリーの「Hadoop」本発刊、 翻訳者に裏話を聞きました

    クラウド上で動作する大規模分散処理のプラットフォームとして注目が集まるHadoop。そもそもはグーグルが大規模な検索を行うためにMapReduceと呼ばれる処理を考案し、それを基にオープンソースとして開発されたのがHadoopです。現在ではYahoo!やFacebookが社内の大規模データ処理のために採用していることでも知られていますし、日でも昨年「Hadoopユーザー会」が立ち上がりました。 そのHadoopに関する国内初の、そして決定版的な書籍「Hadoop」がオライリー・ジャパンから1月に発刊されました。そこでこのHadoopの翻訳者の一人である玉川竜司さんに、翻訳の裏話や読みどころなどをメールでインタビューしました。 玉川さんの職と、Hadoopを翻訳をすることになった経緯を教えてください。 職は会社勤めの開発者なんですが、昨年頭からSilverlightのユーザー会をや

    オライリーの「Hadoop」本発刊、 翻訳者に裏話を聞きました
  • APCの無停電電源装置をはてなサーバーエンジニアが試してみた - はてなニュース

    こんにちは、はてなのサーバーやネットワークの各種最適化、ハードウェア選定、運用保守などを手広く担当するエンジニアのid:halfrackこと村松雄介と申します。はてなのサービスを支えるサーバーのほとんどは、自家発電装置を備えたさくらインターネット様のデータセンターに設置しています。はてなの東京オフィスにも、開発用などの用途で一部のサーバーを設定しています。もし停止しても、ユーザーさまに直接ご迷惑をおかけすることはありません。とはいえ、それなりに大事な役割を担っていて、不意の停電で困ることもあります。「インテリジェントなUPS(無停電電源装置)を導入したいな」と思っていたそんな中! APCの中容量UPSを試せるという願ったり叶ったりな話が舞い込んできました。 (※この記事は、株式会社エーピーシー・ジャパン提供によるPR記事です。) APC, a flagship brand of Schne

    APCの無停電電源装置をはてなサーバーエンジニアが試してみた - はてなニュース
  • NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮

    業界トップ のエンタープライズ Hadoop 企業 Cloudera に入社しました http://www.cloudera.co.jp/ 今年の6月に、「平成21年度 産学連携ソフトウェア工学実践事業報告書」というドキュメント群が経産省から公表されました。 そのうちの一つに、NTTデータに委託されたHadoopに関する実証実験の報告書がありましたので、今更ながら読んでみることにしました。 Hadoop界隈の人はもうみんなとっくに読んでるのかもしれませんけど。 http://www.meti.go.jp/policy/mono_info_service/joho/downloadfiles/2010software_research/clou_dist_software.pdf 「高信頼クラウド実現用ソフトウェア開発(分散制御処理技術等に係るデータセンター高信頼化に向けた実証事業)」という

    NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮
  • 1