データを信頼し、AI を信頼する 信頼できるデータ、信頼できるモデル、信頼できる AI を実現するために、これほど多くのクラウドのさまざまなデータタイプを管理でき、オープンデータのイノベーションと大規模展開に対応できるプラットフォームは他にありません。
ニュース ビジネス 「MapRはいずれ淘汰される」「非構造化データ? 全部構造化データだよ」- テラデータのキャラ立ちCTO・ブロブストさん発言まとめ つい最近まで暑い暑いと騒いでいたのにいつの間にかコートにマフラーという季節になり、ひしひしと迫ってくる年末感にただただおびえる今日このごろ、読者の皆様はいかがお過ごしでしょうか。忙しくなる一方のこの時期に風邪など引いてしまうとエライことになってしまうので、体調管理には十分お気をつけのほどを。 今回も前回に引き続き、10月後半に米ワシントンDCで開催されたテラデータの年次ユーザカンファレンス「PARTNERS 2012」で拾ったネタをご紹介したいと思います。筆者は昨年もPARTNERSに参加させていただいたのですが、そこで初めて同社のCTOであるスティーブン・ブロブスト(Stephen Brobst)さんのセッションに参加し、アロハシャツをま
この2ヶ月で,Cloudera/Twitter,Hortonworks からそれぞれ別の列指向ファイルフォーマットが公開されました.Parquet と ORCFile です. この記事では,まず RCFile の復習をして,その後 Parquet と ORCFile それぞれの共通点と違いをおおまかに見ていこうと思います.コードレベルの詳細な違いについては,次回以降で見ていきます. RCFile の復習 RCFile は Record Columnar File の略で,Hive から利用できるストレージフォーマットです.特に,HDFS や S3 といった分散ストレージ上でパフォーマンスがでるように設計されています. HDFS/S3 といったストレージでは,基本的にデータを計算機間で同じ負荷になるようにデータを分散配置します.このため,従来の列指向ストレージフォーマットのように適当に列毎に
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く