[B! hive] tgkのブックマーク

tgk id:tgk

hiveに関するtgkのブックマーク (2)

SQL感覚でHiveQLを書くと痛い目にあう例 - still deeper
Hadoop Advent Calendar 2013 4日目の記事です tl;dr explainとjob historyを読め 1 reducerは悪 data skewは悪前書きみんな大好きSQLでHadoop上での処理を実行できるHiveにはみなさん普段からお世話になっていることでしょう。ちょっと調べ物でググる度に目に入る愛らいしいマスコットが、荒んだ心に清涼な風をはこんでくれます。ですがHiveのクエリ言語はSQLではなくHiveQLですし、実行エンジンもRDBのそれとは全く異なるMapReduceです。SQLのつもりでHiveQLを書いていると地雷を踏んでしまうことがまれによくあります。本エントリでは陥りがちなHiveQLの落とし穴を2つ紹介します。例1 SELECT count(DISTINCT user_id) FROM access_log SQLに慣れた方であれ
tgk 2018/10/10
HiveQLでサブクエリ/表式を書くとMapReduceが書いた通りに分割されるらしい。そのつもりでサブクエリに割っていくと分散を良好にできるケースがある

hive
リンク
HiveQL TABLEメモ(Hishidama's Apache Hive TABLE Memo)
HiveQL（HiveのSQLっぽい独自言語）のテーブルに関するメモ。 Hiveでは操作対象のファイル（基本的にはHDFS上のファイル）をテーブルと呼んで扱う。「テーブル」と呼んでいても、データの実体はファイル。 CREATE CREATE [EXTERNAL] TABLE [IF NOT EXISTS] テーブル名 [(項目名型 [COMMENT コメント], …)] [COMMENT テーブルのコメント] [PARTITIONED BY (項目名型 [COMMENT コメント], …)] [CLUSTERED BY (項目名, …) [STORED BY (項目名 [ASC|DESC], …)] INTO バケット数 BUCKETS] [ROW FORMAT 行フォーマット] [ STORED AS ファイルフォーマット] | STORED BY 'クラス名' [WITH SER
tgk 2018/08/27
hive
リンク
1

お知らせ

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

はてなブックマーク

タグ

関連タグで絞り込む (0)

hiveに関するtgkのブックマーク (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (0)

hiveに関するtgkのブックマーク (2)

SQL感覚でHiveQLを書くと痛い目にあう例 - still deeper

HiveQL TABLEメモ(Hishidama's Apache Hive TABLE Memo)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス