タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

Avroに関するyubessyのブックマーク (2)

  • 第7章 Avroスキーマ

    Avroを使用すると、レコードの値のデータ・スキーマを定義できます。このスキーマは、値で使用できるフィールドとそのデータ型を表します。 Oracle NoSQL Databaseレコードの値部分にスキーマを適用するには、Avroバインディングを使用します。このバインディングを使用して、書込み前の値のシリアライズと読取り後の値のデシリアライズを行います。このバインディングを使用するには、アプリケーションでAvroデータ形式が使用されている、つまり格納値がそれぞれスキーマに関連付けられている必要があります。 Avroスキーマを使用すると、シリアライズされた値を領域効率に非常に優れたバイナリ形式で格納できます。格納される各値は、サイズの小さい内部スキーマ識別子(1から4バイト)以外のメタデータを持ちません。このような参照情報がキーと値のペアごとに格納されます。このように、シリアライズされたAvr

  • Amazon EMR の Avro フォーマットのデータを Amazon Redshift にロードする | DevelopersIO

    先日、Amazon Redshift で Avro フォーマットのデータをロードできるように COPY コマンドが拡張されました。Avro といえば、Hadoop のシリアライズフォーマットの一つです。Avro ファイルを実際に作成したり、Pig から Avro ファイルをエクスポート〜 Redshift に投入する方法をご紹介したいと思います。 Amazon RedshiftでAvroフォーマットのデータロードをサポートしました 新たに COPY 文で FORMAT が追加になり、このオプションとして AVRO が指定できるようになっています。 COPY COPY table_name [ column_list ] FROM data_source [ WITH ] CREDENTIALS [AS] 'aws_access_credentials' [ [ FORMAT ] [ AS

    Amazon EMR の Avro フォーマットのデータを Amazon Redshift にロードする | DevelopersIO
    yubessy
    yubessy 2016/10/23
    RedshiftがAvroからのロードに対応してることを知った
  • 1