[9ページ] bigqueryの人気記事 700件 - はてなブックマーク

321 - 360 件 / 700件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

bigqueryの検索結果321 - 360 件 / 700件

BigQueryでprotobufをパースした話 / parsing protobuf in BigQuery
- 15 users
- speakerdeck.com/qnighy
- テクノロジー
- 2019/10/11
BigQueryはログ等の集計をSQLで行うことができ、JSONを含むような複雑な集計にも対応していますが、protobufというシリアライゼーションフォーマットには対応していません。BigQueryにはJavaScriptでユーザー定義の関数を作る機能があり、これを使ってprotobuf形式のログを集計する機会があったため紹介しています。
BigQueryをオンデマンド料金モデルからBigQuery Editionsへ移行した話 - BOOK☆WALKER inside
- 14 users
- developers.bookwalker.jp
- テクノロジー
- 2023/06/21
こんにちは、メディアサービス開発部サービス分析課の佐藤です。ブックウォーカー社で全社横断のデータ基盤を構築しています。今年の3月末にBigQueryの新料金体系、BigQuery Editionsが発表されました。これに伴い来月の7月5日より従来の定額モデルが終了し、オンデマンド料金モデルも25％の値上げとなります。 cloud.google.com これまでブックウォーカー社ではスキャンサイズのバーストを防ぐためにGoogle Cloud（GCP）の「割り当てと上限」を利用し、BigQueryにおいてプロジェクト全体のスキャンサイズとユーザーごとのスキャンサイズを制限していました。これはプロジェクト全体、あるいはユーザーが設定したスキャンサイズを上回るとそれ以上の処理を停止させるという制限です。 Webサービス開発に関わる分析業務ではGoogleAnalyticsのエクスポートログやW
- BigQuery
- あとで読む
【BQML応用記事】BigQuery MLで作った機械学習のモデルでオンライン予測を実施する | DevelopersIO
- 14 users
- dev.classmethod.jp
- テクノロジー
- 2020/12/25
先にトレーニングデータ(train.csv)をデータセットに追加しておきます。モデルのトレーニング先ほど追加したデータを使ってトレーニングを行います。BQMLならSQLで簡単にトレーニングも実施できますね。使うモデルはXGBoostでいこうと思います。（ちなみに最初はAutoML Tablesを使う予定でしたが、オンライン予測はまだ対応していませんでした） CREATE OR REPLACE MODEL Titanic.xgboost_model OPTIONS( MODEL_TYPE='boosted_tree_classifier', INPUT_LABEL_COLS=["Survived"] ) AS SELECT * EXCEPT(PassengerId, Name, Ticket, Fare, Cabin) FROM `Titanic.train` モデルのエクスポートモ
GitHub - scratchdata/scratchdata: Scratch is a swiss army knife for big data.
- 14 users
- github.com/scratchdata
- テクノロジー
- 2023/10/28
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
BigQueryでCIDRに含まれるIPアドレスを探す(IPv6対応)
- 14 users
- techblog.gmo-ap.jp
- テクノロジー
- 2022/12/07
この記事は GMOアドマーケティングAdvent Calendar 2022 7日目の記事です。こんにちは、GMOアドマーケティングのM.Hと申します。今回は、GCPのBigQueryに用意されているNet関数を駆使しながら、クエリ文のみでCIDRに含まれるIPアドレスを検索する方法について書いていきたいと思います。 CIDRとはそもそもCIDRとは、クラスレスアドレッシング(Classless Inter-Domain Routing)の略語であり、「サイダー」と読みます。クラスレスアドレッシングはIPアドレスの管理方式の一つであり、スラッシュ「/」を境にしてIPアドレスとサブネットマスクを表現します。一般にIPアドレスは一連の連続したIPを含むブロック単位で使われることが多く、そういった範囲を示すためにCIDR表記が重宝されます。たとえば各モバイルキャリア会社が持っているIPア
- あとで読む
各応用方法に適した機械学習アプローチを選択する | Google Cloud 公式ブログ
- 14 users
- cloud.google.com
- テクノロジー
- 2021/07/13
※この投稿は米国時間 2021 年 7 月 2 日に、Google Cloud blog に投稿されたものの抄訳です。多くのお客様が、機械学習（ML）で問題を解決するテクノロジースタックの選択方法を知りたいと望んでいます。利用可能なソリューションは数多くあります。ご自身で構築できるものもあれば、購入できるものもあります。今回は構築にポイントを置き、各種オプション、解決可能な問題、おすすめについて解説します。多くのデータでトレーニングするほど優れた ML 応用が実現するまずは重要なコンセプトの確認から始めましょう。つまり、ML モデルの品質は、データのサイズによって改善されるということです。下のグラフが示すように、目覚ましい ML のパフォーマンスと精度は、データサイズの向上によってもたらされます。これはテキストモデルですが、同じ原則が、あらゆる種類の ML モデルに当てはまります。
BigQueryの2020年アップデートを（だいたい）全部振り返る
- 14 users
- medium.com
- テクノロジー
- 2020/12/04
BigQueryに関する話を自由にしましょう - BigQueryでデータ基盤を作った - BigQueryと他サービスでデータ転送した - BigQuery関数でこんな計算をしているなどなどみなさんこんにちは。年末ですね。年末やることといえば、振り返り、総集編ですよね。 BigQueryアドベントカレンダーができたのをみて、「そういえば2019年にやったBigQueryのリリースまとめ的なの、2020年やってないな・・・？」と思い立ち2020年のBigQueryアップデートをまとめました。リリースノート開いたらスクロールバーがすごく小さくなり心が折れかけましたが、なんとか気持ちを奮い立たせました。もしもこんな長い記事を最後までスクロールしてくれる方がいたら、感謝の意を表明しますので、Twitterで @yutah_3 まで教えていただけると、泣いて喜びます。以下、カテゴリに分けてア
- article
Write queries with Gemini assistance | BigQuery | Google Cloud
- 14 users
- cloud.google.com
- テクノロジー
- 2023/08/30
Send feedback Stay organized with collections Save and categorize content based on your preferences. Write queries with Gemini assistance You can use Gemini for Google Cloud, which offers AI-powered assistance, to help you do the following in BigQuery: Generate a SQL query. Complete a SQL query. Explain a SQL query. Generate Python code. Complete Python code. Gemini doesn't use your prompts or its
検索マーケターが BigQuery 脱初心者するには - ブログ - 株式会社JADE
- 14 users
- blog.ja.dev
- テクノロジー
- 2023/11/22
JADEファウンダーの長山です。今日は先日こちらのセミナーでも話した、「検索マーケターがBigQueryで脱初心者するにあたっての考え方」について書きたいと思います。 blog.ja.dev 皆自分を初心者だと言いたい問題これはある程度どの分野でも存在することかもしれませんが、人によって「初心者」の定義が大きく違う問題が存在します。ダニング＝クルーガー曲線における「啓蒙の坂」を上りきっていない、絶望の谷にいる人々は、本来ならすでに脱初心者しているはずなのですが、あまりに深い絶望のあまりに「何もわからない、自分は初心者だ」と思ってしまうわけです。しかし、本当の初心者は一体自分がどこまでわからなくてはならず、その中で何がわかっていないのかをうまく想像することができないはずです。「何もわからない」と言えている時点で、その人はすでに絶望の谷に降り立っており、初心者ではないのです。ダニングクルー
freee：データウェアハウス構築に BigQuery を採用することで、5 ～ 10 倍のパフォーマンスと運用性、利便性を向上 | Google Cloud 公式ブログ
- 14 users
- cloud.google.com
- テクノロジー
- 2023/01/31
freee：データウェアハウス構築に BigQuery を採用することで、5 ～ 10 倍のパフォーマンスと運用性、利便性を向上個人事業や中小企業などのスモールビジネスに携わるすべての人が、自由に自然体で経営できる環境をつくるための「統合型経営プラットフォーム」を開発、提供する freee株式会社（以下、freee）。2013 年 3 月にクラウド会計ソフト「freee」をリリースすると同時に、エンジニア主導でデータ基盤を活用し、ユーザーの事業拡大を支援してきました。このデータ基盤が 10 年を経て、パフォーマンスや運用性、利便性に課題が生じたことから刷新を決定。新しいデータ基盤の中核に BigQuery が採用されています。このプロジェクトについて、プロダクト基盤本部の 2 名に話を伺いました。利用しているサービス： BigQuery、Cloud Storage、VPC Serv
- あとで読む
Googleエンジニアと学ぶGCP［ビッグデータ］
- 14 users
- xtech.nikkei.com
- テクノロジー
- 2020/02/17
第1回今求められるデータ基盤とGCP GCPにおけるデータ処理のアーキテクチャーをひもときながら、現在の企業システムで求められるデータ基盤とはどのようなものであるかを整理した上で、それを構築する方法を説明します。 2020.02.17 第2回 BigQueryによるDWHの構築と管理サーバーレスで柔軟な分析基盤の中心となるデータウエアハウス（DWH）である、BigQueryについて詳しく解説します。どんなものなのかを体感するため、あらかじめBigQueryに用意されたデータを操作してみましょう。 2020.02.17 第3回 BigQueryへのデータ取り込みとメタデータ管理 Google Cloud Platform（GCP）のサーバーレスのDWH（データウエアハウス）であるBigQuery。BigQueryで構築したデータ基盤へのデータの取り込み方法を見ていきましょう。 2020.
Introduction to materialized views | BigQuery | Google Cloud
- 13 users
- cloud.google.com
- テクノロジー
- 2020/04/09
Send feedback Stay organized with collections Save and categorize content based on your preferences. Introduction to materialized views This document provides an overview of BigQuery support for materialized views. Before you read this document, familiarize yourself with BigQuery and BigQuery's logical views. Overview In BigQuery, materialized views are precomputed views that periodically cache th
- bigquery
- gcp
- google
- cloud
- business
- あとで読む
GA4用のBigQuery クエリ集
- 13 users
- www.ga4.guide
- テクノロジー
- 2022/09/29
本ページはSQLを覚えることを目的にしたページではなく、SQLを使ってGA4のBigQueryからよく使いそうなSQLをまとめたものになります。対象は今までSQLを使ってデータをだした事が無い方、昔一度試して挫折あるいはどうすればよいか分からなくなってしまった方が対象です。そのため「とりあえず使ってみる」事を意識しております。必要な限りコメントを入れて、わかりやすさ優先の記述となっています。そのため必ずしも効率的書き方では無いことをご了承下さい。また本SQLの内容等に関してはサポート対象外となりますので、自己責任でご利用ください。作成ご協力：@macchaice・@kirin0890・他皆様（感謝！）利用前の確認事項自分のデータセットを指定する例えば以下のようにデータが格納されている場合 fromの部分は以下の通りとなります。保存データごとに変わるので、必ず自社のプロジェクトIDに
SQLは書けるけどBigQueryは初見の人に贈るざっくりBigQuery
- 13 users
- zenn.dev/masumomo
- テクノロジー
- 2022/01/03
去年使い始めたBigQueryについて、BigQueryを使う前の私に教えてあげたいことをまとめてみました。 BigQueryとは Google Cloudで提供されている、データ管理と分析のためのデータウェアハウス（めっちゃデータが入ってる総合的な倉庫と思ってもらえれば）サービスです。フルマネージドなので、インフラ管理も楽なままSQLクエリだけで大規模なデータ分析基盤を構築できます。気軽に試すには、Sandbox環境がおすすめです。 DDL(CREATE TABLEとか)は発行できませんが、パブリックデータセットなども存在しているので、基本的な操作は試すことができます。特徴 BigQueryは早いということがよく特徴として上がりますが、それを実現する二つの大きな要素があります列指向データベースであることデータウェアハウスでは列指向データベースが多いですが、BigQueryも例に
Engineering Education
- 13 users
- www.webscale.com
- テクノロジー
- 2021/01/18
Prerequisites In this tutorial, one ought to have the following: Basic React and Javascript knowledge. Understanding of npm and how to install from npm Atom or Visual studio code and npm installed...
- データ
BigQuery アクセス権設定まとめ & グループ設計例 - Qiita
- 13 users
- qiita.com/na0
- テクノロジー
- 2020/01/17
2021年時点でも、そこそこ参照されているため、BigQuery Advent Calendar 2021 25日目の記事としてアップデートします。 BigQuery リソースのアクセス権設定は難しいですが、データ資産の保護と活用のバランスを自由に設計できます。組織に合わせたアクセス権をうまく設定 & 設計して、データ資産を活かしていきたいですね。本稿では、アクセス権の設定方法と、叩き台になりそうな具体的な設計例について述べます。アクセス権の設定方法 BigQuery リソースのアクセス権設定にあたり、覚えておく軸は 3 つです。具体的な人間やアカウントを示すプリンシパル、権限範囲の対象（プロジェクトやデータセット）を示す対象レイヤ、具体的な一つ一つの権限、これらをおさえておけば、BigQuery の権限設定は安心です。プリンシパルは Google アカウントを筆頭に 7 種類以
- qiita
- あとで読む
ストーリーで学ぶ Google BigQuery を読んだ - public note
- 13 users
- ts223.hatenablog.com
- テクノロジー
- 2021/01/26
読書感想文です。読んだ本どんな本か読んだ感想読んだ本 Google Cloud Platform実践ビッグデータ分析基盤開発ストーリーで学ぶGoogle BigQuery 著者: 株式会社トップゲート出版社: 秀和システム ISBN-10: 4798059560 www.amazon.co.jp どんな本か紹介文より引用 Google BigQuery(ビッグクエリ)は、Googleが自社で保有している膨大なデータを効率的かつ高速に分析するために構築した社内データ分析基盤を一般提供したサービスです。その内部ではBorg、Colossus、Jupiter、DremelなどのGoogle独自のコアテクノロジーが活用されており、実行されたクエリはGoogleの保有する膨大なインフラリソース上で瞬時に並列・分散処理されます。その処理速度は1000億行のデータセットに対してインタラク
GitHub - qnighy/bqpb: BigQuery UDF to parse protobuf messages
- 13 users
- github.com/qnighy
- テクノロジー
- 2023/11/06
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.
Introduction to data masking | BigQuery | Google Cloud
- 13 users
- cloud.google.com
- テクノロジー
- 2022/06/01
Send feedback Stay organized with collections Save and categorize content based on your preferences. Introduction to data masking BigQuery supports data masking at the column level. You can use data masking to selectively obscure column data for users groups, while still allowing them access to the column. Data masking functionality is built on top of column-level access control, so you should fam
- BigQuery
- GCP
- あとで読む
- cloud
- google
BigQueryでマテリアライズドビューが提供開始、プレビューとして。複雑なクエリをより高速に実行可能
- 13 users
- www.publickey1.jp
- テクノロジー
- 2020/04/16
BigQueryでマテリアライズドビューが提供開始、プレビューとして。複雑なクエリをより高速に実行可能 Google Cloudのデータウエアハウス向けデータベースであるBigQueryに「マテリアライズドビュー」機能がプレリリース版として追加されました。一般にリレーショナルデータベースにおける「ビュー」とは、仮想的なテーブルのようなものとされます。これによって、BIツールを使ってデータベースへ検索を実行する際などに、複雑なテーブル構成を隠蔽して分かりやすい構成のビューだけを見せたり、特定のユーザーにアクセスを許すビューだけを見せる、といったことが可能になります。通常のビューは仮想的な存在であり実体を持たないため、ビューに対するクエリは実際にはビューを構成するテーブルに対するクエリに分解され、実行され、結果が返されます。一方、マテリアライズドビューはテーブルのように実体を持つビューと
Google Cloudを選ぶ理由（特徴を踏まえて解説） | DevelopersIO
- 12 users
- dev.classmethod.jp
- テクノロジー
- 2023/05/09
初めに今回は私がGoogle Cloudを選ぶ理由について、いくつか特徴を踏まえながら解説していきます。それぞれの機能の紹介をしていきますが、詳細は頭出しにとどめ、理解しやすいように簡潔に内容を整理したいと思っております。また、あくまでも私（室井）が企業でクラウドを選定するのであれば、ここに着目してGoogle Cloudを選ぶよねという視点で記事にします。（個人の見解です）グローバルVPC Google Cloudの大規模なネットワークの概要については、過去に何度か記事にしているのでそちらをご覧ください。【クラウドの基本機能を解説（AWS , Google Cloud）】【Google Cloud：ネットワーク関連の特徴【前編】】最大の特徴として『1つのVPCを定義するだけで全てのリージョンに同じネットワーク内のサブネットワークを定義できる』という事が挙げられます。（＝グロ
- gcp
Data Catalog のポリシータグで BigQuery カラムレベルのアクセス制御が可能になったので試してみた | DevelopersIO
- 12 users
- dev.classmethod.jp
- テクノロジー
- 2020/04/07
こんにちは、みかみです。これまで BigQuery のデータのアクセス制御を指定できる最下層のリソースはデータセットで、テーブルやカラム単位でのアクセス制御はできませんでしたが、Data Catalog のポリシータグを付与することで、カラムレベルのアクセス制御が指定できるようになったそうです。 BigQuery の列レベルのセキュリティで、きめ細かなアクセス制御を｜ GCP ブログ Introduction to BigQuery Column-level security ｜ BigQuery ドキュメント Restricting access with BigQuery Column-level security ｜ BigQuery ドキュメントやりたいこと BigQuery のカラムレベルのアクセス制御を行うにはどうすればいいのか知りたい BigQuery のカラムレベルの
- bigquery
- database
- データ
- Security
- tips
GCP Cloud IAM と BigQuery のデータセット、テーブル、View へのアクセス制御を確認してみた | DevelopersIO
- 12 users
- dev.classmethod.jp
- テクノロジー
- 2020/01/10
GCP Cloud IAM と BigQuery のデータセット、テーブル、View へのアクセス制御を確認してみたこんにちは、みかみです。 GCP ＆ BigQuery 勉強中です。データを取り扱う以上、個人情報の閲覧可能な範囲など、セキュリティには当然十分に気を付ける必要があります。 BigQuery ではどの単位でどうやってアクセス権を指定できるのかという観点から、Cloud IAM と BigQuery のアクセス制御について確認してみました。やりたいこと GCP の Cloud IAM はどんなものか確認したい BigQuery に Cloud IAM でアクセス制御できるかためしてみたい BigQuery ではテーブル単位でアクセス制御できるのか知りたい GCP の IAM GCP の Cloud IAM は、AWS の IAM と同じようなサービスと考えてよいのかな？
- あとで読む
Google AnalyticsのBigQuery Exportを使って検索ログデータ分析基盤を構築した - エムスリーテックブログ
- 12 users
- www.m3tech.blog
- テクノロジー
- 2021/05/26
エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(@po3rin) です。好きな言語はGo。仕事では主に検索周りを担当しています。 Overview 医師に質問ができるサービスであるAskDoctorsではユーザーが質問を検索できる機能があり、今回は検索改善タスクのために検索ログデータ分析基盤を構築したお話をします。これにより改善サイクルを回せるようになったり、検索ログを使った各種アルゴリズムが利用可能になりました。データ基盤構築では他チームとの連携が必要不可欠であり、コミュニケーションで工夫した点などもお話できればと思います。 Overview なぜ検索ログデータ分析基盤が必要なのか検索を監視して改善サイクルを回したい各種アルゴリズムに利用できるデータを取得したいデータ分析に利用したいデータアーキテクチャを書き出すイベントとデー
PythonでBigQueryの実行情報をSlackへ共有する方法
- 12 users
- techblog.gmo-ap.jp
- テクノロジー
- 2020/12/03
この記事は GMOアドマーケティングAdvent Calendar 2020 3日目の記事です。皆さんこんにちは、GMOアドマーケティングのS.Rです。前回のブログでは、GCPのSDKでBigQueryを実行する状況をBigQueryのテーブルへ格納するプログラムの作り方を皆さんへ紹介させていただきました。実際の運用にはBigQueryの実行状況を集計することだけではなく、大きな課金が発生する場合にリアルタイムで責任者へ共有することも重要です。今回はBigQueryの実行する情報を、よく使われているSlackという業務用チャットツールへ共有する方法を皆さんへ紹介します。 Slack側の設定 1 連携用Slack Appを作ります。 Slackの管理画面を開いてAppの名前やwork placeの名前を指定してください。今回のブログではAppの名前をbigquery_cos
Eurekaの DataPlatform開発状況と再現性の実現
- 12 users
- speakerdeck.com/t_kurimura
- テクノロジー
- 2020/02/05
使われないものを作るな！出口から作るデータ分析基盤 / Data Platform Development Starting from the User Needs
- データ基盤
dbtとDataformを比較し、dbtを使うことにした
- 12 users
- attsun1031.github.io
- テクノロジー
- 2021/04/05
AuthorsTwitter@__Attsun__Published onWednesday, February 10, 2021 最近、業務で DWH / Datamart の整備やデータ品質の担保を効率的に行いたくなる事情があり、調査したところ dbt と Dataform がツールとして有力そうだったので、比較してみました。 TL;DRdbt は機能が充実しており、カスタマイズするポイントも多く様々な要件に対応できそうです。反面、理解し使いこなすための学習コストがかかります。Dataform は Web ビューによる開発体験が非常に良いです。機能もほとんどはわかりやすく、迷うことも少ないです。一方、dbt に比較して融通はききづらいです。どちらも十分な機能は備えている素晴らしいツールだと感じるので、どちらが良いかは要求や組織の置かれた状況次第でしょう。私の所属する会社 (Ubie,
- dbt
- dataform
- bigquery
- データ
- あとで読む
Google ColaboratoryでBigQuery SQLの共有
- 12 users
- techblog.gmo-ap.jp
- テクノロジー
- 2020/11/24
GMOアドマーケティングのT.Oです。 SQL式を共有したいと思ったことはありませんか？今回はGoogle Colaboratoryを使用して、BigQueryのSQL式を共有するための手順をご紹介します。 0.Google Colaboratoryとは？ Google Colaboratory（略称:Google Colab）とは、ブラウザ上でプログラム（主にPython）を記述、実行できるクラウド上のサービスです。機械学習やデータ分析の分野で利用されているJupyter Notebookというツールをベースにしていて以下のような特徴があります。環境構築が不要（ローカル環境へのインストールは不要です） GPUへの無料アクセス（計算を高速に行いたい場合にGPUを利用します）簡単に共有（プログラムや説明の文章、実行結果をノートブックと呼ばれるファイルにまとめて管理、共有できます）今回
Googleアナリティクス4（GA4）とBigQuery連携まとめ！Exportの方法からデータの確認、可視化までを詳しく解説 | Databeat Marketing Magazine
- 12 users
- www.data-be.at
- テクノロジー
- 2021/12/08
2020年10月にリリースされたGoogleアナリティクスの新しい規格である、GA4（Googleアナリティクス4プロパティ）。GA4は、BigQueryと連携することで活用の幅を大きく広げることができます。また、UA（ユニバーサルアナリティクス）は、2023年7月1日でGoogleのサポートが終了します。そのため、Googleアナリティクスをアクセス解析ツールとして利用しつづけるには、GA4への移行が必須です。そこで今回は、GA4とBigQueryの連携方法からよく使うSQL、そしてLooker Studio（旧Googleデータポータル）を活用した可視化の方法まで、詳しく解説します。GA4のデータをWebサイトやアプリの分析でもっと活用していきたい方は、ぜひご覧ください。
- GA4
- Google
Datastream for BigQuery でプライベートなCloudSQLをニア・リアルタイムに分析する - Assured Tech Blog
- 12 users
- tech.assured.jp
- テクノロジー
- 2023/04/18
こんにちは！エンジニアのオリバーです。最近、個人で翻訳するときに ChatGPT に英訳、和訳させてみることが多くなってきたこの頃です。久々に少し長めの技術記事を書かせていただきました。最近のトレンドである（と思っている）多様なデータを素早く安全に Google Cloud Platform (GCP) 上で活用するための記事になっています。記事後半には Terraform のサンプルと一緒に構成の説明がありますので興味ある方は最後まで読んでいただければと思います。直近、GCP の BigQuery にアプリケーションのデータをニア・リアルタイムで同期できる Change Data Capture (CDC)のマネージドサービス、Datastream for BigQuery を利用する機会がありました。今回使用したデータソースは外部からのアクセスを許可していない構成だったのですが、こ
- bigquery
- Datastream
BigQueryの料金体系(BigQuery Editions)を徹底解説 - G-gen Tech Blog
- 11 users
- blog.g-gen.co.jp
- テクノロジー
- 2023/03/30
G-genの杉村です。Google Cloud (旧称 GCP) のフルマネージドなデータウェアハウスサービスである BigQuery の新しい料金体系「BigQuery Editions」が 2023年3月29日に発表され、2023年7月5日に施行されました。当記事ではその仕組みと、従来の料金体系との違いなどについて解説します。概要新しい価格体系何が変わるか値上げか、値下げか当記事での解説 Physical storage 圧縮後データに対する課金制約 Active と Long-term タイムトラベル・フェイルセーフへの課金単価の違いと圧縮率単価の違い圧縮率の例 Physical storage への移行 BigQuery Editions BigQuery Editions とは 3つのエディション・料金表クエリがプロジェクトをまたぐ場合いつ Editions
Googleに買収されるLookerが日本で本格的にビジネスを始動
- 11 users
- enterprisezine.jp
- テクノロジー
- 2019/07/17
SaaSから提供するAPIでデータを持たずにBI機能を提供する Looker Data Science バイスプレジデントジャパンカントリーマネージャー小澤正治氏 Lookerの日本法人がビジネスを開始したのは2018年9月のこと、「これまでの10ヶ月はステルスモードでやってきましたが、これからがグランドオープンです」と語るのは、Looker Data Science バイスプレジデントジャパンカントリーマネージャーの小澤正治氏だ。ステルスモードの間に、日本の20社ほどにLookerは導入されている。Lookerを導入する企業の傾向としては、Eコマースやマーケットプレイス、デジタルマーケティング関連など、膨大なデータを抱えそれがどんどん増えているような企業となる。 Lookerのアーキテクチャは、まずはさまざまなSaaSのアプリケーションや企業が運用している各種データベースなどのデー
Dataform | Manage data in BigQuery
- 11 users
- dataform.co
- テクノロジー
- 2020/12/10
Transform your raw data into reliable, documented, up-to-date datasets. Dataform is where your data team works together to build a single source of truth for your company’s data. Collaborate on SQL pipelines in BigQuery without writing code or managing infrastructure.
- GCP
- BigQuery
- 開発
- あとで読む
BigQuery では本当にトランザクション処理がサポートされていないのか確認してみた | DevelopersIO
- 11 users
- dev.classmethod.jp
- テクノロジー
- 2020/03/26
こんにちは、みかみです。 RDBMS など多くのデータベースでは、複数の SQL をひとまとめで実行し、途中でエラーが発生した場合に実行前の状態に自動でロールバックしてくれる、トランザクション処理をサポートしています。トランザクション処理｜ Wikipedia トランザクション (transaction) ｜「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典 BigQuery のドキュメントには、以下の記載がありました。各 DML ステートメントは、暗黙のトランザクションを開始します。つまり、成功した各 DML ステートメントの終了時に、ステートメントによる変更が自動的にコミットされます。複数ステートメントのトランザクションはサポートされていません。引用：データ操作言語 | BigQuery ドキュメントやりたいこと BigQuery は本当に複数 SQL
- bigquery
Cloud Loggingの概念と仕組みをしっかり解説 - G-gen Tech Blog
- 11 users
- blog.g-gen.co.jp
- テクノロジー
- 2022/04/16
G-genの杉村です。Cloud Logging は Google Cloud (旧称 GCP) 上のシステム等が生成したログを収集・保管・管理する仕組みです。基本的な概念や仕組みを解説していきます。 Cloud Logging 概要 Cloud Logging とは対象のログログの保存先料金 Cloud Logging の料金最初から存在するログバケットの料金ストレージ料金の課金開始取り込み料金の節約 Cloud Logging が扱う4種類のログ 1. Google Cloudサービスが生成するログ 2. ユーザーが生成するログ 3. セキュリティログ 4. マルチクラウドとハイブリッドクラウドのログログの閲覧閲覧方法クエリ言語インデックスログルーティングとログの保存ログルーティングとはシンクとは初期設定で存在するシンク書き込み ID プロジェクトをまた
アプリログを BigQuery に入れるまで | BLOG - DeNA Engineering
- 11 users
- engineering.dena.com
- テクノロジー
- 2019/10/17
また、 BigQuery のストレージ料金は非圧縮の状態のデータサイズが課金対象となります。 Cloud Storage 上に gzip で圧縮した状態で保持することで、ストレージ料金を大きく下げることができます。 Cloud Storage から BigQuery にエクスポートする際に料金が少しかかりますが、それについては後述します。安定性 BigQuery のテーブルは型を持っているため、何かしらのバグでログに不正な文字列が入ると、 BigQuery へのインサートは失敗します。その場合にログを web server 内部に溜めてしまうと web server のディスク領域が逼迫したり、本番稼働しているサーバーに入っての復旧作業が必要となったりするデメリットがあります。まずはどんなデータでも受け入れてくれる Cloud Storage にデータを入れてしまい、その後起きうる問題
- あとで読む
HerokuのログをBigQueryへエクスポートする | tsuchikazu blog
- 10 users
- tsuchikazu.net
- テクノロジー
- 2020/06/22
Herokuのログはどんどん流れていってしまうため、どこかに保存しなくてはなりません。そのため、PapertrailやCoralogix Loggingなどのaddonを使って、外部サービスへlogを流して、そちらである程度の期間分、永続化するなり、検索して活用するなどしているかと思います。大量のアクセスがきて大量のログが流れるアプリケーションの場合、ログが大量になりプランアップにしなければならなくなり、addon料金も馬鹿にならない。ということになったりしないでしょうか？そこで、addonを使用せずにGoogle BigQueryへログを転送して、利便性を損なわずにコストダウンを図るということをやってみたので、それの紹介です。ざっくりの概要としてはこのような形。 Loggingライブラリ Heroku上のアプリから、Loggingライブラリなどを利用して、Cloud Loggingへ書
社内で「Data Vault勉強会」を開催しました - 10X Product Blog
- 10 users
- product.10x.co.jp
- テクノロジー
- 2022/07/01
はじめに Growth&SuccessでStailerのデータウェアハウスの開発をしています@kazk1018です。この記事では、先日社内で開催した「Data Vault勉強会」を基にData Vaultについて簡単に紹介するとともに、10Xでどのように利用しているかを紹介したいと思います！ Data Vaultについて「Data Vault」はエンタープライズデータウェアハウス(EDW)を構築するためのモデリング手法です。最初に提案されたのは2000年なので20年以上の歴史があり、2013年には「Data Vault 2.0」が提案され、非構造データへの対応やより実践的なプラクティスなどが追加されました。*1 Data Vaultではデータウェアハウスを構築する全体の流れから、各レイヤーで用いるスキーマの設計まで幅広い範囲のアプローチや手法が提案されています。中でもHub、Link、S
- あとで読む
Googleアナリティクス4のBigQueryエクスポート仕様 – marketechlabo
- 10 users
- www.marketechlabo.com
- テクノロジー
- 2021/03/12
テーブルの場所 GA4のBigQueryエクスポート設定で指定したプロジェクトデータセット「analytics_999999999」（「999999999」の部分はプロパティID）テーブル名前日までのデータ（日付別に）「events_20210101」「20210101」の部分は日付今日のデータ、前日未集計分のデータ「events_intraday_20210102」出力時刻は午前7時ごろ。レポートのタイムゾーンに依存するため、米国のままにしていると夜11時ごろに出力される。GA4ではなくFirebase Analyticsの場合はUTC。タイムゾーン設定がない。日付でシャーディングされたテーブル GA4のBigQueryエクスポートでは日単位でテーブルが分かれている前日まで：events_20210101, events_20210102, …, , events_202
視聴動向データの分析基盤を Redshift から Snowflake に乗り換えた話 - PLAY DEVELOPERS BLOG
- 10 users
- developers.play.jp
- テクノロジー
- 2023/07/26
こんにちは、SaaS プロダクト開発部テックリードの丸山です。先日、プライベートで使用している AWS アカウントに 15 万円の請求書が届きました。AWS Batch を使用して動画を GPU エンコードする仕組みを構築して運用していたのですが（構築したのは 5 年前）、プログラムの例外処理に不適切な点があり、プロセスが実行中のまま終了しない状態になってしまいました。そのため、コンピューティング環境（GPU を搭載した EC2 インスタンス）が動きっぱなしになり、高額請求される結果となりました。これを教訓に現在は毎日 AWS の料金を Slack に通知するようにしています。読者の皆さまにおかれましても、くれぐれも油断されなきよう。さて今回は、少し前の話にはなりますが、昨年実施した視聴動向データの分析基盤のリニューアルプロジェクトについてご紹介したいと思います。視聴動向データの分析
- Snowflake
- AWS
- データ