タグ

masutaka26のブックマーク (9,631)

  • LGTMやIMO等コメント略語まとめ - Qiita

    コードレビューでよく見るけど、これってどういう意味だっけ..IMO..芋..? そんな略語たちをまとめました。 他にもこんなのあるよ!と言うのがあれば教えてください〜 「Looks Good To Me」 = 良いと思います WIP 「Work In Progress」 = 対応中 FYI 「For Your Information」 = 参考までに must 「must」 = 必須 want 「want」 = できれば imo 「in my opinion」 = 私の意見では imho 「in my humble opinion」 = 私のつたない意見では(控えめな意見・謙虚な意見) imnsho 「in my no so humble opinion」 = ハッキリ言わせていただくと imao 「in my arrogant opinion」 = 私の大胆な意見(ぶっちゃけ) nits

    LGTMやIMO等コメント略語まとめ - Qiita
    masutaka26
    masutaka26 2024/02/08
    nits
  • Data Warehouse Layers (Modern Data Warehousing, Part 1)

    masutaka26
    masutaka26 2024/02/08
    DWH を staging/core/presentation という layer でモデリングする話
  • 円グラフが有効なケースを考察してみる

    嫌われる円グラフ 何らかの集団や組織、量の構成比をビジュアライズする場合、一般的な手段として円グラフはよく用いられますが、項目間の比較がしにくいことなどを理由にデータアナリストやデータサイエンティストからは敬遠されがちです。 Tableauの視覚的分析のベストプラクティスでも次のように触れられています。 一部と全体の間の関係を分析することがあります。 このような場合にはよく円グラフが使 われますが、次の 2 つの理由から円グラフはお勧めできません。 1) 人の視覚系はパイ の見積もりに不向きであり、2) すぐ隣りのパイ同士としか比較できないからです。 Tableauが特別に円グラフを嫌っているわけではなく、他にも複数の書籍が円グラフはミスリードを招きやすく活用シーンが少ないことに触れています。 よく語られる円グラフのデメリットは下記の通り 隣り合っているものしか比較できない 角度を比較する

    円グラフが有効なケースを考察してみる
    masutaka26
    masutaka26 2024/02/08
    “バーチャートの場合、50%がどこに当たるのかが直感的に分からなかったわけですが、円グラフの場合は50%がどこに当たるか直感的にすぐ理解することができました”
  • より信頼できるクエリを書くために、SQLでもテストを書く - ハヤオキスルフクロウ

    はじめに こんにちは、久しぶりに技術系の記事を書きます、株式会社カンムで機械学習エンジニアをしている fkubota です。 今日はSQLについてです。 弊社に入社してから毎日のようにSQLのクエリを書いてきました。 クエリを書き始めてからもう3年が経とうとしています。 日々クエリを書きながら少しずつ自分のスタイルが出来上がってきているのを日々実感しています。 僕は 正確で 読みやすく 再利用しやすいクエリを 高速に 生み出すための工夫を重ねてきました。 結果的にテスト駆動開発ぽいスタイルが生まれたので今日は紹介してみようと思います。 似たような記事がないので少しドキドキですが温かい気持ちで読んでもらえると嬉しいです。 対象読者 対象読者は、分析のためにクエリを書いている人とします。 プロダクトに乗せるクエリというより、ビジネス的になにか示唆を得たいときにクエリを書く人を想定します。 痛み

    より信頼できるクエリを書くために、SQLでもテストを書く - ハヤオキスルフクロウ
    masutaka26
    masutaka26 2024/02/07
    BigQuery の ERROR 関数を利用した方法。考え方は dbt のテストにも使える。非常に参考になる。
  • dbtで見やすいER図を生成する - yasuhisa's blog

    背景: dbtを使っていてもER図は欲しい! どうやってER図を生成するか どうやってER図を見やすくするか まとめ 背景: dbtを使っていてもER図は欲しい! dbtはモデル間のリネージなど可視化が得意なツールではありますが、万能なわけではありません。モデルの生成過程などはリネージで担保できますが、分析時に「どれとどのモデルがJOINできて、JOINする際のキーはこれを使って」というER図で扱うような可視化はディフォルトではできません。 DWHを作っている側からすると「このテーブルはあの辺のテーブルと一緒に使うと便利で、いつもあのキーでJOINして」というのが頭の中に入っていることが多いため、ER図がなくてもどうにかなることも多いでしょう。しかし、分析に慣れていない人や分析に慣れている人であっても、普段と異なるドメインのテーブルを触るときはER図が提供してくれる情報は有用です。ちなみに

    dbtで見やすいER図を生成する - yasuhisa's blog
  • Why use both LookML and ELT tools in your data analytics stack | Google Cloud Blog

    masutaka26
    masutaka26 2024/02/03
    dbt や Dataform などの ELT ツールに加えて、LookML がなぜ必要なのか?最後に両者の得意なことの比較あり
  • GA4もSnowflakeで分析する時代がついに来たぞ!

    2024年1月29日、GA4とSnowflakeの公式コネクタがリリース(プレビュー)されました。 ついに、GA4もSnowflakeで分析する時代がやってきました。 GA4×Snowflakeの組み合わせがやっとプロダクション運用可能なレベルに到達したのです。 これは今回のコネクタリリースでGA4のプロパティ取り込みパイプラインの運用コストが圧倒的に下がったことに起因します。 公式コネクタのリリース以前からGA4をSnowflakeに取り込むことは可能でしたが、その運用を継続することは様々な観点から困難でした。 この記事では、従来の取り込みソリューションと、最新の公式コネクタを比較して4つの観点から素晴らしい部分を解説します。 GA4のデータの取り込みが容易になった 取り込み後のデータの冗長な変換が不要になった 取り込みの金銭的コストが圧倒的に低くなった GA4のデータ取り込みに公式サポ

    GA4もSnowflakeで分析する時代がついに来たぞ!
  • DWHにおけるデータモデリングで大事にしている考え方 

    こんにちは。データエンジニアリングの支援を行っているstable株式会社の代表の宮﨑(@ikki_mz)です。弊社では、クライアント社内のデータウェアハウス(DWH)におけるデータモデリングをサポート...

    DWHにおけるデータモデリングで大事にしている考え方 
  • Googleドライブの共有設定で「リンクを知っている全員」を選択できなくする方法|kaze

    はじめに共有リンクは正しく使うことができれば便利な機能です。 ただし、リンク先の内容が公開されるとまずい情報であった場合には情報漏洩のきっかけとなってしまう場合があります。 情報セキュリティの観点では、アクセス権を必要最小限で割り当てるのが望ましいとされています。これを、最小権限の原則といいます。 概要Google Workspaceの管理者として後述する設定を実施することで、ユーザーにGoogleドライブ内のファイルをウェブ上へ公開できないように制限をします。 具体的には、共有リンクを作成する際に「リンクを知っている全員」という選択肢を非表示にすることができます。 結果として、メールアドレスを指定して外部共有することは可能で、組織外の不特定多数がアクセス可能な共有リンクは作成できないという環境を作れます。 設定方法1. Google 管理コンソールにログインします。 2. 管理コンソール

    Googleドライブの共有設定で「リンクを知っている全員」を選択できなくする方法|kaze
  • 濁点の合成文字がソースコードに入っちまった💢 -> gitのpre-commit hookで打ち勝った ·

    濁点文字をソースコードに入れてしまって不具合を起こしてしまうということがありました。 自分の書いたカタカナの濁点が合成文字になってて(バ= ハ+゛みたいなやつ)そのバグに気づかなくて30分ぐらい無駄にしたアカウントです — hoshinotsuyoshi🥴 (@hoppiestar) July 23, 2018 なんという不覚。。 githubで見ても手元のvimで見ても見た目上は全く違いがわからんという状態。 いや、見た目でわかると思ったんですけどね� ちょっと以下3つの「バ」を見てください。 濁点アリの1文字「バ」 U+30D0 KATAKANA LETTER BA バ これが普通のバ。 2文字「ハ」+「゛」 U+30CF KATAKANA LETTER HA U+309B KATAKANA-HIRAGANA VOICED SOUND MARK ハ゛ 👆くっつきかたが、ちょっと不自

    濁点の合成文字がソースコードに入っちまった💢 -> gitのpre-commit hookで打ち勝った ·
  • 『伝 阿弖流為 母禮之塚』-由緒不詳の首塚に生まれた虚構の伝承|makishi

    偽史、フェイクロア、創られた伝統といった背景を持つ場所や存在を、現実と妄想が交差する「特異点」と捉え撮影する記事。今回は、大阪府枚方市にある『伝 阿弖流為 母禮之塚』(通称アテルイの首塚)を取り上げる。 阿弖流為(アテルイ)と母禮(モレ)アテルイとは、8世紀末から9世紀初頭に、陸奥国胆沢(現在の岩手県奥州市)で活動した蝦夷(えみし)の族長である。モレとは、アテルイと同時期に蝦夷の族長の一人であったとみられている。 蝦夷とは、州東部や以北に居住し、政治的・文化的に、大和朝廷やその支配下に入った地域への帰属や同化を拒否していた集団を指す。 蝦夷は、時の朝廷の国土統治にあたり派遣された征討部隊に、激しい抵抗を繰り返していた。しかし、朝廷の戦力に圧され、いよいよ進退窮まった蝦夷は(諸説あるが)、802年、アテルイとモレが同族5百余人を引き連れ、征夷大将軍坂上田村麻呂の下に降伏した。その後坂上田村

    『伝 阿弖流為 母禮之塚』-由緒不詳の首塚に生まれた虚構の伝承|makishi
    masutaka26
    masutaka26 2024/01/30
    清水寺の石碑は偽物?と思って読み始めたら、、なかなか興味深いですね
  • Airflowのコンセプトと仕組みを理解する | DevelopersIO

    春田です。 Airflowを活用したプロジェクトに携わる事になったのですが今回初めて触れる形となるため、まずはAirflowに関する概要を勉強しながらまとめてみました。 Airflowとは The Airflow Platform is a tool for describing, executing, and monitoring workflows. Airflowは、ワークフロー(例えば、A B Cという3つのタスクがあった時、これらをいつどの順番で実行するか)を記述、実行、監視するためのツールです。 このAirflowは DAG (Directed Acyclic Graph: 有向非巡回グラフ) というグラフ理論がベースになっています。私自身、グラフ理論にあまり精通していないのため、自分でも理解できるように噛み砕いた言葉で説明していきます。 DAG (Directed Acycl

    Airflowのコンセプトと仕組みを理解する | DevelopersIO
    masutaka26
    masutaka26 2024/01/29
    “DAGはグラフ理論の一種で、エッジのベクトルは一方向のみで、さらに一度通ったノードには戻ってこれないという非巡回性の特徴を持っています”
  • Observability Conference 2022に登壇: データ分析基盤におけるオブザーバビリティの取り組み - Pepabo Tech Portal

    こんにちは、データ基盤チームのまつもとです。先月開催されたObservability Conference 2022に登壇しましたので、お話した内容を簡単に紹介して登壇について振り返ります。 Observability Conference 2022 Observability Conferenceは、オブザーバビリティ(可観測性)に特化したテックカンファレンスです。オブザーバビリティとは何かについて簡単に説明しておくと、「いつ、どこで、なにが起きているかを観測が可能である」という性質のことをいいます。複雑かつ動的にスケールをする分散システムにおいては、オブザーバビリティを備えることでシステムの状態をより正確に把握できます。そのため、障害の検知や原因の特定を効率的に行えるようになるだけでなく、キャパシティ計画やパフォーマンス計画の推進にも役立ちます。 このカンファレンスでは、主にDevOp

    Observability Conference 2022に登壇: データ分析基盤におけるオブザーバビリティの取り組み - Pepabo Tech Portal
  • Terraform だけを使って GitHub Actions OIDC ID プロパイダの thumbprint を計算する方法

    GitHub Actions が提供する ID プロパイダのルート証明書が変更されて、OIDC を使った AWS への認証が通らなくなるという現象が起こりました。 ドキュメントや多くのブログでは AWS 側の ID プロパイダに渡す thumbprint として固定値 a031c46782e6e6c662c2c87c76da9aa62ccabd8e が指定されていたので、新しい thumbprint を計算して更新する対応を迫られた方が多いのではないかと思います。 計算自体は上記公式ドキュメントに載っている通りに行えば問題ありませんが、せっかくなので Terraform だけを使って自動で thumbprint を取得する方法を紹介します。 なお、Terraform の実行結果は2022年1月13日時点のものです。 Terraform コード data "http" "github_act

    Terraform だけを使って GitHub Actions OIDC ID プロパイダの thumbprint を計算する方法
  • GitHub Actions から AWS へのアクセスに利用している OpenID Connect ID Provider の thumbprint について調査した - ROUTE06 Tech Blog

    ROUTE06 でエンジニアリングマネージャ兼ソフトウェアエンジニアとして働いております海老沢 (@satococoa) と申します。 先日発生した GitHub Actions と AWS の OpenID Connect 連携におけるトラブルに関して調査を行い、対応方針を策定した件を共有したいと思います。 [2023/07/10 追記] Thumbprint を明示的にユーザ側で設定しなくて良いように、AWS 側で対応されたそうです。 github.com 当面 Terraform のモジュール的には必須入力のままですが、任意の文字列で良いそうです。 (いずれ入力も不要になるのかと思います。) https://github.com/aws-actions/configure-aws-credentials/issues/357#issuecomment-1626357333 The A

    GitHub Actions から AWS へのアクセスに利用している OpenID Connect ID Provider の thumbprint について調査した - ROUTE06 Tech Blog
  • チームの機能と配備を考えるための7つのチーム責務定義ガイドライン - mtx2s’s blog

    前回の記事ではチーム中心の組織づくりの設計原則について書いた。今回は、それらの原則に基づくチームをソフトウェアプロダクト組織内にどう配備し、どのような機能を持たせるかについて考える。これは言わば、チームの責務を定義することに他ならない。記事ではこれを、7つのガイドラインとして書き出してみることにした。 前回の記事:『チーム中心の組織作りのための6つのチーム設計原則 - mtx2s’s blog』 mtx2s.hatenablog.com 1. ストリームアラインド 2. オーナーシップ制 3. バリエーション分割 4. 技術横断型 5. DevOps 6. 機能横断型 7. マルチスキル 組織設計とはアーキテクティングである 1. ストリームアラインド ソフトウェアプロダクト組織の開発フローは、ユーザーや市場の観察をもとにアイデアを生み出すことから始まる。そのアイデアを仮説として、それを

    チームの機能と配備を考えるための7つのチーム責務定義ガイドライン - mtx2s’s blog
    masutaka26
    masutaka26 2024/01/19
    “このようなケースにおいては、ストリームの流量に着目してチームを配備することになる”
  • mise (旧 rtx) で脱 node-build (asdf)

    年明けはまず環境整備から、ということで今年は mise を導入することにした。 去年まで rtx とか rtx-cli という名前でやってた Rust 実装の asdf 代替の多用途バージョン管理ツール。この年明けに急に mise にリネームしたよ、というニュースが流れてきて、気になって見てみたら良さそうだった。 一般的な解説は "rtx" でググると日語記事も出てくるのでそっちを見て欲しいけど、個人的な asdf に対するメリットはこのあたり。 とにかく速い asdf は Node の最新バージョンの反映が node-build 依存で、更新が数日遅れることがあった 結果的に手動で定義ファイルを更新していたが、処理速度も遅く面倒だった 参考: asdf で node-build の定義ファイルを手動更新する asdf はコマンド体系が謎だった(自分には) 例えば v20 系の最新をイン

    mise (旧 rtx) で脱 node-build (asdf)
  • 最近気に入っているOSSを淡々と紹介する

    はじめに こんにちは〜!皆様いかがお過ごしでしょうか? no plan inc. CTOの @serinuntius です。 これはno plan inc.の Advent Calendar 2023の22日目の記事です。 最近気に入っているOSSとかを作者様に感謝しながら、スターを送りながら、こんなのを使用してるぜって紹介する記事です。 「OSSは使っていることを公言するだけでも貢献になる」とsongmuさんが言っていたので、私も貢献したいと思います。 紹介する順番に特に意味はありません。 rtx 個人的お気に入り度: ★★★★★ スター数: 3700 Rustで作られている💯 LICENSE: MIT 初っ端は、rtxです。あらゆるプログラミング言語環境(Runtime)のマネージャーです。 公式のデモ画像を見ていただくのが一番早いと思います。 私はこれを使う前はanyenvというも

    最近気に入っているOSSを淡々と紹介する
  • 源泉徴収票の見方を図解で説明【令和5年(2023年)分】 詳しく解説! 1分でも分かる!

    源泉徴収票の見方を図解で説明【令和5年(2023年)分】 詳しく解説! 1分でも分かる!
  • 読字に困難「ディスレクシア」に読みやすい「UDフォント」広がる

    文字が崩れて見える「ディスレクシア」という症状を抱える人がいます。そうした人にも見やすい「フォント」の文字の利用が広がっています。 「ディスレクシア」の大学生・西川幹之佑さん(20):「あー見づらいですね。あー細いな…」 東京都内の大学に通う西川幹之佑さんは、文字が崩れて見えるディスレクシアという症状があります。 ディスレクシアは学習障害の一つで、文字を素早く理解することができないということです。 西川さんの場合、「山」という漢字は縦線3に見え、「返」という字は細い線が消えているように認識されることもあるそうです。 また、文字のバランスが取れていないように感じて気分を悪くすることもあるといいます。 「ディスレクシア」の大学生・西川幹之佑さん:「(小学生の頃は)読み取るのが精いっぱい。1ページ(読む)だけで授業1回分(約45分)です」 文字を理解するのが難しいと文字を覚えて書くことも難しく

    読字に困難「ディスレクシア」に読みやすい「UDフォント」広がる
    masutaka26
    masutaka26 2024/01/15
    知らなかった "文字が崩れて見える「ディスレクシア」という症状を抱える人がいます"