本記事ではデータパイプラインにおいてべき等性(Idempotent)を保つための方法について、パターン分けして整理してみたいと思います。 1. はじめに データパイプラインでは べき等性(Idempotent)と言われる「ある操作を何度実施しても同じ結果になる」という条件を満たすことが好ましいと言われています。 ただし、べき等性を満たすためには具体的にどうすれば良いかというのは結構難しいので、自分の頭の整理も兼ねてパターンに分けて考えてみたいと思います。 単純化のために操作を1回実行した結果と2回実行した場合を考えたいと思います。 同じ状態(上図の「初期状態」)から操作を1回実行した場合と2回実行した場合の結果の状態(それぞれ「状態X」「状態Y」)が同じであれば、べき等性を実現できていると本記事では考えます。 1回実行時の操作 (A) と2回実行した場合の2回目の操作 (C) は、正しい入