MARが同期済み行の総計より優れた指標である理由
製品
MARが同期済み行の総計より優れた指標である理由
2023年3月2日
コリーヌ・ハランダー
Fivetran
シニアプロダクトマーケティングマネージャー
トピック
シェア
月間アクティブ行数を使用すると、データ専門家とあらゆる規模のビジネスが、Fivetranの価値を最大限に利用できます。
Fivetranの消費ベースモデルでは、すべてのコネクタ(ソース)とデスティネーション(ターゲット)の月間アクティブ行数(MAR, Monthly Active Rows)に基づいて使用量を算出します。この記事では、MARとは何か、また当社はなぜMARがお客様にとってFivetranの価値を最大化するより良い方法であるかについてご説明します。
月間アクティブ行数とは
月間アクティブ行数(MAR)とは、コネクタによりデータデスティネーションで追加、更新、削除された行のことです。アクティブな行数は、更新ごとではなく月に一度のみ確認します。つまり、1ヶ月の間に何度同じ行を更新しても追加料金は発生しません。新規でコネクタやテーブルを購入されたお客様の最初の履歴同期はいつでも完全無料で、請求が発生するのはMAR(月間アクティブ行数)の分のみです。
MARの使用に伴い、Fivetranの価格モデルはお客様にとって最も価値のあるものとなるよう独自に設計されています。その理由を以下に説明します。
アクティブ行数とパイプラインの効率性
300を超えるFivetranのコネクタは、データソースの変更を効率的にキャプチャし、可能な限り増分UPSERTを実行するように設計されています。 この方法で算出されるアクティブ行数は、一般的なパイプラインで見られる同期された行の合計よりも5~50倍少なくなります。個別の行ではなく必要なデータのみを複製するため、最終的にクラウドのデスティネーションの管理コストの削減につながります。
同期済み行の総計と余分な更新
月間アクティブ行数は、お客様のパイプラインに表示される同期済み行の総計とは一致しません。これは、一般的なパイプラインの場合、更新されなかった行が繰り返し同期されることにより余分な更新が発生するためです。余分な更新が発生する経緯は以下のとおりです。
-
複数の行の更新: 一意の主キーで定義された1つの行は、1ヶ月の間に複数回更新できます。列は1ヶ月の間に数回更新されますが、更新はそのたびに、同期された行としてカウントされます。これは月平均5回程度発生します。
-
余分なスナップショット: これは、実際には更新されていない主キーが同期された場合に発生します(例:スナップショットを使用してテーブルを複製した場合など)。更新のキャプチャは難しいため、多くのお客様は、毎回すべての行を同期させるスナップショットアプローチを採用します。この発生頻度は、一般的に平均10~20回程度です。
データパイプラインは増分の変更を効果的に処理するよう作られていないため、1ヶ月または数年の間で、一般的にかなりの無駄が生じることがわかります。
無料電子書籍:あなたのビジネスに最適な、費用対効果の高いデータパイプラインの選び方
MARと同期済み行の総計の比較計算
MARと同期済み行の総計との違いがおわかりいただけたところで、同じデータ量でどれほどの違いが出るか計算します。MARを推定する際には、2つの要素を考慮する必要があります。
-
保存行数: 保存行数とは、データソースの主キーの総数です
-
更新率: 更新率とは、ソースの主キーのうち、1ヶ月に1回以上更新または追加されたキーの割合です。
MARの算出方法: 保存行数合計×更新率(%) = MAR
例えば、保存行数が1,000万行、更新率が10%のデータベースでは、以下のようにMARが算出されます:
10,000,000×10%=100万MAR
一般的な更新率(つまりMAR)はどの程度か?
すべてに万能なソリューションというものはありません。ソースもビジネスも、1つとして同じものはないためです。アプリケーションソースの更新率は通常10~20%ですが、データベースの更新率は通常5~10%、非常に古いデータベースでは1~2%程度になることもあります。
以下では、コネクタ総数、総行数、MAR、推定総所有コストが異なるお客様がそのようなパイプラインを自社で構築した場合の事例をご紹介します:
会社の種類 |
コネクタ数 |
総行数 |
有料MAR |
総所有コスト* |
初期段階スタートアップ |
9 |
280万行 |
467,000行 |
382,500ドル |
成長段階 |
6 |
2億3,780万行 |
1,400万行 |
255,000ドル |
事業 |
555 |
210億行 |
80億行 |
100万ドル |
*値は概算です。パイプライン構築の総所有コストは、Fivetranの 「Ultimate guide to data integration(データ統合への最終ガイド)」にてご自身で試算していただくか、より正確なお見積りを希望される場合はsales@fivetran.comまでご連絡ください。
最終的には、Fivetranのお客様は過去の行を何百万、何千万と複製してもすべて無料ということになります。変更された行に対してのみお支払いが発生しますが、行の構築コストから考えるとその金額はごくわずかです。
「より多くのソース、そしてソース内でもよりリッチ化されたデータへのアクセスが可能となりました。例えば、FivetranはHubSpotから履歴テーブルをインポートします。以前であれば、何百万行にも及ぶ過去データの調査は簡単には行えませんでした。このデータを統合するために、Fivetranの代わりに人を雇うとしたら、約3名のデータエンジニアをフルタイムで稼働させる必要があるでしょう。」
-Pleo社プロダクトマネージャー、ジェイコブ・クリステンセン氏