ReInvent2021 待望のRedshiftServerlessを深堀
RedshiftServerless爆誕
ReInvent2021にてRedshiftServerlessが発表されました。待望のserverless製品です。
RedshiftはこれまでもRedshift Spectrumを出していましたが、今回のServerlessはどのように違うのでしょうか。また、同じserverlessであるAhtenaとはどのように異なるのでしょうか。
机上調査
Redshift ServerlessはDWH製品らしくRDBMSライクに高性能・多機能に使えます。
Ahtenaは多様なデータを簡易に探索できる事が強みに見えます。
とりあえず回してみる
ということで、下記の構成にて比較検討してみました。
性能結果はこちらです。概ね、RedshiftServerless>Ahtenaですが、注目に値するのは、2回目以降のRedshift Serverlessの速さです。
Amazonの見解を見てみる
Amazonのには下記です。確かに、上記調査や試行を結果を裏付けるような記載です。
Redshift では、これらのクエリを非構造化データ用に最適化されているクエリサービスと比べて最大 20 倍高速で実行します。非常に大規模な多数のテーブル間で多数の結合がある、高度に構造化されたデータに対してクエリを実行する必要がある場合は、Amazon Redshift をお勧めします。
これに対して、Amazon Athena のようなクエリサービスを使用すると、データの形式化やインフラストラクチャの管理について心配することなく、Amazon S3 のデータに対して直接インタラクティブにクエリを実行できます。例えば、Athena は、一部のウェブログですばやくクエリを実行し、サイトのパフォーマンス問題のトラブルシューティングのみが必要とされる場合に適しています。クエリサービスを使用すると、迅速に開始できます。データのテーブルを定義し、標準 SQL を使用してクエリを開始するのみです
https://aws.amazon.com/jp/athena/faqs/
結論 Redshift Serverlessしか勝たん
Redshift ServerlessはRedshiftを使ってきた人にとっては、最高です。Query Editor v2もかなり使いやすいです。(TPCDS,TPCHのテストデータがついたのも、地味に良い)
Redshift Serverlessは他のクラウドDWH製品を明らかに意識した作りであり、部分的な優劣は見られますが、これまでの弱点を解消し、真打ち登場といった感じです。
はやくGAしてほしいです!