AWS S3とAzure Datalake gen2 の比較
AWSとAzureのどちらを使おう(オブジェクトストレージ)
二大パブリッククラウドは、AWSとAzureです。様々意見あるかと思いますが、パブリッククラウドが持ち、オンプレミスの持たないサービスの代表格はオブジェクトストレージです。同時に、パブリッククラウドでシステムを組む際、オブジェクトストレージはストレージ、データハブ、バックアップ、IF、公開サーバと多彩な役割を果たします。まさにパブリッククラウドの要といってよいでしょう。
AWSではS3、Azureでは複数存在しBlob,Datalake, Datalake Gen2と多彩です。
では、パブリッククラウドの要であるS3と Datalake Gen2はどのような差があるのでしょうか。
AWS S3とAzure Datalake Gen2の比較
簡易的ですが比較表を掲載します。結構おなじかと思いきや、Datalake Gen2には怪しげな言葉が並びます。
ファイルパーミッションは,747等いわゆるPOSIX風の設定ができるかという事です。
階層的名前空間とは?
簡単にいうと、フォルダです。S3は、フォルダが存在しないのです。フォルダにみせかけたからファイルと同じと思っていただければOKです。
ファイルリネーム等が多けれAzure。大体はAWS S3で十分
オブジェクトストレージのみでパブリッククラウドを選定する事はないと思いますが、
観点に加えるとすれば、ファイルリネーム等が多けれAzureです。ただしそのようなバッチワークロードもそれほど頻繁にあるわけではないと思います。大体はAWS S3で十分と思っています。