東京の西側でロハスに暮らす

雑食系ブログです

AWS S3とAzure Datalake gen2 の比較

AWSとAzureのどちらを使おう(オブジェクトストレージ)

二大パブリッククラウドは、AWSとAzureです。様々意見あるかと思いますが、パブリッククラウドが持ち、オンプレミスの持たないサービスの代表格はオブジェクトストレージです。同時に、パブリッククラウドでシステムを組む際、オブジェクトストレージはストレージ、データハブ、バックアップ、IF、公開サーバと多彩な役割を果たします。まさにパブリッククラウドの要といってよいでしょう。

 

AWSではS3、Azureでは複数存在しBlob,Datalake, Datalake Gen2と多彩です。

では、パブリッククラウドの要であるS3と Datalake Gen2はどのような差があるのでしょうか。

 

AWS S3とAzure Datalake Gen2の比較

簡易的ですが比較表を掲載します。結構おなじかと思いきや、Datalake Gen2には怪しげな言葉が並びます。

ファイルパーミッションは,747等いわゆるPOSIX風の設定ができるかという事です。

f:id:t264d:20190510215343j:plain

階層的名前空間とは?

簡単にいうと、フォルダです。S3は、フォルダが存在しないのです。フォルダにみせかけたからファイルと同じと思っていただければOKです。

 

f:id:t264d:20190510215639j:plain

 

ファイルリネーム等が多けれAzure。大体はAWS S3で十分

オブジェクトストレージのみでパブリッククラウドを選定する事はないと思いますが、

観点に加えるとすれば、ファイルリネーム等が多けれAzureです。ただしそのようなバッチワークロードもそれほど頻繁にあるわけではないと思います。大体はAWS S3で十分と思っています。