東京の西側でロハスに暮らす

雑食系ブログです

Redshiftしか勝たん!①  DWHとAI、ついに融合す

DBエンジニアがAI技術者の夢を見る

AIがITのメインストーリムに来る少し前の2018年くらい、世のDBエンジニアはこう思っていました。

 

「AIはデータでの学習・推論が命。データといえばDB。しかしSQLとAIは一緒に使えそうな、使えなさそうな、、。DBとAIが融合されればDBエンジニアの仕事の幅も増えそうだが、、果たしてどうなるのか」

 

その後、OracleMicrosoftから自社のDBエンジンにAIを組み込んだ製品が発売されますが、中身としては従来のSQL Server からPythonコマンドを立てけるだけ、、といったとってつけた感がすごくて、流行しませんでした。

 

そして、学習=フルスキャンという性質からAIではDBというよりもストレージを中心としたアーキテクチャが多く発表されました。

AWSでいうと、SageMaker+Lustreのようなアーキテクチャです。

 

でもこれはPythonを使えないとコーディングできないので、前述したような

「DBエンジニアがAI技術者の夢を見る」

事は困難だったのです。

 

Redshift MLデビュー

最近、「SQL機械学習の学習と推論を行う」という、夢のような機能がでました。

はい、Refshiftです。さすが、研究開発4兆円企業です。

aws.amazon.com

 

 

実際に使ってみた

というわけで、やってみました。AWSのサンプルのままですが

docs.aws.amazon.com

 

詳細の手順は上記通り。

で、実際やった結果とその考察がこちら。

f:id:t264d:20210315222954j:plain

 

もう、一言でいうと素晴らしいの一言。

ただし、実行時間が少しおそかったような、、いくつものアルゴリズム学習をするから仕方ないのか。

また、同僚からは「精度はみれないのか」との指摘。裏で動いているSageMakerをみれば確認できるようですが、SQLコマンド一発で精度まで取得できればさらにいいと思います。

 

まだプレビューなので、GAに期待です。