tr?id=1970953653177752&ev=PageView&noscript=1

クラウドデータウェアハウスとは?2020年にデカコーン入りしたSnowflakeの特徴と今後

クラウドデータウェアハウスとは?2020年にデカコーン入りしたSnowflakeの特徴と今後

554view

2020/07/31

クラウドデータウェアハウスを提供する注目のスタートアップSnowflakeが、2020年2月に4億9,900万ドル(約534億円)を調達し、評価額が124億ドル(約1兆3,276億円)となり、デカコーン入りした。また時を同じくして、AWSで東京リージョンのサービスを開始。これにより、日本国内にデータベースを配置できるようになった。同年6月には、上場申請に向けた動きが報じられており、今後のビジネス拡大が期待される。

本稿では、クラウドデータウェアハウスとはなにか、そしてアマゾン、マイクロソフト、グーグル各社と連携しながら成長を続ける、Snowflake社を紹介する。

クラウドデータウェアハウスとは

データウェアハウス (Data Warehouse = DWH、以下DWH) とは「データ倉庫」という意味だ。

DWHには「集約・格納」と「抽出・分析」の2つの機能がある。まず、企業活動で蓄積された売上データ・在庫データ・顧客データなど数年単位の大量のデータを、時系列に集約して格納する。次に、ユーザーのニーズに応じて、格納されたデータから必要な情報を高速で抽出し分析する。

DWHは社内だけではなく社外に存在するさまざまな情報源からもデータを収集するので、異なるデータベースにある情報の相関関係の分析に役立つ。例えば、雨の日の午前中にコンビニで売れる商品の分析にあたり、天気や時間帯、売れた商品など複数のデータを突き合わせることが可能になる。

従来、DWHは企業内のサーバに格納されていたが、今日ではクラウド上に構築されたDWHを、いわゆるSaaS(必要な機能を必要な分だけインターネット経由でサービスとして利用できるソフトウェアのこと)として利用するようになってきている。それがクラウドDWHだ。

企業がクラウドDWHを利用する理由はさまざまある。ひとつは、設備投資や電力、さらには維持管理や保守、セキュリティ対策などに要するコストだ。

クラウドDWHでは、基本的にこれらのコストがすべてSaaSの利用料金に含まれている。使った分を支払う従量課金のため、コスト削減が実現する。

また、ユーザーにとって最適なシステムになるよう柔軟に構成できるので、サーバ格納形式のDWHと比較してデータの処理スピードもアップする。そのため、ユーザー企業がタイミングを逃さず経営上の意思決定をする際に非常に役に立つ。

代表的なクラウドデータウェアハウスサービス

アマゾン、マイクロソフト、グーグルの各社では、以下のクラウドDWHを提供している。

Amazon Redshift

20200731_02.png
(画像出典:Amazon Redshiftウェブサイト

Amazon Redshift は、AmazonのAWS(Amazon.comにより提供されているクラウドコンピューティングサービス)上で動作するクラウドDWHだ。

Amazon Redshift のクライアントには、Pfizer、マクドナルド、Intuit、SIEMENS、Nasdaq、Financial Times、ジョンソン&ジョンソンなどの他、Pinterestやcoinbase、Grabなどのスタートアップ、日本企業ではANAやNTTドコモなどが名を連ねている。

Azure Synapse Analytics(旧Azure SQL Data Warehouse)

20200731_03.png
(画像出典:Azure Synapse Analyticsウェブサイト

2015年以来、Microsoft が Azure SQL Data Warehouseとして提供していたクラウドDWHを、2019年11月、新機能とともに次世代型としてリリースしたのが Azure Synapse Analyticsだ。

Azure Synapse Analytics は IT系のメディア企業である米GigaOmの分析フィールドテストにおいて、Amazon Redshift と比較して最大で 46% 、後述のGoogle BigQuery より最大で 94% 少ないコストパフォーマンスを記録している。

ユニリーバ、ドイツ銀行、米Newell Brandsなどが採用している。

Google BigQuery

20200731_04.jpg
(画像出典:Google BigQueryウェブサイト

Google BigQueryはGoogle 社が独自開発したクラウドDWHだ。元々、 Google 社内のデータ解析ツールであったDremelを一般に公開した。

UPS、ダウ・ジョーンズ、20世紀フォックスなどに導入されている。

そして、これらの大手クラウドDWHと肩を並べて、今、注目なのが米Snowflake社だ。

膨大なデータ処理を高速で実行するSnowflake

Snowflake社は米国カリフォルニア州サン・マテオの本社の他、ニューヨーク、ロンドン、シドニー、シンガポールなどに支社を構え、グローバルにクラウドDWHサービスを展開している企業だ。創業は2012年で社員数は1,700名を超える。日本法人は、2019年11月に設立された。前述の2月の資金調達を含め、過去に8回の調達ラウンドを実施し、総額14億ドル(約1,497億円)を調達している。

世界中の3,000社以上の企業が同社のサービスを導入しており、日本では楽天、 アシックス、ソニー・ピクチャーズ・エンタテインメントなどが名を連ねる。

ITリサーチ企業である米ガートナー社が発表した2019年版アナリティクス向けデータ管理ソリューション・マジック・クアドラント(Data Management Solutions for Analytics Magic Quadrant)レポートは、ビジョンを実行しており、将来のポジションを確立している「リーダー」として同社を評価している。
マジック・クアドラントは、特定のテクノロジー市場における競合ベンダーの相対的な位置づけを、実行能力とビジョンの完全性の観点から評価し、「リーダー」「ビジョナリー」「ニッチ」「チャレンジャー」の4つに分類するものだ。

Snowflakeの強み

20200731_05-1.png
(画像出典:Snowflakeウェブサイト

クラウドデータウェアハウスであるSnowflakeは、アマゾンの「Amazon Web Services」(AWS)、マイクロソフトの「Microsoft Azure」、そしてグーグルの「Google Cloud Storage」と競合するように見えるが、いずれのクラウドストレージ環境においても稼働することを考えると、Snowflakeはこの3社と共存しているとも言える。

Snowflakeはコンピュートリソース(仮想サーバを作成するためのCPU、メモリー、ディスクの組み合わせによる仮想的な機器)とストレージリソースを分離しているため、負荷を分散して同時に複数のデータ処理ができる。各社のストレージを利用してデータベースを持ちながら、複雑な分析処理を別のリソースを利用して高速で実行することを可能にしているのがSnowflakeだ。

コンピュートリソースは必要な時に必要なだけ利用することができる上に、システムを停止しなくてもサーバの能力を増強したり、複数のサーバに分散・拡張したりできる。オートスケール機能により、増減する同時アクセスにも柔軟に対応することも可能だ。

20200731_05.jpg
(画像出典:Snowflakeウェブサイト

また、複数のクラウドにまたがってデータをレプリケーション(データベースを別のデータベースに複製して同期する機能)することもできる。

そのため、特定のクラウドプロバイダー(クラウドベースのプラットフォームやインフラ、アプリケーション、ストレージサービスを提供する企業)に障害が発生した場合でも中断なくサービスを継続できる。

さらにSnowflakeでは、ETL・ELT(データを効率良く分析処理する形式)やBI(ビジネスインテリジェンス)、ML(機械学習)といったツールを提供するテクノロジー企業との強固なエコシステムにより、各ツールに直接接続することで分析に関わる処理パフォーマンスを最適化できる。つまり、ユーザー企業が利用している既存のツールをそのまま利用可能なので、導入の際のハードルも低い。

Snowflakeの導入事例

Snowflakeは、金融、テクノロジー、ヘルスケア、メディア、広告など、あらゆる業種の企業にクラウドDWHを提供している。以下にその事例を紹介する。

金融サービス:Capital One

20200731_06.png
(画像出典:Capital One ウェブサイト

Capital Oneは、複数のチャネルを通じてさまざまな金融商品およびサービスを提供する金融持株会社だ。アメリカ大西洋岸地域を中心に、クレジットカード事業、インターネットバンキングや融資などの金融サービス提供を行っている。

同社内で運用されていた既存のDWHでは、膨大なデータ量が原因で分析サイクルが遅くなり、処理能力の問題から限られたユーザーしかデータにアクセスできないという課題を抱えていた。さらにセキュリティ対策においても手動でツールを組み込む必要があった。

ところがSnowflakeの導入により、パフォーマンスが4~6倍に向上したとされる。まず、いつでもすべてのユーザーのあらゆる操作が可能になった。また、複雑なデータ処理をすばやく実行してタイムリーな回答を取得し、データに基づいた意思決定を下すことができるようになった。

さらに、Snowflakeに実装済みのセキュリティ機能を使用することでメンテナンスの負担を軽減し、従量制の料金体系なので運用コストも削減できた。同社のクラウドへのデジタルトランスフォーメーションを大きく前進させた。

医療サービス:hc1

20200731_07.png
(画像出典:hc1ウェブサイト

hc1は、米イリノイ州インディアナポリスの生命情報科学企業だ。同社は、1億6,000万人の患者と190億件の臨床データの処理から得たHL7データ(保健医療情報交換のための標準規格に基づくデータ)を単一のクラウドデータベースに取り込み、整理して、精密なテストと処方を可能にする高価値の医療サービスを提供している。そのhc1がSnowflakeを使用して新型コロナウィルス(COVID-19、以下COVID-19)の臨床試験のためのダッシュボードを10日間で構築した。

米国で最初に確認されたCOVID-19の症例について学習した後、同社は匿名の血液検査の分析や顧客の行動測定をテストした。その結果、チームは格納されたテストデータが役立つ可能性があることに気付いた。

そこで、全国の20,000ヶ所以上の地域におけるテスト結果を追跡調査した。そして、公衆衛生当局、政府機関、および医療従事者にほぼリアルタイムにインサイトを提供し医療現場をサポートするために、同社はCOVID-19の臨床試験ダッシュボードの開発を開始した。

Snowflakeのマルチクラスタ共有データアーキテクチャ(パフォーマンスを低下させることなくデータを無制限に同時処理する構造)により、HIPAA法(Health Insurance Portability and Accountability Act 、医療保険の相互運用性と説明責任に関する法律)に準拠した情報源にhc1のすべての顧客データを含め、10日で「COVID-19臨床試験ダッシュボード」が完成した。

地域の医療機関は「COVID-19臨床試験ダッシュボード」を活用し、国、州、郡レベルでCOVID-19感染率を追跡。試験の結果が確認されてから数時間以内に感染者の数や地域などのデータが提供されるため、局所的な大規模感染の前に、医療機器などの必要なリソースを迅速に展開できる。

また「COVID-19臨床試験ダッシュボード」は、ソーシャルディスタンスの影響を数値化し安全性を確認することにも役立つ。「人々は家から出ても安全かどうかを知りたい。このツールは、複雑な決定をするために実証的な証拠を以ってサポートする」とhc1のCharls Clarke氏は語った。Snowflakeは、まさに人々の生命に関わるところでもその能力を発揮している。

教育機関:ノートルダム大学

20200731_08.png
(画像出典:ノートルダム大学ウェブサイト

ノートルダム大学は、米インディアナ州近郊にあるカトリック教会創設の名門私立大学。1842年にエドワード・ソリンによって創設された。

同学ではDWHを使用して、大学の135,000人の同窓生を対象に寄付金への関心を高めるキャンペーンを実施する地域活動を支援していた。そのために、さまざまなソースのデータを単一のデータベースに集約して保管する必要があった。また、ピーク時には同時に最大100人のユーザーに迅速にアクセスしなければならなかった。

同学は、それまで学内に設置されていたDWHからクラウドDWHのSnowflakeに移行することで、サーバの処理能力を増強し、複数のサーバに分散・拡張することが可能になった。

データ処理に要する時間は30分から1分未満に短縮され、パフォーマンスを低下させることなく最大100人のユーザーに同時に対応できるようになった上、データを取り込むプロセスを簡略化でき、メンテナンスコストを劇的に削減した。

同学は今後、学生データベースの管理やデータ処理用のアプリケーションの追加のためにクラウドDWHの拡張を続け、学生のニーズに積極的に対応していくとしている。

業界での連携と気になる今後の動向

Snowflakeは、米政府の「オープンデータ法」(データの使用および管理を拡張し、透明性、効率的なガバナンス、イノベーションを推進することを義務付けること)に則り、政府機関にもクラウドDWHを提供している。

また冒頭で述べた資金調達においては、米投資会社のDragoneer Investment Groupと米Salesforce系ベンチャーキャピタルのSalesforce Venturesがラウンドを共同でリードしたが、同時にSalesforceとのパートナーシップも締結した。

ベンチャー企業の情報データベースである米Crunchbaseのリポートによると、SnowflakeのCEOであるFrank Slootman氏は「パートナーシップ締結がなければ、資金調達を行わなかった」と語っている。また同リポートでは「Snowflakeの顧客の大部分はSalesforceの顧客でもあり、Salesforceとの連携はかねてより要求されていた」とも報じている。

実はすでにSalesforceでは、Snowflakeからのデータを自社のアナリティクス機能に同期させることが可能になっている。今回のパートナーシップ締結により、SalesforceとSnowflakeを統合させたデータ管理・分析製品が開発されることも予想される。

なお、Snowflakeは前述の通り、アマゾンの「Amazon Web Services」(AWS)、マイクロソフトの「Microsoft Azure」、そしてグーグルの「Google Cloud Storage」とも提携関係にありながら、同時にクラウドDWHとして競合するという複雑な位置関係にある。今後、この事業領域はさらに成長が見込まれるが、今後、この業界の勢力分布図がどう変化し、Snowflakeがどのポジションに位置していくのか。興味は尽きないところだ。

(※為替レート:2020年5月2日現在)

この記事が気に入ったら
いいね!しよう

INNOVATION HUBの最新情報をお届けします

プログラム

コラボレーションによるイノベーション創出の場

  • MUFG SPARK

スタートアップ・アクセラレータ

  • MUFG DEGITAL ACCELERATOR

月間記事ランキング

MUFG関連記事

Facebook公式ページ