【米国株IPO・2021】Databricks(データブリックス)が提唱するLakehouse (レイクハウス)とは?

Databricks(データブリックス)は、膨大なデータを分析/統合し、AI/機械学習を通じて新たな価値を創造する「データとAIの民主化」を目指しています。

 

前田健太選手が在籍するミネソタ・ツインズでは、選手の動作をデータ分析し、SQLアナリティクスを活用した貢献度の数値化やプレー予測を戦術に導入。

 

Databricks(データブリックス)は「レイクハウス(Lake House)」を提唱しており、サイロ化されたデータ分析/管理の統合によってデータの利活用を促進します。

 

本稿では、2021年上半期にIPOを予定しているとされるDatabricks(データブリックス)について解説していきます。

 

>>米国株式市場・2021年にIPOの可能性が高い企業|時価総額や資金調達額

Databricks(データブリックス)「レイクハウス(Lake House)」とは?

すでに「Apache Spark」をはじめとした膨大なデータ分析/処理サービスで高い評価を得ている「Databricks」ですが、「レイクハウス(Lake House)」を実現することで下記のように幅広い領域に対応した包括的なデータ活用を可能にします。

 

・多言語対応(SQL/Python、R/Scala)

・構造化〜非構造化データへの対応(CRM/JSON/XML/画像)

・バッチ/ストリーミング処理への対応

・オープン形式での格納によってストレージ/リソース拡張に対応

・ビジネスアナリスト/データエンジニア・サイエンティストに対応

 

業務領域としてはビジネス分析(BI/レポート)、自由検索(SQLアナリティクス)、機械学習(深層学習)に対応しており、「レイクハウス(Lake House)」はデータ取引が急増している現代社会の生産性を支える仕組みとして普及が期待されています。

 

冒頭にあるミネソタ・ツインズの事例のように「データレイク(Data Lake)」におけるバッチ/ストリーミング処理への対応から各選手のプレーを機械学習によって詳細に洞察したデータを「データウェアハウス(DWH)」に格納する一連のワークフローを「レイクハウス(Lake House)」は実現しています。

 

「Databricks」はAWS S3などのデータレイクを抽象化する「Delta Lake」、クリエエンジン「Delta Engine」を搭載した新サービス「SQL Analytics」を発表しており、データの高速分析を促進。

 

Tableauなど各データビジュアライズツールを用いてる場合にもコネクタで統合が可能であり、「レイクハウス(Lake House)」の実現に向けて「SQL Analytics」の利活用が進むことでしょう。

 

「Databricks Japan」は株式会社ジールと提携するなど、日本においても「レイクハウス(Lake House)」によるデータ分析の効率化が浸透することが期待され、その将来性は非常に明るいものであると考えられます。

 

>>世界のユニコーン企業2021IPOが期待されるスタートアップ企業の有望銘柄

Databricks(データブリックス)「ApacheSpark」について

分散処理フレームワーク「ApacheSpark」はビッグデータ分析に幅広く活用され、米国の大手IT企業の大規模なデータ処理にも用いられています。

 

「Databricks」は「ApacheSpark」の開発チームにとって設立された会社であり、様々な言語に対応したAPIやコンポーネントを提供することで、分散処理の高速化を実現。

 

機械学習の普及とともに膨大なデータを短時間で処理する必要性が高まっており、分散共有メモリ「Resilient Distributed Datasets」によるデータ管理が可能な「ApacheSpark」の利活用が進むことでしょう。

 

2019年10月のシリーズEラウンドでは、時価総額62億ドルの評価を受けており、2021年には米国テック企業の大型上場銘柄の1つとして「Databricks」は関心を集めています。

 

・クラウドデータウェアハウス(DWH)開発企業「Snowflake」

・データ分析企業「Sumo Logic」

・ソフトウェア開発プラットフォームを手がける「JFrog」

 

などのソフトウェア企業が2020年にはIPOを実施。

 

ソフトウェア企業のIPOが高い評価を得た最近の市況を踏まえると「Databricks」は大きな成功を収める可能性が高いと考えられます。

 

「私たちは無限のコンピューティングの時代に生きており、Databricksのような企業は、無限の洞察を提供するデータ管理と処理を可能にします」と米国株式のアナリストHolgerMueller氏は述べており、マイクロソフトからも出資を受けていることからも「Databricks」の統合データ分析基盤開発事業への期待の高さが伺えます。

 

>>2021年のアメリカIPO市場予想|テック系スタートアップの大型上場について

Databricks(データブリックス)の資金調達について

・時価総額 

62億ドル(2019年10月/シリーズE) 

・沿革 

2013年設立

・資金調達状況 

資金調達ラウンドの数 6

総資金額 8億8,700万ドル 

主要投資家数 2

投資家数 16

2019年10月22日 シリーズF 4億ドル

2019年2月5日 シリーズE 2億5,000万ドル

2017年8月22日 シリーズD 1億4,000万ドル

2016年12月15日 シリーズC 6,000万ドル 

2014年6月30日 シリーズB 3,300万ドル

2013年9月25日 シリーズA 1,400万ドル

・最近の資金調達ラウンド参加投資家

タイガーグローバルマネジメント

Dragoneer Investment Group

アンドリーセンホロウィッツ

マイクロソフト

ブラックロック

ジオデシックキャピタル

アルケオンキャピタル

グリーンベイベンチャーズ

ニューエンタープライズアソシエイツ

コート

・M&A

2020年6月24日 Redash

競合企業

Qubole」「Snowflake」「MapR

 

>中国のIPO/スタートアップ市場の2021年の展望|規制強化と新たな市場開拓

 

・参考文献

 

Databricks/owler

Databricks/crunchbase

営業活動のアプローチ成功率を大幅改善―顧客行動の予測モデルを“説明可能なAI”を用いてアジャイル型で開発―

ミネソタ・ツインズにおける投球シナリオのスケーリング – Part 1

株式会社ジール、統合データ分析基盤を提供するデータブリックスとパートナー契約を締結

Report: Databricks is plotting the next big software IPO