Databricks - 協作資料、分析與人工智慧的統一平台
已發表: 2023-10-26公司簡介是StartupTalky的一項舉措,旨在發布有關不同新創公司和組織的經過驗證的資訊。
我們今天所處的現代世界很大程度上依賴數據和資訊。 我們周圍的一切,例如我們使用的、看到的和周圍的事物,都以一種或另一種方式受到科技的影響。
隨著對技術需求的成長,數據的重要性開始凸顯。 隨著資料的堆積,出現了對倉庫來儲存、分析和處理這些資料以用於多種目的的需求。
這就是Databricks推出其平台的地方。 Databricks 作為一個雲端平台來儲存大量可以處理和平穩運行的資料。 這是一個基於流行的開源產品Apache Spark所建構的分析平台。 他們佔據了10.19% 的市場份額,並有望成為數位分析市場的第三大佔有者。
Databricks - 公司亮點
新創公司名稱 | 資料區塊 |
---|---|
總部 | 舊金山, 加州, 美國 |
產業 | 電腦軟體、資料、人工智慧 |
創辦人 | Ali Ghodsi、Andy Konwinski、lon Stoica、Patrick Wendell、Reynold Xin、Matei Zaharia 與 Arsalan Tavakoli |
成立 | 2013年 |
網站 | databricks.com |
Databricks - 關於
Databricks - 產業
Databricks - 創辦人
Databricks - 創業故事
Databricks - 使命
Databricks - 標誌
Databricks - 業務與收入模型
Databricks - 員工
Databricks - 資金與投資者
Databricks - 收購
Databricks - 社群媒體存在
Databricks - 成長與收入
Databricks - 產品與功能
Databricks - 投資
Databricks - 合作夥伴
Databricks - 競爭對手
Databricks - 未來計劃
Databricks - 關於
Databricks 由Apache Spark的創建者創立,是一家資料和人工智慧 (AI) 公司。 它充當雲端上任何結構化或非結構化資料的倉庫。 Databricks 還可以作為所有資料、人工智慧和分析功能的組合平台,幫助資料工程師、分析師和資料科學家無縫地執行巨大的工作負載。 這是透過由 Apache Spark 提供支援的Lakehouse 平台來完成的,該平台是資料湖(低成本和靈活性)和資料倉儲(效能效率)功能的最佳組合。
除了 Apache Spark 之外, Delta Lake 和 MLflow是另外兩個開源項目,它們是 Lakehouse 平台有效功能的背後。 Databricks 透過多個雲端(即 Google Cloud、AWS、Microsoft Azure 和阿里雲端)提供統一資料服務。
Databricks - 產業
數據產業已成為影響生活和商業各個層面的龐大且重要的產業。 據 Statista 稱,到 2027 年,數據市場預計將成長至 1,030 億美元,是 2018 年規模的兩倍。人工智慧是另一個快速成長的市場,已成為現代工業的重要組成部分。
Databricks - 創辦人
Databricks 由加州大學的幾位教授和五位前柏克萊分校博士共同創立。 學生。
- Databricks 聯合創辦人兼執行長Ali Ghodsi是 Apache Spark 的創建者之一。 他是加州大學 (UC) 的教授,也是加州大學 Rising 實驗室的董事會成員。 他主要負責 Databricks 在全球的發展和擴張。
- Ion Stoica是 Databricks 的共同創辦人兼董事長,也是加州大學柏克萊分校的教授。 他也是 AMPLab 的共同主任。 除此之外,他還與他人共同創立了一家名為Conviva的新創公司,致力於大規模視訊分發。
- Matei Zaharia是 Databricks 的共同創辦人兼技術專家,曾參與 Spark 項目,現在是 Apache 基金會的副總裁。 2014 年,他因其在大規模電腦系統方面的研究而獲得了 ACM 博士論文獎。
- Databricks 聯合創辦人兼工程副總裁Patrick Wendell在 Spark 的營運中發揮了重要作用。
- Reynold Xin ,共同創辦人兼首席架構師,負責 Apache Spark 的技術營運。 他於 2011 年在 VLDB 獲得最佳演示獎。
- Andy Konwinski是共同創辦人兼管理副總裁,負責 Databricks 的人工智慧營運。 早些時候,他負責公司在 Spark Summit 創建中的市場工作。
- Arsalan Tavakoli-Shiraji是 Databricks 聯合創始人兼現場工程高級副總裁,此前曾在麥肯錫擔任副總裁。 他曾是一名博士。 加州大學柏克萊分校的學生。
Databricks - 創業故事
Databricks 執行長 Ali Ghodsi 從 8 歲起就熱衷於編碼,當時他的父母為他買了一台二手 Commodore 64。他繼續接受電腦工程的高等教育,並獲得了博士學位。 在分散式計算中。 後來,在2009年,他與Ion Stoica聯手,共同創作了“Spark”,這也是由Matei Zaharia發起的。
他們進一步與另一個致力於機器學習的團隊協調,共同在市場上推出了「Apache Spark」。 起初,沒有公司給予任何關注,因為這項技術看起來很陌生。 2013 年,Ben Horowitz(Andreessen Horowitz VC 聯合創辦人)投資 1,400 萬美元,為他們帶來了希望,並鼓勵他們創建一家公司,作為運行 Apache Spark 的平台。 因此,Databricks於2013年成立。
Databricks - 使命
Databricks 的使命是透過創新新技術來統一資料、人工智慧和分析,從而提高資料統一的效率。 他們努力讓客戶體驗更具吸引力。
Databricks - 標誌
Databricks 標誌類似於兩塊磚塊,完美對齊,就像架子上組織的資料資料夾一樣。 Databricks 似乎打算讓標誌保持起點和終點,中間沒有任何中斷。 這樣做可能意味著它們將資料收集、儲存和分析功能統一在一個通用平台下,無需退出,因為這裡涵蓋了所有內容。
Databricks - 業務與收入模型
他們的商業模式定位於基於 Web 的軟體,該軟體提供了與 Apache Spark 配合使用的平台。 它為資料工程師和科學家提供了自動群組管理和 Python 風格的筆記本。
Databricks 以軟體即服務 (SaaS) 的形式提供資源,並透過訂閱產生收入。 他們的主要服務透過三個雲端平台,即:
- 微軟Azure
- Google雲
- 亞馬遜網路服務
儘管每種雲的價格各不相同,但有一個需要注意的共同因素: “只需為您使用的內容付費” 。 費用的計算與所選服務無關,無需預付款。 客戶只需為使用的資源數量付費。
Databricks - 員工
截至 2023 年,Databricks 在全球擁有超過 5,001 至 10,000名員工。2019 年 11 月,Databricks 慶祝了為其僱用第 1000 名全職員工這一里程碑。 招收第一批 1000 名員工花了 6 年時間,剩下的員工只花了不到 2 年的時間。
Databricks - 資金與投資者
Databricks 最近融資 5.037 億美元,自成立以來已透過 12 輪融資籌集了 40 億美元。 迄今為止,共有 49 名投資者投資了 Databricks。
日期 | 階段 | 數量 | 投資者 |
---|---|---|---|
2023 年 9 月 14 日 | 系列一 | 5.037 億美元 | T·羅維·普萊斯 |
2023 年 7 月 31 日 | 二級市場 | - | - |
2023 年 3 月 3 日 | H系列 | - | - |
2021 年 9 月 4 日 | 天使輪 | 20萬美元 | - |
2021 年 8 月 31 日 | H系列 | 16 億美元 | Counterpoint Global(摩根士丹利)、Baillie Gifford、ClearBridge Investments、UC Investments、Andreessen Horowitz、亞馬遜網路服務(AWS)、微軟、CapitalG、CPP Investment Board、Coatue Management、Fidelity Management & Research、富蘭克林鄧普頓、GIC 、Greenoaks、Octahedron Capital、T. Rowe Price Associates、Tiger Global Management、Whale Rock Capital Management、Insight Partners、Gaingels、New Enterprise Association、Alta Park Capital、一系列紐約梅隆銀行基金、Discovery Capital、Dragoneer Investment Group、Flucasagoneer Investment Group Ventures、House Fund測地線和綠灣創投公司。 |
2021 年 2 月 1 日 | G系列 | 10億美元 | 富蘭克林鄧普頓、CPP 投資委員會、富達管理與研究有限責任公司、Whale Rock、亞馬遜網路服務(AWS)、CapitalG、Salesforce Ventures、微軟、Andreessen Horowitz、Alkeon Capital Management、BlackRock, Inc.、Coatue Management、 T. Rowe Price Associates 、Tiger Global Management、New Enterprise Association、Discovery Capital、Dragoneer Investment Group、Founders Circle Capital、Geodesic、GIC、Green Bay Ventures、Greenoaks Capital 和 Octahedron Capital。 |
2019 年 10 月 22 日 | F系列 | 4億美元 | Andreessen Horowitz、BlackRock, Inc.、T. Rowe Price Associates、Tiger Global Management、Coatue、New Enterprise Association、微軟、Alkeon Capital Management、Dragoneer Investment Group、Geodesic 和 Green Bay Ventures。 |
2019 年 2 月 5 日 | E系列 | 2.5億美元 | Andreessen Horowitz、微軟、Coatue、Battery Ventures、New Enterprise Association、Green Bay Ventures 和 Geodesic Capital。 |
2017 年 8 月 22 日 | D系列 | 1.4億美元 | 新企業協會、Andreessen Horowitz、Battery Ventures、Geodesic Capital 和 Green Bay Ventures。 |
2016 年 12 月 15 日 | C系列 | 6000萬美元 | 新企業協會、Andreessen Horowitz 和 SineWave Ventures。 |
2014 年 6 月 30 日 | B系列 | 3300萬美元 | 新企業協會、Andreessen Horowitz 和 DCVC。 |
2013 年 9 月 25 日 | A系列 | 1400萬美元 | 安德森‧霍洛維茲 (Andreessen Horowitz)、SV Angel 和阿爾弗雷德‧莊 (Alfred Chang)。 |
Databricks - 收購
Databricks 迄今已收購了七家公司。 以下是詳細資訊:
帳戶名稱 | 日期 | 數量 |
---|---|---|
阿爾西翁 | 2023 年 10 月 23 日 | 1億美元 |
馬賽克ML | 2023 年 6 月 26 日 | $1.3B |
奧克拉 | 2023 年 5 月 3 日 | - |
數據歡樂公司 | 2022 年 10 月 13 日 | - |
皮質實驗室 | 2022 年 4 月 15 日 | - |
8080實驗室 | 2021 年 10 月 6 日 | - |
雷達什 | 2020 年 6 月 24 日 | - |
Databricks - 社群媒體存在
Databricks 在 Twitter 和 LinkedIn 上擁有良好的影響力,他們利用這些平台來推廣其產品和服務,以獲得市場優勢。 他們還發布了有關他們的世界巡迴和發布活動以及最新發明的資訊。 還可以在他們的社交平台上找到以 Databricks 或其產品以及與職缺相關的資訊為特色的部落格和文章的連結。
Databricks - 成長與收入
Databricks成立於2013年,以Spark技術為核心。 它的成立立即被一個謠言所繼承:「如果你的數據不適合他們的內存,Spark 技術將無法運作」。 這阻礙了企業使用 Spark。
最後,在 2015 年,創始人決定透過參加一場比賽來結束這些謠言,他們打破了在最短時間內處理 1 PB 數據的世界紀錄,並因此獲得了媒體的關注和知名度。
到 2017 年,他們的估值達到 5 億美元,但年收入卻低得多,只有 100 萬美元。 後來,參加“排序競賽”,在員工招聘方面做出一些改變,並決定開發具有大型企業所需功能的軟體,結果證明是卓有成效的。
從那時起,Databricks 的成長就一路走上坡路。 他們的收入在 2018 年首次突破 1 億美元大關,僅用了一年時間就在 2019 年達到了 2 億美元。Lakehouse 功能的推出是其成功的主要因素。 該公司的估值從2019 年第三季的 62 億美元成長到 2021 年第三季的約 380 億美元。
Databricks 報告2020 年年度經常性收入為 4.25 億美元。
Databricks 揭露,在截至 2023 年 1 月 31 日結束的財年中,其收入超過 10 億美元。 該公司報告稱,2022 年的業績成長超過 60%。
Databricks - 產品與功能
最新發布的一些重要產品包括:
新 Delta Lake 版本的數據統一
Databricks 於 2023 年 6 月 28 日宣布推出新版本的 Delta Lake 資料儲存格式。據該公司稱,該版本消除了資料孤島。 資料湖系統中分析資料表的競爭對手開源標準的最新成員是 Delta Lake 3.0,其中包括來自 Apache 基金會的 Iceberg 和 Hudi。
多莉
Databricks 於 2023 年 3 月 24 日推出了一個開源語言模型,讓程式設計師可以創建自己的由 AI 驅動的聊天機器人應用程式。
萊克豪斯聯盟
在其資料+ AI 高峰會上,Databricks 於2023 年6 月28 日推出了其所謂的Lakehouse Federation 功能。借助這項新功能,企業可以透過結合不同的平台,在各種平台上發現、查詢和管理其數據。圍牆資料系統。
Databricks - 合作夥伴
Databricks 與許多公司合作。 最近一些著名的合作夥伴包括:
微軟
2023 年 8 月,微軟與 Databricks 建立了新的合作夥伴關係,以行銷人工智慧應用程式開發工具,擴大了其人工智慧目標的範圍。 企業將能夠使用 Databricks 軟體從頭開始創建自己的人工智慧模型。
小拜
2023 年 9 月 11 日,Databricks 與 Kobai 合作。 客戶可以利用 Databricks Lakehouse 平台的強大功能和可擴展性,以及知識圖的簡單性和洞察力。
3i資訊科技
為了透過在單一平台上結合資料和人工智慧來產生商業價值,3i Infotech Ltd 和 Databricks 於 2023 年 10 月 18 日建立合作夥伴關係。
Databricks - 投資
Databricks 已投資 24 家公司。 部分投資如下:
帳戶名稱 | 日期 | 數量 |
---|---|---|
困惑人工智慧 | 2022年 | - |
阿爾西翁 | 2018年 | - |
預言.io | 2017年1月 | - |
催化劑 | 2017年9月 | - |
清潔實驗室 | - | - |
Databricks - 競爭對手
Databricks 的一些主要競爭對手是:
- 雪花
- 雲端時代
- 數據統計
- 庫博萊
- MATLAB
- 阿爾泰克斯
- 德雷米奧
- 智慧體
以下是與一些競爭對手的一些比較:
Snowflake - Snowflake 比 Databricks 大很多。 它們都以靈活的價格提供類似的服務,幾乎沒有什麼區別(Databricks 處理大數據,而 Snowflake 提供雲端資料的彈性以進行集中存取)。 Databricks 正在與競爭對手進行一場持久戰。
Cloudera - Cloudera 提供了一個通用的雲端儲存和管理平台,可以為組織儲存、處理和分析資料。 它與Databricks的資料倉儲、處理和分發形式類似。
Databricks - 未來計劃
顯然,Databricks 正在研究 2021 年成長最快的兩個大數據領域:串流媒體和深度學習。他們正在建立多方面的應用程式介面 (API) 來處理這兩個領域。 Databricks 也熱衷於加速 Data Lakehouse 的創新,透過征服資料驅動型組織來獲得更大的優勢。
據他們的網站稱,Databricks 計劃啟用工作區的收藏夾功能。 註釋、儀表板、實驗和搜尋都可以儲存到收藏清單中,然後您可以從主頁存取這些清單。
Databricks - 常見問題解答
什麼是資料塊?
Databricks 是一種基於雲端的工具,用於使用機器學習模型儲存和處理大量資料。 這是透過他們的 Apache Spark 工具完成的。
誰創立了 Databricks?
Databricks 由七個人共同創立,分別是 Ali Ghodsi、Ion Stoica、Matei Zaharia、Patrick Wendell、Reynold Xin、Andy Konwinski 和 Arsalan Tavakoli-Shiraji。
Databricks 透過融資獲得了多少資金?
Databricks 透過 12 輪融資籌集了約 40 億美元。
Databricks 的年收入是多少?
Databricks 報告稱,截至 2022 年的年度經常性收入 (ARR) 為 12.75 億美元。
Databricks 的客戶是誰?
Databricks 在全球擁有約 6000 多家客戶。 他們的一些受歡迎的客戶是:
- 殼
- CVS健康
- 再生元
- T移動
- 匯豐銀行
- 康卡斯特