Databricks - 协作数据、分析和人工智能的统一平台
已发表: 2023-10-26公司简介是StartupTalky的一项举措,旨在发布有关不同初创公司和组织的经过验证的信息。
我们今天生活的现代世界很大程度上依赖于数据和信息。 我们周围的一切,比如我们使用的、看到的和周围的事物,都以一种或另一种方式受到技术的影响。
随着对技术需求的增长,数据的重要性开始凸显。 随着数据的堆积,出现了对仓库来存储、分析和处理这些数据以用于多种目的的需求。
这就是Databricks推出其平台的地方。 Databricks 作为一个云平台来存储可以处理和平稳运行的大量数据。 这是一个基于流行的开源产品Apache Spark构建的分析平台。 他们占据了10.19% 的市场份额,有望成为数字分析市场的第三大占有者。
Databricks - 公司亮点
初创公司名称 | 数据块 |
---|---|
总部 | 旧金山, 加利福尼亚州, 美国 |
行业 | 计算机软件、数据、人工智能 |
创始人 | Ali Ghodsi、Andy Konwinski、lon Stoica、Patrick Wendell、Reynold Xin、Matei Zaharia 和 Arsalan Tavakoli |
成立 | 2013年 |
网站 | databricks.com |
Databricks - 关于
Databricks - 行业
Databricks - 创始人
Databricks - 创业故事
Databricks - 使命
Databricks - 标志
Databricks - 业务和收入模型
Databricks - 员工
Databricks - 资金和投资者
Databricks - 收购
Databricks - 社交媒体存在
Databricks - 增长和收入
Databricks - 产品和功能
Databricks - 投资
Databricks - 合作伙伴
Databricks - 竞争对手
Databricks - 未来计划
Databricks - 关于
Databricks 由Apache Spark的创建者创立,是一家数据和人工智能 (AI) 公司。 它充当云上任何结构化或非结构化数据的仓库。 Databricks 还可以作为所有数据、人工智能和分析功能的组合平台,帮助数据工程师、分析师和数据科学家无缝地执行巨大的工作负载。 这是通过由 Apache Spark 提供支持的Lakehouse 平台来完成的,该平台是数据湖(低成本和灵活性)和数据仓库(性能效率)功能的最佳组合。
除了 Apache Spark 之外, Delta Lake 和 MLflow是另外两个开源项目,它们是 Lakehouse 平台有效功能的背后。 Databricks 通过多个云(即 Google Cloud、AWS、Microsoft Azure 和阿里云)提供统一数据服务。
Databricks - 行业
数据产业已经成为影响生活和商业各个方面的一个庞大而重要的产业。 据 Statista 称,到 2027 年,数据市场预计将增长至 1030 亿美元,是 2018 年规模的两倍。人工智能是另一个快速增长的市场,已成为现代工业的重要组成部分。
Databricks - 创始人
Databricks 由加州大学的几位教授和五位前伯克利分校博士共同创立。 学生。
- Databricks 联合创始人兼首席执行官Ali Ghodsi是 Apache Spark 的创建者之一。 他是加州大学 (UC) 的教授,也是加州大学 Rising 实验室的董事会成员。 他主要负责 Databricks 在全球范围内的发展和扩张。
- Ion Stoica是 Databricks 的联合创始人兼董事长,也是加州大学伯克利分校的教授。 他还是 AMPLab 的联合主任。 除此之外,他还与他人共同创立了一家名为Conviva的初创公司,致力于大规模视频分发。
- Matei Zaharia是 Databricks 的联合创始人兼首席技术专家,曾参与 Spark 项目,现在是 Apache 基金会的副总裁。 2014 年,他因其在大规模计算机系统方面的研究而获得了 ACM 博士论文奖。
- Databricks 联合创始人兼工程副总裁Patrick Wendell在 Spark 的运营中发挥了重要作用。
- Reynold Xin ,联合创始人兼首席架构师,负责 Apache Spark 的技术运营。 他于 2011 年在 VLDB 获得最佳演示奖。
- Andy Konwinski是联合创始人兼管理副总裁,负责 Databricks 的人工智能运营。 早些时候,他负责公司在 Spark Summit 创建中的市场工作。
- Arsalan Tavakoli-Shiraji是 Databricks 联合创始人兼现场工程高级副总裁,此前曾在麦肯锡担任副总裁。 他曾是一名博士。 加州大学伯克利分校的学生。
Databricks - 创业故事
Databricks 首席执行官 Ali Ghodsi 从 8 岁起就热衷于编码,当时他的父母给他买了一台二手 Commodore 64。他继续接受计算机工程方面的高等教育,并获得了博士学位。 在分布式计算中。 后来,在2009年,他与Ion Stoica联手,共同创作了“Spark”,这也是由Matei Zaharia发起的。
他们进一步与另一个致力于机器学习的团队协调,共同在市场上推出了“Apache Spark”。 起初,没有公司给予任何关注,因为这项技术看起来很陌生。 2013 年,Ben Horowitz(Andreessen Horowitz VC 联合创始人)投资 1400 万美元,给他们带来了希望,并鼓励他们创建一家公司,作为运行 Apache Spark 的平台。 因此,Databricks于2013年成立。
Databricks - 使命
Databricks 的使命是通过创新新技术来统一数据、人工智能和分析,从而提高数据统一的效率。 他们努力让客户体验更具吸引力。
Databricks - 标志
Databricks 徽标类似于两块砖块,完美对齐,就像架子上组织的数据文件夹一样。 Databricks 似乎打算让徽标保持起点和终点,中间没有任何中断。 这样做可能意味着它们将数据收集、存储和分析功能统一在一个通用平台下,无需退出,因为这里涵盖了所有内容。
Databricks - 业务和收入模型
他们的业务模型定位于基于 Web 的软件,该软件提供了与 Apache Spark 配合使用的平台。 它为数据工程师和科学家提供了自动组管理和 Python 风格的笔记本。
Databricks 以软件即服务 (SaaS) 的形式提供资源,并通过订阅产生收入。 他们的主要服务通过三个云平台,即:
- 微软Azure
- 谷歌云
- 亚马逊网络服务
尽管每种云的价格各不相同,但有一个需要注意的共同因素: “只需为您使用的内容付费” 。 费用的计算与所选服务无关,无需预付款。 客户只需为使用的资源数量付费。
Databricks - 员工
截至 2023 年,Databricks 在全球拥有超过 5,001 至 10,000名员工。2019 年 11 月,Databricks 庆祝了为其雇佣第 1000 名全职员工这一里程碑。 招收第一批 1000 名员工花了 6 年时间,剩下的员工只用了不到 2 年的时间。
Databricks - 资金和投资者
Databricks 最近融资 5.037 亿美元,自成立以来已通过 12 轮融资筹集了 40 亿美元。 迄今为止,共有 49 名投资者投资了 Databricks。
日期 | 阶段 | 数量 | 投资者 |
---|---|---|---|
2023 年 9 月 14 日 | 系列一 | 5.037 亿美元 | T·罗维·普莱斯 |
2023 年 7 月 31 日 | 二级市场 | - | - |
2023 年 3 月 3 日 | H系列 | - | - |
2021 年 9 月 4 日 | 天使轮 | 20万美元 | - |
2021 年 8 月 31 日 | H系列 | 16 亿美元 | Counterpoint Global(摩根士丹利)、Baillie Gifford、ClearBridge Investments、UC Investments、Andreessen Horowitz、亚马逊网络服务 (AWS)、微软、CapitalG、CPP Investment Board、Coatue Management、Fidelity Management & Research、富兰克林邓普顿、GIC、Greenoaks、Octahedron Capital、T. Rowe Price Associates、Tiger Global Management、Whale Rock Capital Management、Insight Partners、Gaingels、New Enterprise Association、Alta Park Capital、一系列纽约梅隆银行基金、Discovery Capital、Dragoneer Investment Group、Flucas Ventures、House Fund测地线和绿湾风险投资公司。 |
2021 年 2 月 1 日 | G系列 | 10亿美元 | 富兰克林邓普顿、CPP 投资委员会、富达管理与研究有限责任公司、Whale Rock、亚马逊网络服务 (AWS)、CapitalG、Salesforce Ventures、微软、Andreessen Horowitz、Alkeon Capital Management、BlackRock, Inc.、Coatue Management、T. Rowe Price Associates 、Tiger Global Management、New Enterprise Association、Discovery Capital、Dragoneer Investment Group、Founders Circle Capital、Geodesic、GIC、Green Bay Ventures、Greenoaks Capital 和 Octahedron Capital。 |
2019 年 10 月 22 日 | F系列 | 4亿美元 | Andreessen Horowitz、BlackRock, Inc.、T. Rowe Price Associates、Tiger Global Management、Coatue、New Enterprise Association、微软、Alkeon Capital Management、Dragoneer Investment Group、Geodesic 和 Green Bay Ventures。 |
2019 年 2 月 5 日 | E系列 | 2.5亿美元 | Andreessen Horowitz、微软、Coatue、Battery Ventures、New Enterprise Association、Green Bay Ventures 和 Geodesic Capital。 |
2017 年 8 月 22 日 | D系列 | 1.4亿美元 | 新企业协会、Andreessen Horowitz、Battery Ventures、Geodesic Capital 和 Green Bay Ventures。 |
2016 年 12 月 15 日 | C系列 | 6000万美元 | 新企业协会、Andreessen Horowitz 和 SineWave Ventures。 |
2014 年 6 月 30 日 | B系列 | 3300万美元 | 新企业协会、Andreessen Horowitz 和 DCVC。 |
2013 年 9 月 25 日 | A系列 | 1400万美元 | 安德森·霍洛维茨 (Andreessen Horowitz)、SV Angel 和阿尔弗雷德·庄 (Alfred Chang)。 |
Databricks - 收购
Databricks 迄今为止已收购了七家公司。 以下是详细信息:
帐户名称 | 日期 | 数量 |
---|---|---|
阿尔西翁 | 2023 年 10 月 23 日 | 1亿美元 |
马赛克ML | 2023 年 6 月 26 日 | $1.3B |
奥克拉 | 2023 年 5 月 3 日 | - |
数据欢乐公司 | 2022 年 10 月 13 日 | - |
皮质实验室 | 2022 年 4 月 15 日 | - |
8080实验室 | 2021 年 10 月 6 日 | - |
雷达什 | 2020 年 6 月 24 日 | - |
Databricks - 社交媒体存在
Databricks 在 Twitter 和 LinkedIn 上拥有良好的影响力,他们利用这些平台来推广其产品和服务,以获得市场优势。 他们还发布了有关他们的世界巡演和发布活动以及最新发明的信息。 还可以在他们的社交平台上找到以 Databricks 或其产品以及与职位空缺相关的信息为特色的博客和文章的链接。
Databricks - 增长和收入
Databricks成立于2013年,以Spark技术为核心。 它的成立立即被一个谣言所继承:“如果你的数据不适合他们的内存,Spark 技术将无法工作”。 这阻碍了企业使用 Spark。
最后,在 2015 年,创始人决定通过参加一场比赛来结束这些谣言,他们打破了在最短时间内处理 1 PB 数据的世界纪录,并因此获得了媒体的关注和知名度。
到 2017 年,他们的估值达到 5 亿美元,但年收入却低得多,仅为 100 万美元。 后来,参加“排序竞赛”,在员工招聘方面做出一些改变,并决定开发具有大型企业所需功能的软件,结果证明是卓有成效的。
从那时起,Databricks 的增长就一路走上坡路。 他们的收入在 2018 年首次突破 1 亿美元大关,仅用了一年时间就在 2019 年达到了 2 亿美元。Lakehouse 功能的推出是其成功的主要因素。 该公司的估值从2019 年第三季度的 62 亿美元增长到 2021 年第三季度的约 380 亿美元。
Databricks 报告2020 年年度经常性收入为 4.25 亿美元。
Databricks 披露,在截至 2023 年 1 月 31 日结束的财年中,其收入超过 10 亿美元。 该公司报告称,2022 年的业绩增长超过 60%。
Databricks - 产品和功能
最新发布的一些重要产品包括:
新 Delta Lake 版本的数据统一
Databricks 于 2023 年 6 月 28 日宣布推出新版本的 Delta Lake 数据存储格式。据该公司称,该版本消除了数据孤岛。 数据湖系统中分析数据表的竞争对手开源标准的最新成员是 Delta Lake 3.0,其中包括来自 Apache 基金会的 Iceberg 和 Hudi。
多莉
Databricks 于 2023 年 3 月 24 日推出了一种开源语言模型,允许程序员创建自己的由 AI 驱动的聊天机器人应用程序。
莱克豪斯联盟
在其数据 + AI 峰会上,Databricks 于 2023 年 6 月 28 日推出了其所谓的 Lakehouse Federation 功能。借助这一新功能,企业可以通过结合不同的平台,在各种平台上发现、查询和管理其数据。围墙数据系统。
Databricks - 合作伙伴
Databricks 已与许多公司合作。 最近的一些著名合作伙伴包括:
微软
2023 年 8 月,微软与 Databricks 建立了新的合作伙伴关系,以营销人工智能应用程序开发工具,扩大了其人工智能目标的范围。 企业将能够使用 Databricks 软件从头开始创建自己的人工智能模型。
小拜
2023 年 9 月 11 日,Databricks 与 Kobai 合作。 客户可以利用 Databricks Lakehouse 平台的强大功能和可扩展性,以及知识图的简单性和洞察力。
3i信息科技
为了通过在单一平台上结合数据和人工智能来产生商业价值,3i Infotech Ltd 和 Databricks 于 2023 年 10 月 18 日建立合作伙伴关系。
Databricks - 投资
Databricks 已投资 24 家公司。 部分投资如下:
帐户名称 | 日期 | 数量 |
---|---|---|
困惑人工智能 | 2022年 | - |
阿尔西翁 | 2018年 | - |
预言.io | 2017年1月 | - |
催化剂 | 2017年9月 | - |
清洁实验室 | - | - |
Databricks - 竞争对手
Databricks 的一些主要竞争对手是:
- 雪花
- 云时代
- 数据统计
- 库博莱
- MATLAB
- 阿尔泰克斯
- 德雷米奥
- 智能体
以下是与一些竞争对手的一些比较:
Snowflake - Snowflake 比 Databricks 大得多。 它们都以灵活的价格提供类似的服务,几乎没有什么区别(Databricks 处理大数据,而 Snowflake 提供云数据的弹性以进行集中访问)。 Databricks 正在与竞争对手进行一场持久战。
Cloudera - Cloudera 提供了一个通用的云存储和管理平台,可以为组织存储、处理和分析数据。 它与Databricks的数据仓库、处理和分发形式类似。
Databricks - 未来计划
显然,Databricks 正在研究 2021 年增长最快的两个大数据领域:流媒体和深度学习。他们正在构建多方面的应用程序编程接口 (API) 来处理这两个领域。 Databricks 还热衷于加速 Data Lakehouse 的创新,通过征服数据驱动型组织来获得更大的优势。
据他们的网站称,Databricks 计划启用工作区的收藏夹功能。 注释、仪表板、实验和搜索都可以保存到收藏夹列表中,然后您可以从主页访问这些列表。
Databricks - 常见问题解答
什么是数据块?
Databricks 是一种基于云的工具,用于使用机器学习模型存储和处理大量数据。 这是通过他们的 Apache Spark 工具完成的。
谁创立了 Databricks?
Databricks 由七个人共同创立,即 Ali Ghodsi、Ion Stoica、Matei Zaharia、Patrick Wendell、Reynold Xin、Andy Konwinski 和 Arsalan Tavakoli-Shiraji。
Databricks 通过融资获得了多少资金?
Databricks 通过 12 轮融资筹集了约 40 亿美元。
Databricks 的年收入是多少?
Databricks 报告称,截至 2022 年的年度经常性收入 (ARR) 为 12.75 亿美元。
Databricks 的客户是谁?
Databricks 在全球拥有约 6000 多家客户。 他们的一些受欢迎的客户是:
- 壳
- CVS健康
- 再生元
- T移动
- 汇丰银行
- 康卡斯特