Databricks - 데이터, 분석 및 AI를 협업하는 통합 플랫폼

게시 됨: 2023-10-26

회사 프로필은 다양한 스타트업 및 조직에 대한 검증된 정보를 게시하기 위한 StartupTalky 의 이니셔티브입니다.

오늘날 우리가 살고 있는 현대 사회는 데이터와 정보에 크게 의존하고 있습니다. 우리 주변의 모든 것, 즉 우리가 사용하고, 보고, 둘러싸고 있는 것들은 어느 정도 기술의 영향을 받습니다.

기술에 대한 필요성이 커지면서 데이터의 중요성이 커지기 시작했습니다. 데이터가 쌓이면서 이러한 데이터를 다양한 목적으로 저장, 분석, 처리할 수 있는 창고 의 필요성이 대두되었습니다.

이곳은 Databricks가 플랫폼을 선보인 곳입니다. Databricks는 원활하게 처리하고 실행할 수 있는 막대한 데이터를 저장하는 클라우드 플랫폼 역할을 합니다. 이는 Apache Spark 라는 인기 있는 오픈 소스 제품을 기반으로 구축된 분석 플랫폼입니다. 그들은 10.19%의 시장 점유율을 차지하고 있으며 디지털 분석 시장에서 세 번째로 큰 점유율을 차지하고 있습니다.

Databricks - 회사 하이라이트

스타트업 이름 데이터브릭스
본부 샌프란시스코, 캘리포니아, 미국
산업 컴퓨터 소프트웨어, 데이터, AI
창립자 Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia 및 Arsalan Tavakoli
설립 2013년
웹사이트 databricks.com

Databricks - 정보
Databricks - 산업
Databricks - 창립자
Databricks - 스타트업 스토리
Databricks - 임무
Databricks-로고
Databricks - 비즈니스 및 수익 모델
Databricks - 직원
Databricks - 자금 조달 및 투자자
Databricks - 인수
Databricks - 소셜 미디어 존재
Databricks - 성장과 수익
Databricks - 제품 및 기능
Databricks - 투자
Databricks - 파트너십
Databricks - 경쟁사
Databricks - 향후 계획

Databricks - 정보

Databricks는 Apache Spark 개발자에 의해 데이터 및 인공 지능(AI) 회사로 설립되었습니다. 클라우드에서 구조화된 데이터나 구조화되지 않은 데이터를 위한 창고 역할을 합니다. Databricks는 또한 데이터 엔지니어, 분석가 및 데이터 과학자가 대규모 워크로드를 원활하게 수행하는 데 도움이 되는 모든 데이터, AI 및 분석 기능을 위한 결합 플랫폼 역할을 합니다. 이는 데이터 레이크(저비용 및 유연성)와 데이터 웨어하우스(성능 효율성)의 기능을 가장 잘 조합한 Apache Spark 기반의 Lakehouse 플랫폼을 통해 수행됩니다.

Apache Spark 외에도 Delta Lake 및 MLflow는 Lakehouse 플랫폼의 효과적인 기능을 지원하는 다른 두 가지 오픈 소스 프로젝트입니다. Databricks는 Google Cloud, AWS, Microsoft Azure 및 Alibaba Cloud와 같은 여러 클라우드를 통해 통합 데이터 서비스를 제공합니다.

데이터브릭스 소개

Databricks - 산업

데이터 산업은 생활과 비즈니스의 모든 측면에서 크고 중요한 산업으로 변모했습니다. Statista에 따르면, 데이터 시장은 2027년까지 무려 1,030억 달러로 성장할 것으로 예상됩니다. 이는 2018년의 두 배 규모입니다. 인공 지능은 현대 산업의 필수 요소가 된 또 다른 빠르게 성장하는 시장입니다.


비즈니스 재창조를 위한 디지털 혁신의 주요 동인
디지털 혁신은 비즈니스와 업무 문화를 재창조하고 있습니다. 디지털 혁신의 주요 동인에 대해 알아보려면 이 기사를 읽어보세요.

Databricks - 창립자

Databricks 창립자
Databricks 창립자

Databricks는 캘리포니아 대학교 교수 두 명과 전 버클리 박사 출신 다섯 명이 공동 창립했습니다. 재학생.

  • Databricks의 공동 창립자이자 CEO인 Ali Ghodsi 는 Apache Spark의 창시자 중 한 명입니다. 그는 캘리포니아 대학(UC)의 교수이자 UC Rising Lab의 이사였습니다. 그는 전 세계적으로 Databricks의 성장과 확장에 대한 주요 책임을 맡았습니다.
  • Databricks의 공동 창립자이자 회장인 Ion Stoica 는 UC Berkeley의 교수이기도 합니다. 그는 또한 AMPLab의 공동 이사이기도 합니다. 또한 그는 대규모 비디오 배포를 위해 Conviva 라는 스타트업을 공동 창립했습니다.
  • Databricks의 공동 창립자이자 최고 기술자인 Matei Zaharia는 이전에 Spark 프로젝트의 일부였으며 현재는 Apache Foundation의 부사장입니다. ACM 박사 논문상은 대규모 컴퓨터 시스템에 대한 연구로 2014년에 그에게 수여되었습니다.
  • Databricks의 공동 창립자이자 엔지니어링 부사장인 Patrick Wendell은 Spark 운영에서 중요한 역할을 했습니다.
  • 공동 창립자이자 수석 설계자인 Reynold Xin은 Apache Spark의 기술 운영을 담당합니다. 그는 2011년 VLDB에서 Best Demo Award를 수상했습니다.
  • 공동 창립자이자 경영 담당 부사장인 Andy Konwinski는 Databricks의 AI 운영을 담당합니다. 이전에 그는 Spark Summit 생성에서 회사의 시장 활동을 담당했습니다.
  • Databricks의 공동 창립자이자 현장 엔지니어링 부문 수석 부사장인 Arsalan Tavakoli-Shiraji는 이전에 McKinsey에서 부교장으로 근무했습니다. 그는 전 박사였습니다. UC 버클리 학생.

Databricks - 스타트업 스토리

Databricks의 CEO인 Ali Ghodsi는 부모님이 중고 Commodore 64를 사주신 8살 때부터 코딩에 열중했습니다. 그는 컴퓨터 공학 분야의 고등 교육과 박사 학위를 취득했습니다. 분산 컴퓨팅에서. 이후 2009년에 그는 Ion Stoica와 손을 잡고 함께 'Spark'를 만들었으며 이미 Matei Zaharia가 주도했습니다.

그들은 머신러닝을 담당하는 다른 팀과도 협력하여 함께 'Apache Spark'를 시장에 출시했습니다. 처음에는 기술이 낯설게 느껴졌기 때문에 어떤 회사도 관심을 기울이지 않았습니다. 2013년에 Ben Horowitz(Andreessen Horowitz VC의 공동 창업자)는 1,400만 달러를 투자하여 그들에게 희망을 심었고 Apache Spark를 실행하는 플랫폼 역할을 하는 회사를 만들도록 독려했습니다. 그리하여 2013년에 데이터브릭스가 설립되었습니다.

Databricks - 임무

Databricks는 데이터, AI 및 분석을 통합하는 새로운 기술을 혁신하여 데이터 통합을 더욱 효율적으로 만드는 사명을 갖고 있습니다. 그들은 고객 경험을 더욱 매력적으로 만들기 위해 노력합니다.

Databricks-로고

데이터브릭스 로고
데이터브릭스 로고

Databricks 로고는 선반에 정리된 데이터 폴더처럼 완벽하게 정렬된 두 개의 벽돌과 유사합니다. 데이터브릭스는 중간에 끊김 없이 시작점과 끝점을 그대로 유지하려는 의도로 보입니다. 이는 여기에 모든 내용이 포함되어 있으므로 출구가 필요 없이 하나의 공통 플랫폼에서 데이터 수집, 저장 및 분석 기능을 통합한다는 것을 암시하기 위해 수행될 수 있습니다.

Databricks - 비즈니스 및 수익 모델

그들의 비즈니스 모델은 Apache Spark와 함께 작동할 수 있는 플랫폼을 제공하는 웹 기반 소프트웨어에 위치합니다. 데이터 엔지니어와 과학자를 위한 자동 그룹 관리 및 Python 스타일 노트북을 용이하게 합니다.

Databricks는 SaaS(Software as a Service) 형식으로 리소스를 제공하고 구독을 통해 수익을 창출합니다. 주요 서비스는 다음과 같은 세 가지 클라우드 플랫폼을 통해 제공됩니다.

  • 마이크로소프트 애저
  • 구글 클라우드
  • 아마존 웹 서비스

가격은 클라우드마다 다르지만 "사용한 만큼만 지불하세요"라는 공통 요소가 있습니다. 비용은 선택한 서비스와 별도로 계산되며 선불 결제가 필요하지 않습니다. 고객은 사용한 만큼만 비용을 지불하면 됩니다.

Databricks - 직원

Databricks는 2023년 현재 전 세계적으로 5,001~10,000명 이상의 직원을 보유하고 있습니다. 2019년 11월 Databricks는 1000번째 정규 직원을 고용하는 이정표를 축하했습니다. 처음 1000명의 직원을 채용하는 데 6년이 걸렸고, 나머지 직원을 채용하는 데는 2년도 채 걸리지 않았습니다.

Databricks - 자금 조달 및 투자자

최근 5억 370만 달러의 자금을 조달한 Databricks는 설립 이후 12번의 자금 조달 라운드를 통해 40억 달러를 모금했습니다. 지금까지 총 49명의 투자자가 데이터브릭스에 투자했습니다.

날짜 단계 투자자
2023년 9월 14일 시리즈 I $503.7M T. 로우 프라이스
2023년 7월 31일 2차 시장 - -
2023년 3월 3일 시리즈 H - -
2021년 9월 4일 엔젤 라운드 $200,000 -
2021년 8월 31일 시리즈 H 16억 달러 Counterpoint Global(Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services(AWS), Microsoft, CapitalG, CPP 투자 위원회, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gainels, New Enterprise Association, Alta Park Capital, BNY Mellon 펀드 제품군, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, House Fund 측지선 및 그린베이 벤처스.
2021년 2월 1일 시리즈 G 10억 달러 Franklin Templeton, CPP 투자 위원회, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services(AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital 및 Octahedron Capital.
2019년 10월 22일 시리즈 F 4억 달러 Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic 및 Green Bay Ventures.
2019년 2월 5일 시리즈 E 2억 5천만 달러 Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures 및 Geodesic Capital.
2017년 8월 22일 시리즈 D 1억 4천만 달러 New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital 및 Green Bay Ventures.
2016년 12월 15일 시리즈 C 6천만 달러 새로운 기업 협회, Andreessen Horowitz 및 SineWave Ventures.
2014년 6월 30일 시리즈 B 3,300만 달러 새로운 기업 협회, Andreessen Horowitz 및 DCVC.
2013년 9월 25일 시리즈 A 1,400만 달러 안드레센 호로비츠, SV 앙헬, 알프레드 추앙.

Databricks - 인수

Databricks는 지금까지 7개 회사를 인수했습니다. 자세한 내용은 다음과 같습니다.

계정 이름 날짜
아르시온 2023년 10월 23일 $1억
모자이크ML 2023년 6월 26일 $13억
오케라 2023년 5월 3일 -
데이터조이(주) 2022년 10월 13일 -
Cortex 연구소 2022년 4월 15일 -
8080 연구소 2021년 10월 6일 -
Redash 2020년 6월 24일 -

인도 최고의 클라우드 컴퓨팅 스타트업 목록 및 성장
클라우드 컴퓨팅은 새로운 표준이 되었고, 이러한 추세는 클라우드에 의존하는 수많은 스타트업을 탄생시켰습니다. 이러한 회사는 더 효율적입니다.

Databricks - 소셜 미디어 존재

Databricks는 Twitter와 LinkedIn에서 좋은 입지를 확보하고 있으며 이러한 플랫폼을 활용하여 제품과 서비스를 홍보하여 ​​시장 이점을 얻습니다. 그들은 또한 최신 발명품을 사용한 월드 투어 및 출시 이벤트에 관한 게시물도 게시합니다. Databricks 또는 해당 제품과 채용 관련 정보를 다루는 블로그 및 기사에 대한 링크도 해당 소셜 플랫폼에서 찾을 수 있습니다.

Databricks - 성장과 수익

Databricks는 Spark 기술을 핵심으로 유지하면서 2013년에 설립되었습니다. '데이터가 메모리에 맞지 않으면 스파크 기술이 작동하지 않는다'는 소문이 곧바로 형성되었습니다. 이로 인해 기업은 Spark를 사용하지 않게 되었습니다.

마침내 2015년에 창립자들은 콘테스트에 참여하여 가장 짧은 시간에 1페타바이트의 데이터를 처리하는 세계 기록을 경신하여 이러한 소문을 종식시키기로 결정했으며, 그 결과 언론의 주목과 인기를 얻었습니다.

2017년에는 기업 가치가 5억 달러로 평가되었지만 연간 수익은 100만 달러로 훨씬 낮았습니다. 이후 '정렬대회'에 참여해 직원 채용에 일부 변화를 주고, 대기업이 요구하는 기능을 갖춘 소프트웨어를 구축하기로 결정한 것이 성과를 거뒀다.

이후 데이터브릭스의 성장은 오르막길만 걷고 있다. 수익은 2018년에 처음으로 1억 달러를 기록했고 2019년에는 2억 달러에 도달하는 데 1년밖에 걸리지 않았습니다. Lakehouse 기능의 도입이 성공의 주요 요인이었습니다. 회사의 가치 는 2019년 3분기 62억 달러에서 2021년 3분기 약 380억 달러로 증가했습니다.

Databricks는 2020년에 4억 2,500만 달러의 연간 반복 수익을 보고했습니다.

Databricks는 2023년 1월 31일에 끝난 회계연도 동안 10억 달러 이상의 수익을 올렸다고 밝혔습니다. 이 사업은 전년도인 2022년에 60% 이상 성장했다고 보고했다.


세계에서 가장 가치 있는 스타트업 TOP 15
다음은 세계에서 가장 가치가 높은 15개 스타트업 목록입니다. TikTok의 모회사인 Bytedance는 기업 가치가 2,800억 달러에 달하는 세계에서 가장 가치 있는 스타트업입니다.

Databricks - 제품 및 기능

최신 주요 출시 제품 중 일부는 다음과 같습니다.

새로운 Delta Lake 릴리스를 통한 데이터 통합

Databricks는 2023년 6월 28일에 Delta Lake 데이터 스토리지 형식의 새 버전을 발표했습니다. 회사에 따르면 이 버전은 데이터 사일로를 제거합니다. 데이터 레이크 시스템의 분석 데이터 테이블에 대한 경쟁 오픈 소스 표준에 최근 추가된 사항은 Apache Foundation의 Iceberg 및 Hudi가 포함된 Delta Lake 3.0입니다.

인형

Databricks는 2023년 3월 24일 프로그래머가 AI로 구동되는 자체 챗봇 애플리케이션을 만들 수 있는 오픈 소스 언어 모델을 공개했습니다.

레이크하우스 페더레이션

Data + AI Summit에서 Databricks는 2023년 6월 28일에 Lakehouse Federation 기능을 출시했습니다. 이 새로운 기능을 통해 기업은 서로 다른 플랫폼을 결합하여 광범위한 플랫폼에서 데이터를 검색, 쿼리 및 관리할 수 있습니다. 벽으로 둘러싸인 데이터 시스템.

Databricks - 파트너십

Databricks는 많은 회사와 파트너십을 맺었습니다. 최근의 주요 파트너십 중 일부는 다음과 같습니다.

마이크로소프트

AI 앱 개발 도구를 출시하기 위해 2023년 8월 Databricks와의 새로운 파트너십을 통해 Microsoft는 AI 목표의 범위를 확대했습니다. 기업은 Databricks 소프트웨어를 사용하여 처음부터 자체 AI 모델을 만들 수 있습니다.

코바이

2023년 9월 11일, Databricks와 Kobai가 파트너십을 맺었습니다. 고객은 지식 그래프의 단순성과 통찰력과 함께 Databricks Lakehouse 플랫폼의 성능과 확장성을 활용할 수 있습니다.

3i인포텍

3i Infotech Ltd와 Databricks는 데이터와 AI를 단일 플랫폼에 결합하여 비즈니스 가치를 창출하기 위해 2023년 10월 18일 파트너십을 체결했습니다.

Databricks - 투자

Databricks는 24개 회사에 투자했습니다. 일부 투자는 다음과 같습니다.

계정 이름 날짜
당혹감 AI 2022년 -
아르시온 2018 -
예언.io 2017년 1월 -
촉매 2017년 9월 -
클린랩 - -

Databricks - 경쟁사

Databricks의 주요 경쟁업체는 다음과 같습니다.

  • 눈송이
  • 클라우데라
  • 데이터스택스
  • 큐볼레
  • MATLAB
  • 알테릭스
  • 드레미오
  • 인텔리쿠스

다음은 일부 경쟁사와의 몇 가지 비교입니다.

Snowflake - Snowflake는 Databricks보다 훨씬 큽니다. 둘 다 유연한 가격으로 거의 차이점이 없는 유사한 서비스를 제공합니다(Databricks는 대용량 데이터를 처리하는 반면 Snowflake는 중앙 집중식 액세스를 위해 클라우드 데이터의 탄력성을 제공합니다). Databricks는 경쟁사를 극복하기 위해 오랜 싸움을 벌이고 있습니다.

Cloudera - Cloudera는 조직의 데이터를 저장, 처리 및 분석하는 공통 클라우드 스토리지 및 관리 플랫폼을 제공합니다. Data Warehouse, 처리, 배포 형태의 Databricks와 유사합니다.


SaaS용 임베디드 BI 도구 | SaaS 비즈니스 인텔리전스 소프트웨어
임베디드 BI란 무엇인가요? 내장형 비즈니스 인텔리전스는 비즈니스 프로세스 애플리케이션 또는 포털 내에 BI 기능을 통합한 것입니다. 여기에서 자세한 내용을 읽어보세요!

Databricks - 향후 계획

Databricks가 2021년에 가장 빠르게 성장하는 두 가지 빅 데이터 도메인인 스트리밍과 딥 러닝에 대해 작업하고 있었던 것은 분명합니다. 그들은 이 두 가지 도메인을 처리하기 위해 다각적인 애플리케이션 프로그래밍 인터페이스(API)를 구축하고 있었습니다. Databricks는 또한 데이터 기반 조직을 정복하여 더 큰 이점을 얻기 위해 Data Lakehouse의 혁신을 가속화하는 데 열중하고 있습니다.

웹사이트에 따르면 Databricks는 작업 공간의 즐겨찾기 기능을 활성화할 계획입니다. 메모, 대시보드, 실험 및 검색 내용은 모두 즐겨찾기 목록에 저장되어 홈페이지에서 액세스할 수 있습니다.

Databricks - FAQ

데이터브릭스란 무엇인가요?

Databricks는 기계 학습 모델을 사용하여 엄청난 양의 데이터를 저장하고 처리하기 위한 클라우드 기반 도구입니다. 이는 Apache Spark 도구를 통해 수행됩니다.

Databricks를 설립한 사람은 누구입니까?

Databricks는 Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski 및 Arsalan Tavakoli-Shiraji 등 7명이 공동 창립했습니다.

데이터브릭스는 펀딩을 통해 얼마나 확보했나요?

Databricks는 12번의 자금 조달 라운드를 통해 약 40억 달러를 확보했습니다.

Databricks의 연간 수익은 얼마입니까?

Databricks는 2022년 말까지 연간 반복 수익(ARR)을 12억 7,500만 달러로 보고했습니다.

Databricks의 고객은 누구입니까?

Databricks는 전 세계적으로 약 6000명 이상의 고객을 보유하고 있습니다. 인기 있는 고객 중 일부는 다음과 같습니다.

  • 껍데기
  • CVS 건강
  • 리제네론
  • T 모바일
  • HSBC
  • 컴캐스트