Databricks — ujednolicona platforma do współpracy w zakresie danych, analiz i sztucznej inteligencji

Opublikowany: 2023-10-26

Company Profile to inicjatywa StartupTalky mająca na celu publikowanie zweryfikowanych informacji na temat różnych startupów i organizacji.

Współczesny świat, w którym żyjemy, w ogromnym stopniu zależy od danych i informacji. Wszystko wokół nas, rzeczy, których używamy, widzimy i którymi jesteśmy otoczeni, w taki czy inny sposób wpływa na technologię.

Wraz ze wzrostem zapotrzebowania na technologię, znaczenie danych zaczęło rosnąć. W miarę gromadzenia się danych pojawiła się potrzeba stworzenia magazynu do przechowywania, analizowania i przetwarzania tych danych do wielu celów.

To tutaj Databricks ujawnił swoją platformę. Databricks służy jako platforma chmurowa do przechowywania ogromnych danych, które można przetwarzać i działać płynnie. Jest to platforma analityczna zbudowana na popularnym produkcie typu open source o nazwie Apache Spark . Zajęli 10,19% udziału w rynku i są trzecim co do wielkości graczem na rynku analityki cyfrowej.

Databricks — najważniejsze informacje o firmie

Nazwa startowa Kostki danych
Siedziba San Francisco, Kalifornia, Stany Zjednoczone
Przemysł Oprogramowanie komputerowe, dane, sztuczna inteligencja
Założyciele Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia i Arsalan Tavakoli
Założony 2013
Strona internetowa databricks.com

Kostki danych — informacje
Kostki danych - Przemysł
Kostki danych - Założyciele
Kostki danych — historia startowa
Kostki danych - misja
Kostki danych - logo
Kostki danych - model biznesowy i dochodowy
Kostki danych - Pracownicy
Kostki danych — finansowanie i inwestorzy
Kostki danych — przejęcia
Databricks – obecność w mediach społecznościowych
Kostki danych — wzrost i przychody
Kostki danych — produkty i funkcje
Kostki danych - inwestycje
Kostki danych - partnerstwa
Kostki danych — konkurenci
Kostki danych — plany na przyszłość

Kostki danych — informacje

Firma Databricks została założona przez twórców Apache Spark jako firma zajmująca się przetwarzaniem danych i sztuczną inteligencją (AI). Pełni funkcję magazynu danych ustrukturyzowanych i nieustrukturyzowanych w chmurze. Databricks służy również jako połączona platforma dla wszystkich funkcji danych, sztucznej inteligencji i analityki, która pomaga inżynierom danych, analitykom i badaczom danych płynnie wykonywać ogromne obciążenia. Odbywa się to poprzez platformę Lakehouse obsługiwaną przez Apache Spark, która jest najlepszą kombinacją funkcji Data Lakes (niski koszt i elastyczność) oraz Data Warehouses (wydajność).

Oprócz Apache Spark, Delta Lake i MLflow to dwa pozostałe projekty typu open source, które stoją za skutecznymi funkcjami platformy Lakehouse. Databricks świadczą usługi Unified Data za pośrednictwem wielu chmur, a mianowicie Google Cloud, AWS, Microsoft Azure i Alibaba Cloud.

Informacje o kostkach danych

Kostki danych - Przemysł

Branża danych stała się dużą i znaczącą branżą we wszystkich aspektach życia i biznesu. Według Statisty oczekuje się, że do 2027 r. rynek danych wzrośnie do aż 103 miliardów dolarów. Jest to dwukrotnie więcej niż w 2018 r. Sztuczna inteligencja to kolejny szybko rozwijający się rynek, który stał się istotnym elementem nowoczesnych gałęzi przemysłu.


Kluczowe czynniki transformacji cyfrowej umożliwiające wymyślenie biznesu na nowo
Transformacja cyfrowa odkrywa na nowo biznes i kulturę pracy. Przeczytaj ten artykuł, aby poznać kluczowe czynniki transformacji cyfrowej.

Kostki danych - Założyciele

Założyciele Databricks
Założyciele Databricks

Współzałożycielami firmy Databricks jest kilku profesorów z Uniwersytetu Kalifornijskiego i pięciu byłych doktorantów z Berkeley. studenci.

  • Ali Ghodsi , współzałożyciel i dyrektor generalny Databricks, był jednym z twórców Apache Spark. Był profesorem na Uniwersytecie Kalifornijskim (UC), a także członkiem zarządu Rising Lab na Uniwersytecie Kalifornijskim. Ponosił główną odpowiedzialność za rozwój i ekspansję Databricks na całym świecie.
  • Ion Stoica , współzałożyciel i prezes Databricks, jest także profesorem na Uniwersytecie Kalifornijskim w Berkeley. Jest także współdyrektorem w AMPLab. Ponadto był współzałożycielem start-upu Conviva zajmującego się dystrybucją wideo na dużą skalę.
  • Matei Zaharia , współzałożyciel i główny technolog w Databricks, był wcześniej częścią projektu Spark, a obecnie jest wiceprezesem Fundacji Apache. Nagrodę za rozprawę doktorską ACM przyznano mu w 2014 roku za badania nad wielkoskalowymi systemami komputerowymi.
  • Patrick Wendell , współzałożyciel i wiceprezes ds. inżynierii w Databricks, odegrał główną rolę w działalności Sparka.
  • Reynold Xin , współzałożyciel i główny architekt, który zajmuje się operacjami technicznymi w Apache Spark. Zdobył nagrodę dla najlepszego demo w 2011 roku na VLDB.
  • Andy Konwinski , współzałożyciel i wiceprezes zarządu, zajmuje się operacjami AI w Databricks. Wcześniej zajmował się działaniami rynkowymi firmy przy tworzeniu Spark Summit.
  • Arsalan Tavakoli-Shiraji , współzałożyciel i starszy wiceprezes ds. inżynierii terenowej w Databricks, wcześniej pracował w McKinsey jako zastępca dyrektora. Był byłym doktorantem. student Uniwersytetu Kalifornijskiego w Berkeley.

Kostki danych — historia startowa

Ali Ghodsi, dyrektor generalny Databricks, pasjonował się kodowaniem od ósmego roku życia, kiedy rodzice kupili mu używanego Commodore 64. Kontynuował studia wyższe w zakresie inżynierii komputerowej i uzyskał tytuł doktora. w przetwarzaniu rozproszonym. Później, w 2009 roku, połączył siły z Ionem Stoicą i wspólnie stworzyli „Spark”, którego inicjatorem był już Matei Zaharia.

Następnie nawiązali współpracę z innym zespołem pracującym nad uczeniem maszynowym i wspólnie wprowadzili na rynek „Apache Spark”. Początkowo żadna firma nie zwróciła na to uwagi, ponieważ technologia wydawała się obca. W 2013 roku Ben Horowitz (współzałożyciel Andreessen Horowitz VC) zasiał w nich nadzieję, inwestując 14 milionów dolarów i zachęcając ich do stworzenia firmy, która będzie platformą do uruchamiania Apache Spark. Tym samym firma Databricks powstała w 2013 roku.

Kostki danych - Misja

Misją Databricks jest zwiększenie wydajności ujednolicenia danych poprzez wprowadzanie innowacyjnych technik ujednolicania danych, sztucznej inteligencji i analityki. Starają się, aby doświadczenie klienta było bardziej angażujące.

Kostki danych - logo

Logo kostek danych
Logo kostek danych

Logo Databricks przypomina dwie cegły idealnie ułożone jak foldery z danymi zorganizowane na półce. Wygląda na to, że Databricks zamierzał zachować logo z punktem początkowym i końcowym, bez żadnych przerw pomiędzy nimi. Można to zrobić, aby zasugerować, że ujednolicają one funkcje gromadzenia, przechowywania i analizy danych w ramach jednej wspólnej platformy bez konieczności wychodzenia, ponieważ wszystko zostało tutaj omówione.

Kostki danych - model biznesowy i dochodowy

Ich model biznesowy opiera się na oprogramowaniu internetowym, które zapewnia platformę do współpracy z Apache Spark. Ułatwia automatyczne zarządzanie grupami i notatniki w stylu Pythona dla inżynierów danych i naukowców.

Databricks udostępnia swoje zasoby w formie oprogramowania jako usługi (SaaS) i generuje przychody dzięki subskrypcjom. Ich główne usługi są świadczone za pośrednictwem trzech platform chmurowych, a mianowicie:

  • Microsoft Azure
  • Chmura Google
  • Usługi internetowe Amazona

Chociaż ceny poszczególnych chmur są różne, należy zwrócić uwagę na wspólny czynnik: „Płać tylko za to, z czego korzystasz” . Koszty są obliczane niezależnie od wybranych usług i nie wymagają płatności z góry. Klienci są zobowiązani płacić wyłącznie za liczbę wykorzystanych zasobów.

Kostki danych - Pracownicy

Według danych z 2023 r. firma Databricks zatrudniała na całym świecie ponad 5 001–10 000 pracowników . W listopadzie 2019 r. firma Databricks świętowała kamień milowy w postaci zatrudnienia 1000. pracownika pełnoetatowego. Dotarcie do pierwszych 1000 pracowników zajęło 6 lat, a zatrudnienie pozostałych zajęło niecałe 2 lata.

Kostki danych — finansowanie i inwestorzy

Dzięki niedawnemu finansowaniu w wysokości 503,7 miliona dolarów firma Databricks zebrała 4 miliardy dolarów w 12 rundach finansowania od chwili jej powstania. W sumie w Databricks zainwestowało dotychczas 49 inwestorów .

Data Scena Kwota Inwestorzy
14 września 2023 r Seria I 503,7 mln dolarów Cena T. Rowe’a
31 lipca 2023 r Rynek wtórny - -
3 marca 2023 r Seria H - -
4 września 2021 r Runda Anioła 200 tys. dolarów -
31 sierpnia 2021 r Seria H 1,6 miliarda dolarów Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, pakiet funduszy BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, House Fund Geodezyjne i Green Bay Ventures.
1 lutego 2021 r Seria G 1 miliard dolarów Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital i Octahedron Capital.
22 października 2019 r Seria F 400 milionów dolarów Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic i Green Bay Ventures.
5 lutego 2019 r Seria E 250 milionów dolarów Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures i Geodesic Capital.
22 sierpnia 2017 r Seria D 140 milionów dolarów New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital i Green Bay Ventures.
15 grudnia 2016 r Seria C 60 milionów dolarów Stowarzyszenie New Enterprise, Andreessen Horowitz i SineWave Ventures.
30 czerwca 2014 r Seria B 33 miliony dolarów Stowarzyszenie Nowego Przedsiębiorczości, Andreessen Horowitz i DCVC.
25 września 2013 Seria A 14 milionów dolarów Andreessen Horowitz, SV Angel i Alfred Chuang.

Kostki danych — przejęcia

Databricks przejął do tej pory siedem firm. Poniżej znajdują się szczegóły:

Nazwa konta Data Kwota
Arion 23 października 2023 r 100 milionów dolarów
MozaikaML 26 czerwca 2023 r 1,3 miliarda dolarów
Okera 3 maja 2023 r -
DataJoy Inc. 13 października 2022 r -
Laboratoria Cortexu 15 kwietnia 2022 r -
8080 laboratoriów 6 października 2021 r -
Redash 24 czerwca 2020 r -

Lista najlepszych start-upów zajmujących się przetwarzaniem w chmurze w Indiach i ich rozwój
Cloud Computing stał się nową normą, trend dał początek ogromnej liczbie startupów, które opierają się na chmurze. Te firmy są bardziej wydajne.

Databricks – obecność w mediach społecznościowych

Databricks ma dobrą obecność na Twitterze i LinkedIn. Wykorzystuje te platformy do promowania swoich produktów i usług w celu uzyskania przewagi rynkowej. Publikują także posty dotyczące swoich światowych tras koncertowych i wydarzeń inaugurujących najnowsze wynalazki. Linki do blogów i artykułów przedstawiających Databricks lub ich produkty oraz informacje związane z ofertami pracy można również znaleźć na ich platformach społecznościowych.

Kostki danych — wzrost i przychody

Firma Databricks została założona w 2013 roku, a jej rdzeniem jest technologia Spark. Po jej powstaniu natychmiast pojawiła się plotka, że ​​„Technologia Spark nie będzie działać, jeśli Twoje dane nie zmieszczą się w ich pamięci”. Zniechęciło to firmy do korzystania ze Sparka.

Wreszcie w 2015 roku założyciele postanowili zakończyć te plotki, biorąc udział w konkursie, w którym pobili rekord świata w przetwarzaniu jednego petabajta danych w najkrótszym czasie, dzięki czemu zyskali uwagę i popularność mediów.

Do 2017 roku wyceniono je na 500 milionów dolarów, ale ich roczne przychody były znacznie niższe i wyniosły 1 milion dolarów. Późniejszy udział w „konkursie sortowania”, wprowadzenie zmian w zatrudnianiu pracowników i podjęcie decyzji o budowie oprogramowania o funkcjonalnościach wymaganych przez duże przedsiębiorstwa, okazało się owocne.

Od tego czasu rozwój Databricks jedynie piął się w górę. Ich przychody po raz pierwszy przekroczyły 100 milionów dolarów w 2018 roku, a w 2019 roku osiągnęły poziom 200 milionów dolarów w ciągu zaledwie roku. Wprowadzenie funkcji Lakehouse było głównym czynnikiem sukcesu. Wycena firmy wzrosła z 6,2 miliarda dolarów w trzecim kwartale 2019 roku do około 38 miliardów dolarów w trzecim kwartale 2021 roku.

Firma Databricks odnotowała roczne stałe przychody w wysokości 425 mln dolarów w 2020 r.

Firma Databricks ujawniła, że ​​w roku finansowym kończącym się 31 stycznia 2023 r. przyniosła przychody przekraczające 1 miliard dolarów. Firma podała, że ​​w poprzednim roku 2022 rozwinęła się o ponad 60%.


Top 15 najwyżej cenionych startupów na świecie
Oto lista 15 najwyżej cenionych startupów na świecie. Bytedance, spółka matka TikToka, to najcenniejszy startup na świecie z wyceną na 280 miliardów dolarów.

Kostki danych — produkty i funkcje

Oto niektóre z najnowszych, znaczących premier:

Jedność danych dzięki nowej wersji Delta Lake

Firma Databricks ogłosiła 28 czerwca 2023 r. nową wersję swojego formatu przechowywania danych Delta Lake. Według firmy wersja ta eliminuje silosy danych. Najnowszym dodatkiem do konkurencyjnych standardów open source dla tabel danych analitycznych w systemach Data Lake jest Delta Lake 3.0, który obejmuje Iceberg i Hudi z Apache Foundation.

Laleczka

24 marca 2023 r. firma Databricks zaprezentowała model języka typu open source, który umożliwia programistom tworzenie własnych aplikacji chatbotowych opartych na sztucznej inteligencji.

Federacja Lakehouse

28 czerwca 2023 r. na szczycie Data + AI firma Databricks uruchomiła funkcję, którą określa mianem Lakehouse Federation. Dzięki tej nowej funkcji firmy mogą odkrywać, wysyłać zapytania i zarządzać swoimi danymi na szerokiej gamie platform, łącząc swoje odmienne murowane systemy danych.

Kostki danych - partnerstwa

Databricks nawiązał współpracę z wieloma firmami. Niektóre z ostatnich znaczących partnerstw to:

Microsoftu

Dzięki nowemu partnerstwu z Databricks w sierpniu 2023 r. w celu wprowadzenia na rynek narzędzi do tworzenia aplikacji AI, Microsoft zwiększył zakres swoich celów związanych ze sztuczną inteligencją. Firmy będą mogły tworzyć od podstaw własne modele sztucznej inteligencji, korzystając z oprogramowania Databricks.

Kobai

11 września 2023 r. firmy Databricks i Kobai nawiązały współpracę. Klienci mogą korzystać z możliwości i skalowalności platformy Databricks Lakehouse, a także z prostoty i wglądu w wykresy wiedzy.

3i Infotech

Aby generować wartość biznesową poprzez połączenie danych i sztucznej inteligencji na jednej platformie, 18 października 2023 r. firmy 3i Infotech Ltd i Databricks nawiązały współpracę.

Kostki danych - inwestycje

Databricks zainwestował w 24 spółki. Poniżej wymieniono niektóre z inwestycji:

Nazwa konta Data Kwota
Zakłopotanie AI 2022 -
Arion 2018 -
Proroctwo.io Styczeń 2017 -
Katalizator Wrzesień 2017 -
Czyste laboratorium - -

Kostki danych — konkurenci

Niektórzy z czołowych konkurentów Databricks to:

  • Płatek śniegu
  • Chmura
  • Datatax
  • Qubol
  • MATLAB
  • Alteryx
  • Dremio
  • Intellicus

Oto kilka porównań z niektórymi konkurentami:

Płatek śniegu — płatek śniegu jest znacznie większy niż Databricks. Obie oferują podobne usługi z niewielkimi różnicami (Databricks przetwarza duże dane, a Snowflake oferuje elastyczność danych w chmurze dla scentralizowanego dostępu) za elastyczną cenę. Databricks toczy długą bitwę, aby pokonać swojego konkurenta.

Cloudera — Cloudera zapewnia wspólną platformę do przechowywania i zarządzania w chmurze, która przechowuje, przetwarza i analizuje dane dla organizacji. Jest podobny do Databricks w formie hurtowni danych, przetwarzania i dystrybucji.


Wbudowane narzędzia BI dla SaaS | Oprogramowanie do analizy biznesowej SaaS
Co to jest wbudowane BI? Wbudowana analiza biznesowa to integracja możliwości BI z aplikacjami lub portalami procesów biznesowych. Przeczytaj więcej tutaj!

Kostki danych — plany na przyszłość

Jest oczywiste, że firma Databricks pracowała w 2021 r. nad dwiema najszybciej rozwijającymi się domenami dużych zbiorów danych, Streaming i Deep-Learning. Budowała wieloaspektowy interfejs programowania aplikacji (API) do przetwarzania tych dwóch domen. Firmie Databricks zależy również na przyspieszeniu innowacji Data Lakehouse, aby uzyskać większą przewagę poprzez podbój organizacji opartych na danych.

Według ich strony internetowej Databricks planuje włączyć funkcję ulubionych w obszarze roboczym. Notatki, pulpity nawigacyjne, eksperymenty i wyszukiwania można zapisać na liście ulubionych, do której można następnie uzyskać dostęp ze strony głównej.

Kostki danych — często zadawane pytania

Co to jest kostki danych?

Databricks to oparte na chmurze narzędzie do przechowywania i przetwarzania ogromnych ilości danych przy użyciu modeli Machine Learning. Odbywa się to za pomocą narzędzia Apache Spark.

Kto założył Databricks?

Databricks zostało założone przez siedem osób, a mianowicie: Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski i Arsalan Tavakoli-Shiraji.

Ile Databricks zabezpieczył dzięki finansowaniu?

W ramach 12 rund finansowania firma Databricks zabezpieczyła około 4 miliardy dolarów.

Jakie są roczne przychody Databricks?

Firma Databricks odnotowała roczny stały przychód (ARR) w wysokości 1,275 miliarda dolarów za rok kończący się w 2022 roku.

Kim są klienci Databricks?

Databricks ma ponad 6000 klientów na całym świecie. Niektórzy z ich popularnych klientów to:

  • Powłoka
  • Zdrowie CVS
  • Regeneracja
  • T Mobile
  • HSBC
  • Comcast