Databricks — ujednolicona platforma do współpracy w zakresie danych, analiz i sztucznej inteligencji
Opublikowany: 2023-10-26Company Profile to inicjatywa StartupTalky mająca na celu publikowanie zweryfikowanych informacji na temat różnych startupów i organizacji.
Współczesny świat, w którym żyjemy, w ogromnym stopniu zależy od danych i informacji. Wszystko wokół nas, rzeczy, których używamy, widzimy i którymi jesteśmy otoczeni, w taki czy inny sposób wpływa na technologię.
Wraz ze wzrostem zapotrzebowania na technologię, znaczenie danych zaczęło rosnąć. W miarę gromadzenia się danych pojawiła się potrzeba stworzenia magazynu do przechowywania, analizowania i przetwarzania tych danych do wielu celów.
To tutaj Databricks ujawnił swoją platformę. Databricks służy jako platforma chmurowa do przechowywania ogromnych danych, które można przetwarzać i działać płynnie. Jest to platforma analityczna zbudowana na popularnym produkcie typu open source o nazwie Apache Spark . Zajęli 10,19% udziału w rynku i są trzecim co do wielkości graczem na rynku analityki cyfrowej.
Databricks — najważniejsze informacje o firmie
Nazwa startowa | Kostki danych |
---|---|
Siedziba | San Francisco, Kalifornia, Stany Zjednoczone |
Przemysł | Oprogramowanie komputerowe, dane, sztuczna inteligencja |
Założyciele | Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia i Arsalan Tavakoli |
Założony | 2013 |
Strona internetowa | databricks.com |
Kostki danych — informacje
Kostki danych - Przemysł
Kostki danych - Założyciele
Kostki danych — historia startowa
Kostki danych - misja
Kostki danych - logo
Kostki danych - model biznesowy i dochodowy
Kostki danych - Pracownicy
Kostki danych — finansowanie i inwestorzy
Kostki danych — przejęcia
Databricks – obecność w mediach społecznościowych
Kostki danych — wzrost i przychody
Kostki danych — produkty i funkcje
Kostki danych - inwestycje
Kostki danych - partnerstwa
Kostki danych — konkurenci
Kostki danych — plany na przyszłość
Kostki danych — informacje
Firma Databricks została założona przez twórców Apache Spark jako firma zajmująca się przetwarzaniem danych i sztuczną inteligencją (AI). Pełni funkcję magazynu danych ustrukturyzowanych i nieustrukturyzowanych w chmurze. Databricks służy również jako połączona platforma dla wszystkich funkcji danych, sztucznej inteligencji i analityki, która pomaga inżynierom danych, analitykom i badaczom danych płynnie wykonywać ogromne obciążenia. Odbywa się to poprzez platformę Lakehouse obsługiwaną przez Apache Spark, która jest najlepszą kombinacją funkcji Data Lakes (niski koszt i elastyczność) oraz Data Warehouses (wydajność).
Oprócz Apache Spark, Delta Lake i MLflow to dwa pozostałe projekty typu open source, które stoją za skutecznymi funkcjami platformy Lakehouse. Databricks świadczą usługi Unified Data za pośrednictwem wielu chmur, a mianowicie Google Cloud, AWS, Microsoft Azure i Alibaba Cloud.
Kostki danych - Przemysł
Branża danych stała się dużą i znaczącą branżą we wszystkich aspektach życia i biznesu. Według Statisty oczekuje się, że do 2027 r. rynek danych wzrośnie do aż 103 miliardów dolarów. Jest to dwukrotnie więcej niż w 2018 r. Sztuczna inteligencja to kolejny szybko rozwijający się rynek, który stał się istotnym elementem nowoczesnych gałęzi przemysłu.
Kostki danych - Założyciele
Współzałożycielami firmy Databricks jest kilku profesorów z Uniwersytetu Kalifornijskiego i pięciu byłych doktorantów z Berkeley. studenci.
- Ali Ghodsi , współzałożyciel i dyrektor generalny Databricks, był jednym z twórców Apache Spark. Był profesorem na Uniwersytecie Kalifornijskim (UC), a także członkiem zarządu Rising Lab na Uniwersytecie Kalifornijskim. Ponosił główną odpowiedzialność za rozwój i ekspansję Databricks na całym świecie.
- Ion Stoica , współzałożyciel i prezes Databricks, jest także profesorem na Uniwersytecie Kalifornijskim w Berkeley. Jest także współdyrektorem w AMPLab. Ponadto był współzałożycielem start-upu Conviva zajmującego się dystrybucją wideo na dużą skalę.
- Matei Zaharia , współzałożyciel i główny technolog w Databricks, był wcześniej częścią projektu Spark, a obecnie jest wiceprezesem Fundacji Apache. Nagrodę za rozprawę doktorską ACM przyznano mu w 2014 roku za badania nad wielkoskalowymi systemami komputerowymi.
- Patrick Wendell , współzałożyciel i wiceprezes ds. inżynierii w Databricks, odegrał główną rolę w działalności Sparka.
- Reynold Xin , współzałożyciel i główny architekt, który zajmuje się operacjami technicznymi w Apache Spark. Zdobył nagrodę dla najlepszego demo w 2011 roku na VLDB.
- Andy Konwinski , współzałożyciel i wiceprezes zarządu, zajmuje się operacjami AI w Databricks. Wcześniej zajmował się działaniami rynkowymi firmy przy tworzeniu Spark Summit.
- Arsalan Tavakoli-Shiraji , współzałożyciel i starszy wiceprezes ds. inżynierii terenowej w Databricks, wcześniej pracował w McKinsey jako zastępca dyrektora. Był byłym doktorantem. student Uniwersytetu Kalifornijskiego w Berkeley.
Kostki danych — historia startowa
Ali Ghodsi, dyrektor generalny Databricks, pasjonował się kodowaniem od ósmego roku życia, kiedy rodzice kupili mu używanego Commodore 64. Kontynuował studia wyższe w zakresie inżynierii komputerowej i uzyskał tytuł doktora. w przetwarzaniu rozproszonym. Później, w 2009 roku, połączył siły z Ionem Stoicą i wspólnie stworzyli „Spark”, którego inicjatorem był już Matei Zaharia.
Następnie nawiązali współpracę z innym zespołem pracującym nad uczeniem maszynowym i wspólnie wprowadzili na rynek „Apache Spark”. Początkowo żadna firma nie zwróciła na to uwagi, ponieważ technologia wydawała się obca. W 2013 roku Ben Horowitz (współzałożyciel Andreessen Horowitz VC) zasiał w nich nadzieję, inwestując 14 milionów dolarów i zachęcając ich do stworzenia firmy, która będzie platformą do uruchamiania Apache Spark. Tym samym firma Databricks powstała w 2013 roku.
Kostki danych - Misja
Misją Databricks jest zwiększenie wydajności ujednolicenia danych poprzez wprowadzanie innowacyjnych technik ujednolicania danych, sztucznej inteligencji i analityki. Starają się, aby doświadczenie klienta było bardziej angażujące.
Kostki danych - logo
Logo Databricks przypomina dwie cegły idealnie ułożone jak foldery z danymi zorganizowane na półce. Wygląda na to, że Databricks zamierzał zachować logo z punktem początkowym i końcowym, bez żadnych przerw pomiędzy nimi. Można to zrobić, aby zasugerować, że ujednolicają one funkcje gromadzenia, przechowywania i analizy danych w ramach jednej wspólnej platformy bez konieczności wychodzenia, ponieważ wszystko zostało tutaj omówione.
Kostki danych - model biznesowy i dochodowy
Ich model biznesowy opiera się na oprogramowaniu internetowym, które zapewnia platformę do współpracy z Apache Spark. Ułatwia automatyczne zarządzanie grupami i notatniki w stylu Pythona dla inżynierów danych i naukowców.
Databricks udostępnia swoje zasoby w formie oprogramowania jako usługi (SaaS) i generuje przychody dzięki subskrypcjom. Ich główne usługi są świadczone za pośrednictwem trzech platform chmurowych, a mianowicie:
- Microsoft Azure
- Chmura Google
- Usługi internetowe Amazona
Chociaż ceny poszczególnych chmur są różne, należy zwrócić uwagę na wspólny czynnik: „Płać tylko za to, z czego korzystasz” . Koszty są obliczane niezależnie od wybranych usług i nie wymagają płatności z góry. Klienci są zobowiązani płacić wyłącznie za liczbę wykorzystanych zasobów.
Kostki danych - Pracownicy
Według danych z 2023 r. firma Databricks zatrudniała na całym świecie ponad 5 001–10 000 pracowników . W listopadzie 2019 r. firma Databricks świętowała kamień milowy w postaci zatrudnienia 1000. pracownika pełnoetatowego. Dotarcie do pierwszych 1000 pracowników zajęło 6 lat, a zatrudnienie pozostałych zajęło niecałe 2 lata.
Kostki danych — finansowanie i inwestorzy
Dzięki niedawnemu finansowaniu w wysokości 503,7 miliona dolarów firma Databricks zebrała 4 miliardy dolarów w 12 rundach finansowania od chwili jej powstania. W sumie w Databricks zainwestowało dotychczas 49 inwestorów .
Data | Scena | Kwota | Inwestorzy |
---|---|---|---|
14 września 2023 r | Seria I | 503,7 mln dolarów | Cena T. Rowe’a |
31 lipca 2023 r | Rynek wtórny | - | - |
3 marca 2023 r | Seria H | - | - |
4 września 2021 r | Runda Anioła | 200 tys. dolarów | - |
31 sierpnia 2021 r | Seria H | 1,6 miliarda dolarów | Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, pakiet funduszy BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, House Fund Geodezyjne i Green Bay Ventures. |
1 lutego 2021 r | Seria G | 1 miliard dolarów | Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital i Octahedron Capital. |
22 października 2019 r | Seria F | 400 milionów dolarów | Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic i Green Bay Ventures. |
5 lutego 2019 r | Seria E | 250 milionów dolarów | Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures i Geodesic Capital. |
22 sierpnia 2017 r | Seria D | 140 milionów dolarów | New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital i Green Bay Ventures. |
15 grudnia 2016 r | Seria C | 60 milionów dolarów | Stowarzyszenie New Enterprise, Andreessen Horowitz i SineWave Ventures. |
30 czerwca 2014 r | Seria B | 33 miliony dolarów | Stowarzyszenie Nowego Przedsiębiorczości, Andreessen Horowitz i DCVC. |
25 września 2013 | Seria A | 14 milionów dolarów | Andreessen Horowitz, SV Angel i Alfred Chuang. |
Kostki danych — przejęcia
Databricks przejął do tej pory siedem firm. Poniżej znajdują się szczegóły:
Nazwa konta | Data | Kwota |
---|---|---|
Arion | 23 października 2023 r | 100 milionów dolarów |
MozaikaML | 26 czerwca 2023 r | 1,3 miliarda dolarów |
Okera | 3 maja 2023 r | - |
DataJoy Inc. | 13 października 2022 r | - |
Laboratoria Cortexu | 15 kwietnia 2022 r | - |
8080 laboratoriów | 6 października 2021 r | - |
Redash | 24 czerwca 2020 r | - |
Databricks – obecność w mediach społecznościowych
Databricks ma dobrą obecność na Twitterze i LinkedIn. Wykorzystuje te platformy do promowania swoich produktów i usług w celu uzyskania przewagi rynkowej. Publikują także posty dotyczące swoich światowych tras koncertowych i wydarzeń inaugurujących najnowsze wynalazki. Linki do blogów i artykułów przedstawiających Databricks lub ich produkty oraz informacje związane z ofertami pracy można również znaleźć na ich platformach społecznościowych.
Kostki danych — wzrost i przychody
Firma Databricks została założona w 2013 roku, a jej rdzeniem jest technologia Spark. Po jej powstaniu natychmiast pojawiła się plotka, że „Technologia Spark nie będzie działać, jeśli Twoje dane nie zmieszczą się w ich pamięci”. Zniechęciło to firmy do korzystania ze Sparka.
Wreszcie w 2015 roku założyciele postanowili zakończyć te plotki, biorąc udział w konkursie, w którym pobili rekord świata w przetwarzaniu jednego petabajta danych w najkrótszym czasie, dzięki czemu zyskali uwagę i popularność mediów.
Do 2017 roku wyceniono je na 500 milionów dolarów, ale ich roczne przychody były znacznie niższe i wyniosły 1 milion dolarów. Późniejszy udział w „konkursie sortowania”, wprowadzenie zmian w zatrudnianiu pracowników i podjęcie decyzji o budowie oprogramowania o funkcjonalnościach wymaganych przez duże przedsiębiorstwa, okazało się owocne.
Od tego czasu rozwój Databricks jedynie piął się w górę. Ich przychody po raz pierwszy przekroczyły 100 milionów dolarów w 2018 roku, a w 2019 roku osiągnęły poziom 200 milionów dolarów w ciągu zaledwie roku. Wprowadzenie funkcji Lakehouse było głównym czynnikiem sukcesu. Wycena firmy wzrosła z 6,2 miliarda dolarów w trzecim kwartale 2019 roku do około 38 miliardów dolarów w trzecim kwartale 2021 roku.
Firma Databricks odnotowała roczne stałe przychody w wysokości 425 mln dolarów w 2020 r.
Firma Databricks ujawniła, że w roku finansowym kończącym się 31 stycznia 2023 r. przyniosła przychody przekraczające 1 miliard dolarów. Firma podała, że w poprzednim roku 2022 rozwinęła się o ponad 60%.
Kostki danych — produkty i funkcje
Oto niektóre z najnowszych, znaczących premier:
Jedność danych dzięki nowej wersji Delta Lake
Firma Databricks ogłosiła 28 czerwca 2023 r. nową wersję swojego formatu przechowywania danych Delta Lake. Według firmy wersja ta eliminuje silosy danych. Najnowszym dodatkiem do konkurencyjnych standardów open source dla tabel danych analitycznych w systemach Data Lake jest Delta Lake 3.0, który obejmuje Iceberg i Hudi z Apache Foundation.
Laleczka
24 marca 2023 r. firma Databricks zaprezentowała model języka typu open source, który umożliwia programistom tworzenie własnych aplikacji chatbotowych opartych na sztucznej inteligencji.
Federacja Lakehouse
28 czerwca 2023 r. na szczycie Data + AI firma Databricks uruchomiła funkcję, którą określa mianem Lakehouse Federation. Dzięki tej nowej funkcji firmy mogą odkrywać, wysyłać zapytania i zarządzać swoimi danymi na szerokiej gamie platform, łącząc swoje odmienne murowane systemy danych.
Kostki danych - partnerstwa
Databricks nawiązał współpracę z wieloma firmami. Niektóre z ostatnich znaczących partnerstw to:
Microsoftu
Dzięki nowemu partnerstwu z Databricks w sierpniu 2023 r. w celu wprowadzenia na rynek narzędzi do tworzenia aplikacji AI, Microsoft zwiększył zakres swoich celów związanych ze sztuczną inteligencją. Firmy będą mogły tworzyć od podstaw własne modele sztucznej inteligencji, korzystając z oprogramowania Databricks.
Kobai
11 września 2023 r. firmy Databricks i Kobai nawiązały współpracę. Klienci mogą korzystać z możliwości i skalowalności platformy Databricks Lakehouse, a także z prostoty i wglądu w wykresy wiedzy.
3i Infotech
Aby generować wartość biznesową poprzez połączenie danych i sztucznej inteligencji na jednej platformie, 18 października 2023 r. firmy 3i Infotech Ltd i Databricks nawiązały współpracę.
Kostki danych - inwestycje
Databricks zainwestował w 24 spółki. Poniżej wymieniono niektóre z inwestycji:
Nazwa konta | Data | Kwota |
---|---|---|
Zakłopotanie AI | 2022 | - |
Arion | 2018 | - |
Proroctwo.io | Styczeń 2017 | - |
Katalizator | Wrzesień 2017 | - |
Czyste laboratorium | - | - |
Kostki danych — konkurenci
Niektórzy z czołowych konkurentów Databricks to:
- Płatek śniegu
- Chmura
- Datatax
- Qubol
- MATLAB
- Alteryx
- Dremio
- Intellicus
Oto kilka porównań z niektórymi konkurentami:
Płatek śniegu — płatek śniegu jest znacznie większy niż Databricks. Obie oferują podobne usługi z niewielkimi różnicami (Databricks przetwarza duże dane, a Snowflake oferuje elastyczność danych w chmurze dla scentralizowanego dostępu) za elastyczną cenę. Databricks toczy długą bitwę, aby pokonać swojego konkurenta.
Cloudera — Cloudera zapewnia wspólną platformę do przechowywania i zarządzania w chmurze, która przechowuje, przetwarza i analizuje dane dla organizacji. Jest podobny do Databricks w formie hurtowni danych, przetwarzania i dystrybucji.
Kostki danych — plany na przyszłość
Jest oczywiste, że firma Databricks pracowała w 2021 r. nad dwiema najszybciej rozwijającymi się domenami dużych zbiorów danych, Streaming i Deep-Learning. Budowała wieloaspektowy interfejs programowania aplikacji (API) do przetwarzania tych dwóch domen. Firmie Databricks zależy również na przyspieszeniu innowacji Data Lakehouse, aby uzyskać większą przewagę poprzez podbój organizacji opartych na danych.
Według ich strony internetowej Databricks planuje włączyć funkcję ulubionych w obszarze roboczym. Notatki, pulpity nawigacyjne, eksperymenty i wyszukiwania można zapisać na liście ulubionych, do której można następnie uzyskać dostęp ze strony głównej.
Kostki danych — często zadawane pytania
Co to jest kostki danych?
Databricks to oparte na chmurze narzędzie do przechowywania i przetwarzania ogromnych ilości danych przy użyciu modeli Machine Learning. Odbywa się to za pomocą narzędzia Apache Spark.
Kto założył Databricks?
Databricks zostało założone przez siedem osób, a mianowicie: Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski i Arsalan Tavakoli-Shiraji.
Ile Databricks zabezpieczył dzięki finansowaniu?
W ramach 12 rund finansowania firma Databricks zabezpieczyła około 4 miliardy dolarów.
Jakie są roczne przychody Databricks?
Firma Databricks odnotowała roczny stały przychód (ARR) w wysokości 1,275 miliarda dolarów za rok kończący się w 2022 roku.
Kim są klienci Databricks?
Databricks ma ponad 6000 klientów na całym świecie. Niektórzy z ich popularnych klientów to:
- Powłoka
- Zdrowie CVS
- Regeneracja
- T Mobile
- HSBC
- Comcast