Databricks – Eine einheitliche Plattform für die Zusammenarbeit von Daten, Analysen und KI
Veröffentlicht: 2023-10-26Company Profile ist eine Initiative von StartupTalky zur Veröffentlichung verifizierter Informationen über verschiedene Startups und Organisationen.
Die moderne Welt, in der wir heute leben, hängt massiv von Daten und Informationen ab. Alles um uns herum, die Dinge, die wir nutzen, sehen und von denen wir umgeben sind, wird auf die eine oder andere Weise von der Technologie beeinflusst.
Mit dem wachsenden Bedarf an Technologie begann die Bedeutung von Daten zu florieren. Mit der Anhäufung von Daten entstand der Bedarf an einem Lager, um diese Daten für verschiedene Zwecke zu speichern, zu analysieren und zu verarbeiten .
Hier stellte Databricks seine Plattform vor. Databricks dient als Cloud-Plattform zur Speicherung enormer Datenmengen, die verarbeitet und reibungslos ausgeführt werden können. Dabei handelt es sich um eine Analyseplattform, die auf dem beliebten Open-Source-Produkt Apache Spark aufbaut. Sie haben einen Marktanteil von 10,19 % und sind voraussichtlich der drittgrößte Anbieter auf dem Markt für digitale Analysen.
Databricks – Unternehmenshighlights
Startname | Datenbausteine |
---|---|
Hauptquartier | San Francisco, Kalifornien, Vereinigte Staaten |
Industrie | Computersoftware, Daten, KI |
Gründer | Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia und Arsalan Tavakoli |
Gegründet | 2013 |
Webseite | databricks.com |
Databricks – Über
Databricks – Industrie
Databricks – Gründer
Databricks – Startup-Story
Databricks – Mission
Databricks – Logo
Databricks – Geschäfts- und Umsatzmodell
Databricks – Mitarbeiter
Databricks – Finanzierung und Investoren
Databricks – Akquisitionen
Databricks – Präsenz in sozialen Medien
Databricks – Wachstum und Umsatz
Databricks – Produkte und Funktionen
Databricks – Investition
Databricks – Partnerschaften
Databricks – Konkurrenten
Databricks – Zukunftspläne
Databricks – Über
Databricks wurde von den Entwicklern von Apache Spark als Unternehmen für Daten und künstliche Intelligenz (KI) gegründet. Es fungiert als Lager für alle strukturierten und unstrukturierten Daten in der Cloud. Databricks dient auch als kombinierte Plattform für alle Ihre Daten-, KI- und Analysefunktionen, die Dateningenieuren, Analysten und Datenwissenschaftlern hilft, große Arbeitslasten nahtlos auszuführen. Dies geschieht durch die Lakehouse-Plattform mit Apache Spark, die die beste Kombination aus Funktionen von Data Lakes (günstige Kosten und Flexibilität) und Data Warehouses (Leistungseffizienz) darstellt.
Neben Apache Spark sind Delta Lake und MLflow die beiden anderen Open-Source-Projekte, die hinter den effektiven Funktionen der Lakehouse-Plattform stehen. Databricks stellt seine Unified Data-Dienste über mehrere Clouds bereit, nämlich Google Cloud, AWS, Microsoft Azure und Alibaba Cloud.
Databricks – Industrie
Die Datenindustrie hat sich zu einer großen und bedeutenden Branche in allen Lebens- und Geschäftsbereichen entwickelt. Laut Statista wird erwartet, dass der Datenmarkt bis 2027 auf satte 103 Milliarden US-Dollar anwächst. Das ist doppelt so groß wie im Jahr 2018. Künstliche Intelligenz ist ein weiterer schnell wachsender Markt, der zu einem wesentlichen Element moderner Industrien geworden ist.
Databricks – Gründer
Databricks wurde von einigen Professoren der University of California und fünf ehemaligen Berkeley-Doktoranden mitbegründet. Studenten.
- Ali Ghodsi , Mitbegründer und CEO von Databricks, war einer der Schöpfer von Apache Spark. Er war Professor an der University of California (UC) sowie Vorstandsmitglied im Rising Lab der UC. Er trug die Hauptverantwortung für das Wachstum und die Expansion von Databricks weltweit.
- Ion Stoica , Mitbegründer und Vorsitzender von Databricks, ist außerdem Professor an der UC Berkeley. Er ist außerdem Co-Direktor bei AMPLab. Darüber hinaus war er Mitbegründer eines Start-ups namens Conviva für die Videoverbreitung im großen Stil.
- Matei Zaharia , Mitbegründer und Cheftechnologe bei Databricks, war früher Teil des Spark-Projekts und ist jetzt Vizepräsident der Apache Foundation. Für seine Forschungen zu großen Computersystemen wurde ihm 2014 der ACM Doctoral Dissertation Award verliehen.
- Patrick Wendell , Mitbegründer und Vice President of Engineering bei Databricks, hatte eine wichtige Rolle im Betrieb von Spark gespielt.
- Reynold Xin , Mitbegründer und Chefarchitekt, kümmert sich um den technischen Betrieb in Apache Spark. Er gewann 2011 den Best Demo Award bei VLDB.
- Andy Konwinski , Mitbegründer und Vizepräsident des Managements, kümmert sich um die KI-Operationen in Databricks. Zuvor kümmerte er sich um die Marktbemühungen des Unternehmens bei der Gründung des Spark Summit.
- Arsalan Tavakoli-Shiraji , Mitbegründer und Senior Vice President of Field Engineering bei Databricks, arbeitete zuvor als Associate Principal bei McKinsey. Er war ein ehemaliger Ph.D. Student an der UC Berkeley.
Databricks – Startup-Story
Ali Ghodsi, der CEO von Databricks, war seit seinem achten Lebensjahr begeistert vom Programmieren, als seine Eltern ihm einen gebrauchten Commodore 64 kauften. Er absolvierte eine höhere Ausbildung in Computertechnik und promovierte zum Dr. im verteilten Rechnen. Später, im Jahr 2009, tat er sich mit Ion Stoica zusammen und sie schufen gemeinsam „Spark“, das bereits von Matei Zaharia initiiert wurde.
Sie stimmten sich außerdem mit einem anderen Team ab, das an maschinellem Lernen arbeitete, und führten gemeinsam „Apache Spark“ auf dem Markt ein. Zunächst achtete kein Unternehmen darauf, da die Technologie fremdartig schien. Im Jahr 2013 weckte Ben Horowitz (Mitbegründer von Andreessen Horowitz VC) mit einer Investition von 14 Millionen US-Dollar Hoffnung in ihnen und ermutigte sie, ein Unternehmen zu gründen, das als Plattform für den Betrieb von Apache Spark dient. So wurde Databricks im Jahr 2013 gegründet.
Databricks – Mission
Databricks hat sich zum Ziel gesetzt, die Datenvereinheitlichung effizienter zu gestalten, indem es neue Techniken zur Vereinheitlichung von Daten, KI und Analysen entwickelt. Sie streben danach, das Kundenerlebnis ansprechender zu gestalten.
Databricks – Logo
Das Databricks-Logo ähnelt zwei Steinen, die perfekt ausgerichtet sind, wie Datenordner, die in einem Regal angeordnet sind. Es scheint, dass Databricks beabsichtigte, das Logo mit einem Start- und Endpunkt ohne Pausen dazwischen beizubehalten. Dies kann so erfolgen, dass sie Datenerfassungs-, Speicher- und Analysefunktionen auf einer gemeinsamen Plattform vereinen, ohne dass ein Exit erforderlich ist, da hier alles abgedeckt wird.
Databricks – Geschäfts- und Umsatzmodell
Ihr Geschäftsmodell basiert auf der webbasierten Software, die eine Plattform für die Arbeit mit Apache Spark bietet. Es erleichtert Dateningenieuren und Wissenschaftlern die automatische Gruppenverwaltung und Notizbücher im Python-Stil.
Databricks stellt seine Ressourcen in Form von Software as a Service (SaaS) zur Verfügung und generiert Einnahmen durch seine Abonnements. Ihre Hauptdienste erfolgen über drei Cloud-Plattformen, nämlich:
- Microsoft Azure
- Google Cloud
- Amazon Web Services
Obwohl die Preise für jede Cloud unterschiedlich sind, gibt es einen gemeinsamen Faktor: „Zahlen Sie nur für das, was Sie nutzen.“ Die Kosten werden unabhängig von den gewählten Leistungen berechnet und erfordern keine Vorauszahlung. Die Kunden müssen nur für die Anzahl der verbrauchten Ressourcen bezahlen.
Databricks – Mitarbeiter
Databricks beschäftigt im Jahr 2023 weltweit über 5.001 bis 10.000 Mitarbeiter . Im November 2019 feierte Databricks den Meilenstein, den 1000. Vollzeitmitarbeiter eingestellt zu haben. Es dauerte 6 Jahre, bis die ersten 1000 Mitarbeiter eingestellt waren, und weniger als 2 Jahre, um den Rest einzustellen.
Databricks – Finanzierung und Investoren
Mit seiner jüngsten Finanzierung in Höhe von 503,7 Millionen US-Dollar hat Databricks seit seiner Gründung in 12 Finanzierungsrunden 4 Milliarden US-Dollar eingesammelt. Insgesamt haben bisher 49 Investoren in Databricks investiert.
Datum | Bühne | Menge | Investoren |
---|---|---|---|
14. September 2023 | Serie I | 503,7 Millionen US-Dollar | T. Rowe Price |
31. Juli 2023 | Zweiter Markt | - | - |
3. März 2023 | Serie H | - | - |
4. September 2021 | Engel rund | 200.000 $ | - |
31. August 2021 | Serie H | 1,6 Milliarden US-Dollar | Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, eine Reihe von BNY Mellon-Fonds, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, The House Fund Geodesic und Green Bay Ventures. |
1. Februar 2021 | Serie G | 1 Milliarde Dollar | Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital und Octahedron Capital. |
22. Oktober 2019 | Serie F | 400 Millionen Dollar | Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic und Green Bay Ventures. |
5. Februar 2019 | Serie E | 250 Millionen Dollar | Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures und Geodesic Capital. |
22. August 2017 | Serie D | 140 Millionen Dollar | New Enterprise Association, Andreessen Horowitz, Battery Ventures, Geodesic Capital und Green Bay Ventures. |
15. Dezember 2016 | Serie C | 60 Millionen Dollar | New Enterprise Association, Andreessen Horowitz und SineWave Ventures. |
30. Juni 2014 | Serie B | 33 Millionen Dollar | New Enterprise Association, Andreessen Horowitz und DCVC. |
25. September 2013 | Serie A | 14 Millionen Dollar | Andreessen Horowitz, SV Angel und Alfred Chuang. |
Databricks – Akquisitionen
Databricks hat bisher sieben Unternehmen übernommen. Nachfolgend finden Sie die Details:
Kontoname | Datum | Menge |
---|---|---|
Arcion | 23. Okt. 2023 | 100 Mio. $ |
MosaikML | 26. Juni 2023 | 1,3 Milliarden US-Dollar |
Okera | 3. Mai 2023 | - |
DataJoy Inc. | 13. Okt. 2022 | - |
Cortex Labs | 15. April 2022 | - |
8080 Labore | 6. Oktober 2021 | - |
Redash | 24. Juni 2020 | - |
Databricks – Präsenz in sozialen Medien
Databricks verfügt über eine gute Präsenz auf Twitter und LinkedIn und nutzt diese Plattformen, um seine Produkte und Dienstleistungen zu bewerben und sich so einen Marktvorteil zu verschaffen. Sie posten auch über ihre Welttourneen und Launch-Events mit ihren neuesten Erfindungen. Links zu Blogs und Artikeln über Databricks oder ihre Produkte sowie Informationen zu Stellenangeboten finden Sie auch auf ihren sozialen Plattformen.
Databricks – Wachstum und Umsatz
Databricks wurde 2013 gegründet und behält die Spark-Technologie als Kernstück bei. Seiner Gründung folgte sofort das Gerücht, dass „Spark Technology nicht funktioniert, wenn Ihre Daten nicht in ihren Speicher passen“. Dies hielt Unternehmen davon ab, Spark zu nutzen.
Im Jahr 2015 beschlossen die Gründer schließlich, diesen Gerüchten ein Ende zu setzen, indem sie an einem Wettbewerb teilnahmen, bei dem sie den Weltrekord für die Verarbeitung eines Petabytes an Daten in kürzester Zeit brachen und dadurch mediale Aufmerksamkeit und Popularität erlangten.
Im Jahr 2017 wurde ihr Wert auf 500 Millionen US-Dollar geschätzt, ihr Jahresumsatz lag jedoch mit 1 Million US-Dollar deutlich niedriger. Später erwies sich die Teilnahme am „Sortierwettbewerb“, einige Änderungen bei der Einstellung von Mitarbeitern und die Entscheidung, Software mit Funktionen zu entwickeln, die von großen Unternehmen gefordert werden, als fruchtbar.
Seitdem geht das Wachstum von Databricks nur noch bergauf. Ihr Umsatz erreichte 2018 erstmals die 100-Millionen-Dollar-Marke und es dauerte nur ein weiteres Jahr, bis er 2019 die 200-Millionen-Dollar-Marke erreichte. Die Einführung der Lakehouse-Funktion war ein Hauptfaktor für den Erfolg. Die Bewertung des Unternehmens stieg von 6,2 Milliarden US-Dollar im dritten Quartal 2019 auf rund 38 Milliarden US-Dollar im dritten Quartal 2021.
Databricks meldete im Jahr 2020 einen wiederkehrenden Jahresumsatz von 425 Millionen US-Dollar.
Databricks gab bekannt, dass das Unternehmen im Geschäftsjahr, das am 31. Januar 2023 endete, einen Umsatz von über 1 Milliarde US-Dollar erwirtschaftete. Das Unternehmen berichtete, dass es im Vorjahr 2022 um mehr als 60 % gewachsen sei.
Databricks – Produkte und Funktionen
Einige der jüngsten prominenten Markteinführungen sind:
Data Unity mit der neuen Delta Lake-Version
Databricks hat am 28. Juni 2023 eine neue Version seines Datenspeicherformats Delta Lake angekündigt. Nach Angaben des Unternehmens beseitigt diese Version Datensilos. Die neueste Ergänzung zu den konkurrierenden Open-Source-Standards für die analytischen Datentabellen in Data-Lake-Systemen ist Delta Lake 3.0, zu dem Iceberg und Hudi von der Apache Foundation gehören.
Dolly
Databricks stellte am 24. März 2023 ein Open-Source-Sprachmodell vor, das es Programmierern ermöglicht, ihre eigenen, KI-gesteuerten Chatbot-Anwendungen zu erstellen.
Lakehouse Federation
Auf seinem Data + AI Summit stellte Databricks am 28. Juni 2023 seine sogenannte Lakehouse Federation-Funktion vor. Mit dieser neuen Funktion können Unternehmen ihre Daten auf einer Vielzahl von Plattformen entdecken, abfragen und verwalten, indem sie ihre unterschiedlichen Daten kombinieren ummauerte Datensysteme.
Databricks – Partnerschaften
Databricks hat mit vielen Unternehmen zusammengearbeitet. Einige der jüngsten prominenten Partnerschaften sind:
Microsoft
Mit einer neuen Partnerschaft mit Databricks im August 2023 zur Vermarktung von KI-App-Entwicklungstools hat Microsoft den Umfang seiner KI-Ziele erweitert. Mit der Databricks-Software können Unternehmen ihre eigenen KI-Modelle von Grund auf erstellen.
Kobai
Am 11. September 2023 gingen Databricks und Kobai eine Partnerschaft ein. Kunden können die Leistungsfähigkeit und Skalierbarkeit der Databricks Lakehouse-Plattform sowie die Einfachheit und Erkenntnisse von Wissensgraphen nutzen.
3i Infotech
Um durch die Kombination von Daten und KI auf einer einzigen Plattform Geschäftswert zu generieren, haben 3i Infotech Ltd und Databricks am 18. Oktober 2023 eine Partnerschaft geschlossen.
Databricks – Investition
Databricks hat in 24 Unternehmen investiert. Nachfolgend sind einige der Investitionen aufgeführt:
Kontoname | Datum | Menge |
---|---|---|
Ratlosigkeit KI | 2022 | - |
Arcion | 2018 | - |
Prophezeiung.io | Januar 2017 | - |
Katalysator | September 2017 | - |
Cleanlab | - | - |
Databricks – Konkurrenten
Einige der Top-Konkurrenten von Databricks sind:
- Schneeflocke
- Cloudera
- Datentax
- Qubole
- MATLAB
- Alteryx
- Dremio
- Intellicus
Hier ein paar Vergleiche mit einigen Mitbewerbern:
Schneeflocke – Schneeflocke ist viel größer als Databricks. Beide bieten ähnliche Dienste mit wenigen Unterschieden (Databricks verarbeitet große Datenmengen, während Snowflake die Elastizität von Cloud-Daten für den zentralen Zugriff bietet) zu einem flexiblen Preis. Databricks führt einen langen Kampf, um seinen Konkurrenten zu besiegen.
Cloudera – Cloudera bietet eine gemeinsame Cloud-Speicher- und Verwaltungsplattform, die Daten für ein Unternehmen speichert, verarbeitet und analysiert. Es ähnelt dem von Databricks in Form von Data Warehouse, Processing und Distribution.
Databricks – Zukunftspläne
Es ist offensichtlich, dass Databricks im Jahr 2021 an zwei der am schnellsten wachsenden Big-Data-Domänen arbeitete, Streaming und Deep-Learning. Sie bauten eine vielschichtige Anwendungsprogrammierschnittstelle (API) auf, um diese beiden Domänen zu verarbeiten. Databricks ist außerdem daran interessiert, die Innovation von Data Lakehouse zu beschleunigen, um durch die Eroberung datengesteuerter Organisationen einen größeren Vorteil zu erzielen.
Laut ihrer Website plant Databricks, die Favoritenfunktion des Arbeitsbereichs zu aktivieren. Notizen, Dashboards, Experimente und Suchen können alle in einer Favoritenliste gespeichert werden, auf die Sie dann über die Startseite zugreifen können.
Databricks – FAQs
Was sind Databricks?
Databricks ist ein cloudbasiertes Tool zum Speichern und Verarbeiten großer Datenmengen mithilfe von Modellen des maschinellen Lernens. Dies geschieht über ihr Apache Spark-Tool.
Wer hat Databricks gegründet?
Databricks wurde von sieben Personen mitbegründet, nämlich Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski und Arsalan Tavakoli-Shiraji.
Wie viel hat sich Databricks durch die Finanzierung gesichert?
Databricks sicherte sich in 12 Finanzierungsrunden rund 4 Milliarden US-Dollar.
Wie hoch ist der Jahresumsatz von Databricks?
Databricks hat für das Jahr bis 2022 einen jährlichen wiederkehrenden Umsatz (ARR) von 1,275 Milliarden US-Dollar gemeldet.
Wer sind die Kunden von Databricks?
Databricks hat weltweit über 6000 Kunden. Einige ihrer beliebtesten Kunden sind:
- Hülse
- CVS Gesundheit
- Regeneron
- T-Mobile
- HSBC
- Comcast