Databricks: una plataforma unificada para colaborar con datos, análisis e inteligencia artificial
Publicado: 2023-10-26Company Profile es una iniciativa de StartupTalky para publicar información verificada sobre diferentes startups y organizaciones.
El mundo moderno en el que vivimos hoy depende enormemente de los datos y la información. Todo lo que nos gusta a nuestro alrededor, las cosas que usamos, vemos y nos rodean, están influenciados de una u otra manera por la tecnología.
A medida que crece la necesidad de tecnología, la importancia de los datos comenzó a florecer. Con la acumulación de datos, surgió la necesidad de un almacén para almacenar, analizar y procesar estos datos para múltiples propósitos.
Aquí es donde Databricks presentó su plataforma. Databricks sirve como una plataforma en la nube para almacenar enormes datos que pueden procesarse y ejecutarse sin problemas. Esta es una plataforma analítica basada en su popular producto de código abierto llamado Apache Spark . Han ocupado una cuota de mercado del 10,19% y se posicionan como el tercer ocupante más grande en el mercado de análisis digital.
Databricks: aspectos destacados de la empresa
Nombre de inicio | Ladrillos de datos |
---|---|
Sede | San Francisco, California, Estados Unidos |
Industria | Software informático, datos, IA |
Fundadores | Ali Ghodsi, Andy Konwinski, lon Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia y Arsalan Tavakoli |
Fundado | 2013 |
Sitio web | databricks.com |
Ladrillos de datos: Acerca de
Ladrillos de datos - Industria
Ladrillos de datos: fundadores
Databricks: historia de inicio
Ladrillos de datos: misión
Ladrillos de datos - Logotipo
Databricks: modelo de negocio e ingresos
Ladrillos de datos: empleados
Databricks: financiación e inversores
Databricks - Adquisiciones
Databricks: presencia en redes sociales
Databricks: crecimiento e ingresos
Ladrillos de datos: productos y características
Ladrillos de datos - Inversión
Ladrillos de datos: asociaciones
Ladrillos de datos: competidores
Ladrillos de datos: planes futuros
Ladrillos de datos: Acerca de
Databricks fue fundada por los creadores de Apache Spark , como una empresa de Datos e Inteligencia Artificial (IA). Actúa como almacén de datos estructurados o no estructurados, en la nube. Databricks también sirve como una plataforma combinada para todas sus funciones de datos, inteligencia artificial y análisis que ayuda a los ingenieros, analistas y científicos de datos a realizar enormes cargas de trabajo sin problemas. Esto lo hace su plataforma Lakehouse impulsada por Apache Spark, que es la mejor combinación de características de Data Lakes (bajo costo y flexibilidad) y Data Warehouses (eficiencia de rendimiento).
Además de Apache Spark, Delta Lake y MLflow son los otros dos proyectos de código abierto que están detrás de las funciones efectivas de Lakehouse Platform. Databricks proporciona sus servicios de datos unificados a través de múltiples nubes, a saber, Google Cloud, AWS, Microsoft Azure y Alibaba Cloud.
Ladrillos de datos - Industria
La industria de datos se ha convertido en una industria grande e importante en todos los aspectos de la vida y los negocios. Según Statista, se espera que el mercado de datos crezca hasta la friolera de 103 mil millones de dólares para 2027. Es el doble de su presencia en 2018. La inteligencia artificial es otro mercado de rápido crecimiento que se ha convertido en un elemento esencial en las industrias modernas.
Ladrillos de datos: fundadores
Databricks fue cofundada por un par de profesores de la Universidad de California y cinco ex doctores de Berkeley. estudiantes.
- Ali Ghodsi , cofundador y director ejecutivo de Databricks, fue uno de los creadores de Apache Spark. Fue profesor en la Universidad de California (UC) y miembro de la junta directiva del Rising Lab de la UC. Ha tenido la responsabilidad principal del crecimiento y expansión de Databricks en todo el mundo.
- Ion Stoica , cofundador y presidente de Databricks, también es profesor en UC Berkeley. También es codirector de AMPLab. Además de esto, cofundó una start-up llamada Conviva , para la distribución de vídeos a gran escala.
- Matei Zaharia , cofundador y tecnólogo jefe de Databricks, anteriormente formó parte del proyecto Spark y ahora es el vicepresidente de la Fundación Apache. El Premio de Tesis Doctoral ACM le fue otorgado en 2014 por su investigación en sistemas informáticos a gran escala.
- Patrick Wendell , cofundador y vicepresidente de ingeniería de Databricks, desempeñó un papel importante en las operaciones de Spark.
- Reynold Xin , cofundador y arquitecto jefe, se encarga de las operaciones técnicas en Apache Spark. Ganó el premio a la mejor demostración en 2011 en VLDB.
- Andy Konwinski , cofundador y vicepresidente de gestión, se encarga de las operaciones de IA en Databricks. Anteriormente se encargó de los esfuerzos de mercado de la empresa en la creación de Spark Summit.
- Arsalan Tavakoli-Shiraji , cofundador y vicepresidente senior de ingeniería de campo en Databricks, trabajó anteriormente en McKinsey como director asociado. Era un ex doctor. estudiante de la Universidad de Berkeley.
Databricks: historia de inicio
Ali Ghodsi, director ejecutivo de Databricks, estaba interesado en la codificación desde los 8 años, cuando sus padres le compraron un Commodore 64 usado. Continuó sus estudios superiores en ingeniería informática y obtuvo un doctorado. en computación distribuida. Posteriormente, en 2009, se unió a Ion Stoica y juntos crearon 'Spark', que ya fue instigado por Matei Zaharia.
Además, se coordinaron con otro equipo que trabajaba en aprendizaje automático y juntos introdujeron 'Apache Spark' en el mercado. Al principio, ninguna empresa prestó atención porque la tecnología parecía extraña. En 2013, Ben Horowitz (cofundador de Andreessen Horowitz VC), les plantó algo de esperanza al invertir 14 millones de dólares y los animó a crear una empresa que sirviera como plataforma para ejecutar Apache Spark. Así, Databricks se estableció en 2013.
Ladrillos de datos: misión
Databricks funciona con la misión de hacer que la unificación de datos sea más eficiente mediante la innovación de nuevas técnicas para unificar datos, inteligencia artificial y análisis. Se esfuerzan por hacer que la experiencia del cliente sea más atractiva.
Ladrillos de datos - Logotipo
El logotipo de Databricks se asemeja a dos ladrillos perfectamente alineados, como carpetas de datos organizadas en un estante. Parece que Databricks tenía la intención de mantener el logotipo con un punto inicial y final sin interrupciones en el medio. Esto se puede hacer para implicar que unifican las funciones de recopilación, almacenamiento y análisis de datos en una plataforma común sin necesidad de una salida, ya que todo se trata aquí.
Databricks: modelo de negocio e ingresos
Su modelo de negocio se basa en el software basado en web que proporciona una plataforma para trabajar con Apache Spark. Facilita la gestión automática de grupos y cuadernos estilo Python para ingenieros y científicos de datos.
Databricks proporciona sus recursos en forma de software como servicio (SaaS) y genera ingresos a través de sus suscripciones. Sus principales servicios se realizan a través de tres plataformas en la nube, a saber:
- MicrosoftAzure
- Nube de Google
- Servicios web de Amazon
Aunque los precios varían para cada nube, hay un factor común a destacar: “Paga solo por lo que usas” . Los costos se calculan independientemente de los servicios elegidos y no requieren pago por adelantado. Los clientes deben pagar solo por la cantidad de recursos utilizados sobre la marcha.
Ladrillos de datos: empleados
Databricks tiene entre 5001 y 10 000 empleados en todo el mundo en 2023. En noviembre de 2019, Databricks celebró el hito de haber contratado al empleado número 1000 a tiempo completo para ellos. Se necesitaron 6 años para llegar a los primeros 1000 empleados y menos de 2 años para contratar al resto.
Databricks: financiación e inversores
Con su reciente financiación de 503,7 millones de dólares, Databricks ha recaudado 4 mil millones de dólares a través de 12 rondas de financiación desde su formación. Hasta ahora, un total de 49 inversores han invertido en Databricks.
Fecha | Escenario | Cantidad | Inversores |
---|---|---|---|
14 de septiembre de 2023 | Serie I | 503,7 millones de dólares | Precio de T. Rowe |
31 de julio de 2023 | Mercado secundario | - | - |
3 de marzo de 2023 | Serie H | - | - |
4 de septiembre de 2021 | Ángel redondo | $200K | - |
31 de agosto de 2021 | Serie H | $1.6 mil millones | Counterpoint Global (Morgan Stanley), Baillie Gifford, ClearBridge Investments, UC Investments, Andreessen Horowitz, Amazon Web Services (AWS), Microsoft, CapitalG, CPP Investment Board, Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks, Octahedron Capital, T. Rowe Price Associates, Tiger Global Management, Whale Rock Capital Management, Insight Partners, Gaingels, New Enterprise Association, Alta Park Capital, un conjunto de fondos BNY Mellon, Discovery Capital, Dragoneer Investment Group, Flucas Ventures, House Fund Geodésico y Green Bay Ventures. |
1 de febrero de 2021 | Serie G | mil millones de dólares | Franklin Templeton, CPP Investment Board, Fidelity Management & Research LLC, Whale Rock, Amazon Web Services (AWS), CapitalG, Salesforce Ventures, Microsoft, Andreessen Horowitz, Alkeon Capital Management, BlackRock, Inc., Coatue Management, T. Rowe Price Associates , Tiger Global Management, New Enterprise Association, Discovery Capital, Dragoneer Investment Group, Founders Circle Capital, Geodesic, GIC, Green Bay Ventures, Greenoaks Capital y Octahedron Capital. |
22 de octubre de 2019 | Serie F | $400 millones | Andreessen Horowitz, BlackRock, Inc., T. Rowe Price Associates, Tiger Global Management, Coatue, New Enterprise Association, Microsoft, Alkeon Capital Management, Dragoneer Investment Group, Geodesic y Green Bay Ventures. |
5 de febrero de 2019 | Serie E | $250 millones | Andreessen Horowitz, Microsoft, Coatue, Battery Ventures, New Enterprise Association, Green Bay Ventures y Geodesic Capital. |
22 de agosto de 2017 | Serie D | $140 millones | Asociación de Nuevas Empresas, Andreessen Horowitz, Battery Ventures, Geodesic Capital y Green Bay Ventures. |
15 de diciembre de 2016 | Serie C | $60 millones | Asociación de Nuevas Empresas, Andreessen Horowitz y SineWave Ventures. |
30 de junio de 2014 | Serie B | $33 millones | Asociación de Nuevas Empresas, Andreessen Horowitz y DCVC. |
25 de septiembre de 2013 | Serie A | $14 millones | Andreessen Horowitz, SV Angel y Alfred Chuang. |
Databricks - Adquisiciones
Hasta ahora, Databricks ha adquirido siete empresas. A continuación se detallan los detalles:
Nombre de la cuenta | Fecha | Cantidad |
---|---|---|
Arción | 23 de octubre de 2023 | 100 millones de dólares |
mosaicoml | 26 de junio de 2023 | 1.300 millones de dólares |
okera | 3 de mayo de 2023 | - |
DataJoy Inc. | 13 de octubre de 2022 | - |
Laboratorios de corteza | 15 de abril de 2022 | - |
8080 laboratorios | 6 de octubre de 2021 | - |
Redash | 24 de junio de 2020 | - |
Databricks: presencia en redes sociales
Databricks tiene buena presencia en Twitter y LinkedIn y utiliza estas plataformas para promocionar sus productos y servicios y obtener una ventaja en el mercado. También publican sobre sus giras mundiales y eventos de lanzamiento de sus últimos inventos. En sus plataformas sociales también se pueden encontrar enlaces a blogs y artículos sobre Databricks o sus productos e información relacionada con ofertas de trabajo.
Databricks: crecimiento e ingresos
Databricks se estableció en 2013, manteniendo Spark Technology como su núcleo. A su formación le siguió inmediatamente el rumor de que "Spark Technology no funcionará si sus datos no caben en su memoria". Esto disuadió a las empresas de utilizar Spark.
Finalmente, en 2015, los fundadores decidieron acabar con estos rumores participando en un concurso en el que batieron el récord mundial de procesar un petabyte de datos en el menor tiempo y, como resultado, ganaron atención mediática y popularidad.
En 2017, estaban valorados en 500 millones de dólares, pero sus ingresos anuales eran mucho menores: 1 millón de dólares. Más tarde, resultó fructífero participar en el "concurso de clasificación", hacer algunos cambios en la contratación de empleados y decidir crear software con las características demandadas por las grandes empresas.
Desde entonces, el crecimiento de Databricks sólo ha ido cuesta arriba. Sus ingresos alcanzaron la marca de los 100 millones de dólares por primera vez en 2018 y tardó solo un año más en alcanzar los 200 millones de dólares en 2019. La introducción de la función Lakehouse fue un factor principal de su éxito. La valoración de la empresa creció de 6.200 millones de dólares en el tercer trimestre de 2019 a alrededor de 38.000 millones de dólares en el tercer trimestre de 2021.
Databricks reportó ingresos anuales recurrentes de 425 millones de dólares en 2020.
Databricks reveló que durante el año fiscal que concluyó el 31 de enero de 2023, generó más de mil millones de dólares en ingresos. La empresa informó que se expandió más del 60% en el año anterior 2022.
Ladrillos de datos: productos y características
Algunos de los últimos lanzamientos destacados son:
Data Unity con la nueva versión de Delta Lake
Databricks anunció una nueva versión de su formato de almacenamiento de datos Delta Lake el 28 de junio de 2023. Según la empresa, esta versión elimina los silos de datos. La última incorporación a los estándares rivales de código abierto para las tablas de datos analíticos en sistemas de lagos de datos es Delta Lake 3.0, que incluye Iceberg y Hudi de la Fundación Apache.
Muñequita
Databricks presentó un modelo de lenguaje de código abierto que permite a los programadores crear sus propias aplicaciones de chatbot impulsadas por IA el 24 de marzo de 2023.
Federación de la casa del lago
En su Cumbre Data + AI, Databricks lanzó lo que denomina su función Lakehouse Federation el 28 de junio de 2023. Con esta nueva característica, las empresas pueden descubrir, consultar y administrar sus datos en una amplia gama de plataformas combinando sus dispares sistemas de datos amurallados.
Ladrillos de datos: asociaciones
Databricks se ha asociado con muchas empresas. Algunas de las últimas asociaciones destacadas son:
microsoft
Con una nueva asociación con Databricks en agosto de 2023 para comercializar herramientas de desarrollo de aplicaciones de IA, Microsoft ha aumentado el alcance de sus objetivos de IA. Las empresas podrán crear sus propios modelos de IA desde cero utilizando el software Databricks.
kobai
El 11 de septiembre de 2023, Databricks y Kobai se asociaron. Los clientes pueden aprovechar el poder y la escalabilidad de la plataforma Databricks Lakehouse, junto con la simplicidad y la información de los gráficos de conocimiento.
3i Informática
Para generar valor comercial combinando datos e inteligencia artificial en una sola plataforma, 3i Infotech Ltd y Databricks se asociaron el 18 de octubre de 2023.
Ladrillos de datos - Inversión
Databricks ha invertido en 24 empresas. Algunas de las inversiones se enumeran a continuación:
Nombre de la cuenta | Fecha | Cantidad |
---|---|---|
Perplejidad IA | 2022 | - |
Arción | 2018 | - |
Profecía.io | enero de 2017 | - |
Catalizador | septiembre de 2017 | - |
laboratorio limpio | - | - |
Ladrillos de datos: competidores
Algunos de los principales competidores de Databricks son:
- Copo de nieve
- nubeera
- Registro de datos
- Qubolé
- MATLAB
- Altérix
- Dremio
- Intellicus
Aquí hay algunas comparaciones con algunos competidores:
Copo de nieve: Snowflake es mucho más grande que Databricks. Ambos ofrecen servicios similares con pocas diferencias (Databricks procesa grandes cantidades de datos mientras que Snowflake ofrece elasticidad de datos en la nube para acceso centralizado) a un precio flexible. Databricks está librando una larga batalla para superar a su competidor.
Cloudera: Cloudera proporciona una plataforma común de gestión y almacenamiento en la nube que almacena, procesa y analiza datos para una organización. Es similar al de Databricks en forma de almacén, procesamiento y distribución de datos.
Ladrillos de datos: planes futuros
Es evidente que Databricks estaba trabajando en dos de los dominios de big data de más rápido crecimiento, Streaming y Deep-Learning en 2021. Estaban construyendo una interfaz de programación de aplicaciones (API) multifacética para procesar estos dos dominios. Databricks también está interesado en acelerar la innovación de Data Lakehouse para obtener una mayor ventaja al conquistar organizaciones basadas en datos.
Según su sitio web, Databricks planea habilitar la función de favoritos del espacio de trabajo. Las notas, los paneles, los experimentos y las búsquedas se pueden guardar en una lista de favoritos, a la que luego podrá acceder desde la página de inicio.
Ladrillos de datos: preguntas frecuentes
¿Qué son los ladrillos de datos?
Databricks es una herramienta basada en la nube para almacenar y procesar grandes cantidades de datos utilizando modelos de aprendizaje automático. Esto se hace a través de su herramienta Apache Spark.
¿Quién fundó Databricks?
Databricks fue cofundado por siete personas, a saber, Ali Ghodsi, Ion Stoica, Matei Zaharia, Patrick Wendell, Reynold Xin, Andy Konwinski y Arsalan Tavakoli-Shiraji.
¿Cuánto ha obtenido Databricks mediante financiación?
Databricks obtuvo alrededor de 4 mil millones de dólares a través de 12 rondas de financiación.
¿Cuáles son los ingresos anuales de Databricks?
Databricks ha informado unos ingresos recurrentes anuales (ARR) de 1275 millones de dólares para el año que finaliza en 2022.
¿Quiénes son los clientes de Databricks?
Databricks tiene alrededor de 6000+ clientes en todo el mundo. Algunos de sus clientes populares son:
- Caparazón
- Salud CVS
- Regenerón
- T-Mobile
- HSBC
- Comcast