Databricks. Siedmiu informatyków połączyło coś, co nazywają jeziorem i hurtownią danych. Teraz zgarniają miliardy

W Polsce nazwa Databricks raczej niewiele mówi, ale amerykański jednorożec (tym mianem określa się start-upy, których wycena przebija 1 mld dol.), wyceniany już na ponad 40 mld dol., konsekwentnie rośnie w siłę i należy do tych firm, które wykorzystują w zasadzie wszystkie trendy technologiczne — najpierw chmurę, a teraz sztuczną inteligencję. Kto stoi za sukcesem spółki z San Francisco i co kryje się za pojęciem „data lakehouse”, z jakim jest kojarzona? Wyjaśniamy.

2894b4447f220f49a40d2cbb24688794, Biznes Fakty
Rok temu Databricks była uznana za jednego z najlepszych pracodawców w sektorze chmurowym | Foto: Facebook.com/databricksinc
  • Databricks stała się liderem w dziedzinie zarządzania danymi dzięki koncepcji data lakehouse
  • Firma obsługuje klientów z różnych sektorów, w tym opieki zdrowotnej, handlu, sportu, oraz 60 proc. biznesów z listy Fortune 500
  • Pozyskała 500 mln dol. w ostatniej rundzie finansowej, a jej wycena osiągnęła już 43 mld dol.
  • Obecnie Databricks dynamicznie rozwija obszar AI, m.in. poprzez przejęcie MosaicML, i powoli planuje debiut giełdowy
  • Więcej informacji o biznesie znajdziesz na stronie Businessinsider.com.pl

Databricks istnieje na rynku od 2013 r. i została założona przez grupę badaczy z Uniwersytetu Kalifornijskiego w Berkeley. Firma powstała, bo jej założyciele byli przekonani, że można inaczej przetwarzać duże zbiory danych, by kolejno je analizować i wyciągać wartościowe wnioski. Grupa założycieli składała się z — uwaga — aż siedmiu informatyków. To konkretnie: Ali Ghodsi (obecny dyrektor generalny), Matei Zaharia, Reynold Xin, Ion Stoica, Patrick Wendell, Andy Konwinski, Arsalan Tavakoli-Shiraji.

Informatycy stojący za Databricks wiedzieli, że tworzą coś użytecznego. Sam produkt był i nadal jest świetną platformą do zarządzania danymi, która już od lat wykorzystuje sztuczną inteligencję, ale przede wszystkim opiera się na koncepcji data lakehouse — połączeniu jeziora danych (data lake) z hurtownią danych (data warehouse).

Dla wyjaśnienia hurtownia danych to system, który gromadzi dane z różnych źródeł i przechowuje je w uporządkowanej formie. Hurtownie danych są używane głównie do analizy i raportowania — pozwalają na podejmowanie strategicznych decyzji na podstawie zebranych informacji. Zwykle przechowują też dane ustrukturyzowane, czyli np. dane z baz danych lub arkuszy kalkulacyjnych, które są łatwe do analizy. Z kolei jezioro danych to repozytorium, które przechowuje duże ilości danych w ich oryginalnej formie. Są to zarówno dane ustrukturyzowane (np. tabele), jak i nieustrukturyzowane (np. pliki tekstowe, obrazy). Zastosowanie jest takie, że „jeziora” świetnie nadają się do analizowania w różnych kontekstach, co sprzyja eksploracji i odkrywaniu nowych informacji.

582b5029b5d38c0048af4ff6a0ff8316, Biznes Fakty
Założyciele Databricks | Databricks.com

Arsalan Tavakoli-Shiraji, jeden ze współzałożycieli i starszy wiceprezes ds. inżynierii w Databricks, tłumaczy to w obrazowy sposób: — Weźmy za przykład firmę Adobe. Większość osób ciągle kojarzy tę firmę z programem Photoshop, ale w praktyce ma ona wielu klientów korzystających z przeróżnych aplikacji i wykorzystujących je do różnych celów. Adobe jako firma chce wiedzieć, co robią jej klienci, jakie funkcje mogą im się przydać, jak można ułatwić im realizowanie projektów. Wszystko to ukryte jest w ogromnych ilościach danych. Databricks pozwala analizować te dane, od tradycyjnej analityki po najnowsze rozwiązania oparte na machine learningu. Dzięki temu Adobe może poznać cenne informacje, dzięki którym może lepiej rozwijać swoje produkty i spełniać potrzeby klientów. Podobną pracę wykonujemy dla ponad 10 tys. klientów — wyjaśnił w wywiadzie dla Bloomberga.

Sprawdź też: Neuralink Elona Muska nie jest jedyny. Bill Gates, Jeff Bezos i inni miliarderzy też inwestują w interfejsy mózg-komputer

Jezioro danych zmienili w jezioro pieniędzy

Databricks skutecznie zakłócił tradycyjne segmenty hurtowni danych i gigantów oprogramowania takich jak Oracle czy Teradata. Obecnie rywalizuje już nie tylko z chmurowymi gigantami, takimi jak Amazon i Microsoft, ale też z firmami rozwijającymi sztuczną inteligencję, na czele z OpenAI.

Spółka ma dziś klientów we wszystkich branżach. Z jej usług korzystają organizacje z opieki zdrowotnej, handlu detalicznego, łańcucha dostaw i transportu, a nawet NBA czy drużyna baseballowa Texas Rangers. Jeśli gdzieś można zrobić użytek z danych, Databricks ma często argumenty na to, by choć przetestować ich platformę. Jak podkreśla, z jej usług korzysta już ok. 60 proc. firm z listy Fortune 500.

W ostatniej rundzie finansowej w ramach Serii I firma pozyskała kolejne 500 mln dol. inwestycji we wrześniu. W gronie inwestorów pojawił się nowy gracz — Nvidia. Gigant, który w ostatnich latach niesamowicie zwiększył kapitalizację i do maksimum wykorzystał boom na rozwój AI, zapewni Databricks dostęp do kolejnych chipów AI, ale też know-how w zakresie trenowania AI. Co ciekawe, łącznie firma zebrała już ponad 4 mld dol. w ramach aż 16 rund finansowania.

Obecnie Databricks wyceniana jest na 43 mld dol. Jej przychody przekroczyły 1 mld dol. w ubiegłym roku, a ostatnio osiągnęły 1,6 mld dol. (dane za rok fiskalny zakończony 31 stycznia 2024 r.).

Czytaj też: Kiedy inni inwestowali w AI, Oracle postawiło na stabilność i… wygrało! Larry Ellison zarabia miliardy

Wartość danych nie traci na znaczeniu

Mówi się, że w erze cyfrowej dane są niezwykle cenne i są jak paliwo do napędzania tego filaru gospodarki. To oczywiście prawda, natomiast warto podkreślić, że w ostatnich latach dane zdecydowanie nie tracą na wartości i znaczeniu — wręcz przeciwnie, dla firm lepsze zrozumienie i wyciąganie wniosków z danych ma bardzo wysoki priorytet.

Po rozwinięciu się jako jeden z liderów ruchu data lakehouse Databricks ewoluuje w kierunku AI. Chce pomagać firmom nie tylko lepiej rozumieć swoje dane, ale też wykorzystywać pozyskiwane informacje do budowania aplikacji AI do wewnętrznych potrzeb.

Założona przez informatyków-entuzjastów spółka ma także za sobą kilka przejęć. Jednym z największych jest pozyskanie MosaicML, firmy dostarczającej narzędzia do budowy modeli AI. Databricks przejęła ten biznes za 1,3 mld dol., wychodząc z założenia, że technologia tego rodzaju doskonale uzupełni dotychczasową ofertę.

W planach debiut na giełdzie

Ali Ghodsi był już kilka razy pytany o to, czy Databricks wejdzie na amerykańską giełdę. Przyznał, że na razie stale koncentruje się na zaspokajaniu „intensywnego popytu” ze strony klientów oraz pracy nad długoterminowym sukcesem, by firma była w pełni stabilna i mogła rozwijać biznes na długą metę.

Czy zatem IPO jest możliwe? Tak, i niewykluczone, że już w 2025 r. „Będzie to kamień milowy dla Databricks” — przyznał szef firmy w wywiadzie dla CNBC, i dodał: „ale trzeba jeszcze zaczekać”.

Autor: Grzegorz Kubera, dziennikarz Business Insider Polska

Dziękujemy, że przeczytałaś/eś nasz artykuł do końca. Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *