Google rzuca wyzwanie DeepSeek dzięki modelowi Gemma 3, który ma zmienić zasady gry w AI

Gemma 3 to najnowsza wersja otwartego modelu AI firmy Google, zaprojektowana specjalnie dla twórców aplikacji, którzy potrzebują rozwiązań działających nie tylko w chmurze, ale także w systemach lokalnych. Model ten opiera się na technologiach wykorzystywanych w zastrzeżonym Gemini 2.0, ale został zmodyfikowany tak, aby działał w środowiskach o ograniczonych zasobach, takich jak wydajny laptop. Ponadto ma być przeciwieństwem chińskiego DeepSeek.

Gemma 3 to najnowszy otwarty model sztucznej inteligencji firmy Google, stworzony do działania zarówno w chmurze, jak i w systemach lokalnych
Model obsługuje kontekst do 128 tys. tokenów, umożliwiając analizę długich dokumentów, dialogów, materiałów wideo i obrazów
Dzięki optymalizacji Gemma 3 może działać na pojedynczym procesorze graficznym, natomiast mniejsze wersje są odpowiednie dla rozwiązań mobilnych i budżetowych
Google również angażuje się w odpowiedzialny rozwój AI. Wprowadza moduł bezpieczeństwa ShieldGemma 2, aby oceniać i filtrować nieodpowiednie treści
Więcej informacji o biznesie znajdziesz na Businessinsider.com.pl

Dzięki swojej architekturze Gemma 3 może efektywnie działać na pojedynczym procesorze graficznym (GPU) lub TPU, co – co warto zauważyć – było zazwyczaj zarezerwowane dla bardziej kompaktowych i mniej zaawansowanych modeli.

Kluczową cechą Gemma 3 jest możliwość obsługi kontekstu do 128 tysięcy tokenów. To znacznie zwiększa ilość danych, które można przetworzyć w jednym zapytaniu AI. W rezultacie umożliwia obsługę obszernych dokumentów, długich konwersacji lub materiałów wideo i graficznych bez konieczności dzielenia zadania na mniejsze części. Ta pojemność kontekstowa pozycjonuje Gemma 3 wśród najlepszych kandydatów pod względem zatrzymywania i rozumienia długich sekwencji informacji.

Inną znaczącą zaletą jest moduł do przetwarzania obrazu i krótkich treści wideo. Upraszcza tworzenie aplikacji integrujących analizę tekstu z multimediami.

Gemma 3 działa nawet na laptopie

Możliwość uruchomienia Gemma 3 na jednym GPU lub TPU jest możliwa dzięki odpowiedniej optymalizacji. Google opracowało wersje tego modelu w czterech rozmiarach: zaczynając od najmniejszego, z 1 miliardem parametrów, do wariantu 27-miliardowego , który wymaga odpowiednio większej pojemności pamięci.

Mniejsze konfiguracje są dobrze dostosowane do urządzeń mobilnych, laptopów i stacji roboczych. Zapewnią zadowalające wyniki przy zaskakująco niskich kosztach obliczeniowych. Z kolei większe wersje, choć bardziej wymagające pod względem pamięci, nadal „mieszczą się” w możliwościach pojedynczych procesorów graficznych , takich jak high-endowy Nvidia H100 lub zaawansowany TPU.

Dalsza część pod filmem:

Dla osób zainteresowanych uruchomieniem Gemma 3 lokalnie, Google udostępnia kod i modele w powszechnie używanych repozytoriach i integruje je z narzędziami takimi jak Hugging Face, PyTorch lub Gemma.cpp. Umożliwia to szybkie eksperymentowanie na osobistym sprzęcie. Programiści mogą łatwo dostosować model i dalej go trenować, korzystając ze środowisk takich jak Google Colab, Vertex AI lub lokalnej maszyny wyposażonej w kartę graficzną obsługującą biblioteki CUDA lub ROCm. Ten tryb działania zapewnia firmom i indywidualnym programistom większą kontrolę nad ich danymi, a także nad funkcjonalnością samego modelu . Jest to znacząca zaleta.

Przeczytaj także: Wyszukiwarki AI często wprowadzają w błąd. Grok Elona Muska jest najgorszy

DeepSeek ma konkurenta

Pod względem wydajności Gemma 3 przewyższa wiele znanych modeli tej wielkości — Google porównuje ją do Llama-405B, DeepSeek-V3 i OpenAI o3-mini, powołując się na lepsze wyniki w ocenach „preferencji użytkownika” i zadań „rozumienia języka”. Firma podkreśla również jej wysoką wydajność w zadaniach matematycznych i kodowania, choć nie ujawnia pełnych szczegółów numerycznych . Innym znaczącym udogodnieniem jest dostępność wersji „skwantowanych”, które mogą znacznie zminimalizować rozmiar i koszty obliczeniowe przy zachowaniu odpowiedniej dokładności.

Należy jednak zauważyć, że DeepSeek R1 nadal osiąga lepsze wyniki w testach niż najnowszy model Google.

Innym nowym aspektem Gemma jest ShieldGemma 2. Jest to moduł bezpieczeństwa do analizy obrazu, który umożliwia automatyczną identyfikację szkodliwych, erotycznych lub brutalnych treści. Jego implementacja w Gemma 3 ułatwia tworzenie systemów, które nie tylko generują lub oceniają treści, ale mogą również cenzurować materiały uznane za nieodpowiednie dla określonych grup użytkowników lub kontekstów biznesowych.

Google kładzie duży nacisk na odpowiedzialny rozwój – Gemma 3 zawiera kompleksowe zabezpieczenia przed niewłaściwym wykorzystaniem w szkodliwych celach, szczególnie w produkcji niebezpiecznych substancji (na przykład, gdy zadawane są pytania dotyczące przepisów na produkcję bomb). Niemniej jednak, jak w przypadku każdej otwartej technologii, ryzyko niewłaściwego wykorzystania utrzymuje się i wymaga czujności ze strony społeczności i deweloperów.

Sprawdź także: Czy bańka AI pęknie mocniej niż dot-com? To może być brutalny krach technologiczny

Gemma 3 czeka na „pakowanie”

Wprowadzenie Gemma 3 może znacząco wpłynąć na krajobraz AI, zwłaszcza w obszarze lekkich i wydajnych modeli. Wcześniej chiński DeepSeek przewodził tej kategorii, co wzbudziło zainteresowanie modelami działającymi na niedrogim i dostępnym sprzęcie dla większości . Gemma 3 to najnowszy wysiłek Google w tym konkursie i – na podstawie wstępnych ocen – ma być groźnym rywalem dla chińskiej technologii.

Czy naprawdę będzie stanowić realną alternatywę dla DeepSeek i zdominować rynek? Wiele zależy od społeczności i tego, jak deweloperzy i firmy wykorzystają potencjał tych otwartych rozwiązań. Liczne intrygujące projekty można już zaobserwować na Gemmaverse.

Przed start-upami otwiera się świat nowych możliwości

Źródło