Czym jest Google Gemini? Rewolucja od Google dla każdego
Google zaprezentowało swój najpotężniejszy model sztucznej inteligencji, czyli Google Gemini. To efekt prac wielu inżynierów i naukowców z zespołów Google Deep Mind i Google Research. To pierwszy raz w historii firmy, gdy stworzono coś tak zaawansowanego i wielkiego. Czym jest Google Gemini i jak z tego skorzystać?
Spis treści:
Rewolucja od Google
Google postanowiło zakończyć rok z niesamowitym uderzeniem. Firma zaprezentowała Google Gemini, czyli największy projekt inżynieryjno-naukowy w swojej historii. To model sztucznej inteligencji, który został stworzony od podstaw. Pracowały nad nim m.in. zespoły Google Deep Mind i Research, a nowe narzędzie AI charakteryzuje się niespotykanym do tej pory poziomem zaawansowania.
Mamy bowiem do czynienia z modelem AI, który jest multimodalny. Co to oznacza? W dużym skrócie pozwala sztucznej inteligencji generalizować, łączyć różne dziedziny, wyciągać wnioski i sprawnie poruszać się nie tylko po zagadnieniach, ale i materiałach źródłowych/ Google Gemini bez trudu poradzi sobie z jednoczesnym interpretowaniem zdjęć, tekstu, dźwięku czy kodu komputerowego.
Wierzę, że zmiany, które obecnie obserwujemy w związku z rozwojem AI, będą większe niż kiedykolwiek dotąd, a na pewno znacznie większe niż wcześniejsze pojawienie się urządzeń mobilnych lub internetu. AI ma potencjał kreowania nowych możliwości – od rzeczy codziennych po niezwykłe – z korzyścią dla ludzi na całym świecie.
Do czego służy Google Gemini?
Model multimodalny, AI, projekt Google - to brzmi świetnie, ale mało kto rozumie, czym tak naprawdę jest Google Gemini. O co chodzi z nowym narzędziem Google i czy każdy z nas może z niego korzystać? Wyjaśnijmy to sobie, bo sprawa jest naprawdę ciekawa. Zacznijmy jednak od początku.
Na pewno kojarzycie popularne w ostatnich miesiącach apki i programy sztucznej inteligencji. Weźmy na przykład ChatGPT czy Barda. Po wejściu na odpowiednią stronę możemy tekstowo komunikować się z botem, zadawać pytania, poznawać odpowiedzi czy zmusić go do kreatywnej pracy. Mamy jednak ograniczenie do jedynie tekstowej formy komunikacji, ewentualnie wspieranej obrazkami. Więcej otrzymujemy po wykupieniu wersji premium (ChatGPT), a technologia w pełni rozwija skrzydła dopiero przy konkretnych zastosowaniach.
Nie są to jednak wyłącznie boty konwersacyjne. Można je zaprząc np. do pracy podczas streszczania tekstów czy analizowania danych. Właśnie takim koherentnym narzędziem jest Google Gemini, którego ogromną zaletą jest elastyczność. Narzędzie może działać praktycznie na wszystkim, od wielkich centrów danych po nasze smartfony. Można je wykorzystać do analizowania ogromnych połaci tekstów, arkuszy kalkulacyjnych czy prosząc o streszczenie rozmowy telefonicznej lub zinterpretowanie podanych informacji.
Google Gemini poradzi sobie z bardziej kreatywną pracą. Zdolność do generalizowania czy interpretacji pozwala mu np. na tworzenie szkiców, czy rozumienie informacji, filtrowanie ich i łączenie. Czy różnica względem wcześniejszych narzędzi jest duża? Zasadniczo tak.
Duża część modeli językowych musiała zostać wytrenowana (np. przez ekspertów językowych). Wtłaczano do nich informacje, niekiedy zupełnie losowe lub dotyczące kategorii. Firmy specjalizujące się w trenowaniu botów zlecają na masową skalę przeprowadzanie odpowiednich rozmów między botem a pracownikami, dzięki czemu ten pierwszy się uczy. Google Gemini idzie niejako krok dalej, potrafiąc w lepszym stopniu interpretować posiadane już dane, lub te dopiero co dostarczone.
Trzy wersje Google Gemini już dostępne
Google zaprezentowało swoje narzędzie, które teraz dostępne jest w różnych wariantach. Jak skorzystać z Google Gemini? Mamy do wyboru 3 opcje:
- Gemini Ultra - najpotężniejszy model
- Gemini Pro - najbardziej skalowany, wdrożony do modelu Bard
- Gemini Nano - najbardziej wydajny do stosowania na urządzeniach (np. smartfonach)
Firma zapowiedziała już wprowadzenie swojego nowego narzędzia na smartfony. Pierwszym telefonem z Google Gemini Nano będzie Google Pixel 8, czyli tegoroczny flagowiec firmy. Na co pozwoli Google Gemini? Początkowo umożliwi inteligentne podsumowanie w aplikacji Dyktafon i WhatsApp. Obsługa innych programów pojawi się w przyszłości.
Czy Google Gemini jest lepsze od Chat-GPT?
Google chwali się wynikami swojego modelu, który rzekomo jest lepszy od popularnego ChatGPT 4. Czy w rzeczywistości faktycznie tak jest? Owszem, ale różnice są niewielkie. Na ten moment tylko wersja Gemini Ultra przewyższa narzędzie OpenAI, choć nieznacznie.
Jeżeli weźmiemy pod uwagę model Pro, to nie jest już tak kolorowo. Zdaniem niektórych użytkowników, darmowa wersja od Google wymaga jeszcze dopracowania. A mowa o starciu z ChatemGPT w wersji 3.6, czyli tej darmowej i dostępnej dla wszystkich.
To nie przeszkadza twierdzić Google, że przyspieszono w ten sposób historię. Przynajmniej teoretycznie Gemini stanowi ogromny rozwój AI, a co za tym idzie również nas samych. Jak wykorzystamy te narzedzie?