OpenAI prezentuje o3-pro. Nowy lider wśród modeli AI?
OpenAI właśnie wprowadziło swój najnowszy model AI – o3-pro. To potężne narzędzie oparte na rozumowaniu krok po kroku, które pokonuje konkurencję w testach matematycznych i naukowych. Model trafia do użytkowników ChatGPT Pro i twórców aplikacji przez API. Jest wolniejszy, ale dokładniejszy.

OpenAI prezentuje o3-pro. Najlepszy model językowy, jaki stworzyli?
We wtorek OpenAI wprowadziło na rynek nowy model sztucznej inteligencji - o3-pro, czyli ulepszoną wersję zaprezentowanego wcześniej modelu o3. Jak podkreśla firma, to ich najpotężniejsze narzędzie do tej pory, zaprojektowane z myślą o rozumowaniu krok po kroku, co ma przełożyć się na większą niezawodność w tak wymagających dziedzinach jak matematyka, fizyka, programowanie czy edukacja.
Model trafił już do użytkowników ChatGPT Pro i Team, zastępując dotychczasowy o1-pro. Z kolei klienci biznesowi (Enterprise) i edukacyjni (Edu) uzyskają dostęp w ciągu tygodnia. o3-pro jest także dostępny w API OpenAI, z wyceną 20 dolarów za milion tokenów wejściowych oraz 80 dolarów za milion tokenów wyjściowych. Przeliczając: milion tokenów wejściowych to mniej więcej 750 000 słów. Nieco więcej niż "Wojna i pokój" Lwa Tołstoja.
Lepszy we wszystkim. Ale wolniejszy
Jak wypada o3-pro na tle swojego poprzednika i konkurencji? Zdaniem OpenAI znakomicie. - W ocenach ekspertów recenzenci konsekwentnie preferują o3-pro nad o3 w każdej testowanej kategorii, szczególnie w takich obszarach jak nauka, edukacja, programowanie, biznes i pomoc w pisaniu - czytamy w oficjalnym changelogu. Model został też wysoko oceniony za klarowność, kompletność, zgodność z instrukcjami i precyzję odpowiedzi.
Nowy system ma również dostęp do szeregu narzędzi: potrafi przetwarzać dane wizualne, analizować pliki, korzystać z Pythona, przeszukiwać internet, a nawet dostosowywać swoje odpowiedzi na podstawie wcześniejszych interakcji dzięki funkcji pamięci. Mimo to nie jest wolny od ograniczeń. Po pierwsze, jego odpowiedzi są zauważalnie wolniejsze niż w przypadku o1-pro. Po drugie, na razie nie obsługuje Canvas (przestrzeni roboczej OpenAI), nie potrafi generować obrazów, a czaty tymczasowe zostały wyłączone z powodu "problemu technicznego".
Pokonuje konkurencję w testach AI
W wewnętrznych testach OpenAI nowy model osiąga imponujące wyniki. Na przykład w teście AIME 2024, który mierzy umiejętności matematyczne, o3-pro wypadł lepiej niż Gemini 2.5 Pro od Google. Z kolei w GPQA Diamond (egzaminie z wiedzy naukowej na poziomie doktoratu) pokonał Claude 4 Opus, flagowy model konkurencyjnego Anthropic.
Chociaż model wciąż ma pewne braki i ograniczenia, OpenAI nie kryje zadowolenia z postępu. Jeśli o3-pro faktycznie spełni pokładane w nim nadzieje, może wyznaczyć nowy standard w dziedzinie modeli opartych na rozumowaniu. Nie tylko w świecie nauki, ale też w codziennym wsparciu użytkowników.
Źródła: OpenAI, TechCrunch