Bielik v2.2 dostępny. Jak działa polski model językowy nowej generacji?
Bielik v2.2 to rodzimy model językowy kolejnej generacji, który bazuje na francuskim Mistral-7B. Wytrenowano go na zbiorze polskich tekstów. Model przeszedł ciekawą ewolucję. Sprawdziłem jego możliwości w akcji i wy również możecie to zrobić bez żadnych opłat.

Bielik v2.2 to aktualna wersja polskiego modelu językowego, który jest rozwijany przez Krzysztofa Ociepę od 2023 r. Jego pierwszą wersją był APT-3 i bazuje na francuskim modelu Mistral-7B. Jakie obecnie możliwości oferuje to rozwiązanie? Sprawdziłem je dzięki projektowi SpeakLeash, którym od 2022 r. kieruje Sebastian Kondracki.
Chat Arena PL w SpeakLeash
Zacznijmy od tego, że Bielik v2.2 został wytrenowany na zbiorze polskich tekstów. Początkowo wykorzystano zaledwie 10% materiałów SpeakLeash. Jednak później było ich już ponad 6 mln stron i zajmowały łącznie 290 GB.
Jeśli chcecie przetestować asystenta Chat Arena PL, to można go znaleźć w sekcji Narzędzia na stronie SpeakLeash.org.pl. Załóżmy, że chcemy stworzyć z użyciem AI krótką bajkę. Ja postanowiłem wykorzystać opcję Bitwa!, która pozwala na wygenerowanie tekstu na podstawie dwóch modeli i następnie można je porównać (nie wiedząc o tym, którymi są).
Poprosiłem też AI o udzielenie odpowiedzi na pytanie: czy Polska jest gościna? Uzyskałem wyniki, które widać poniżej. Bardziej szczegółową odpowiedź dał mi model B. Sprawdzam i okazuje się, że ukrywa się za nią Bielik. Podobnie było w przypadku innych pytań związanych tematycznie z Polską. Spróbujcie tego sami i sprawdźcie, jakie uda wam się uzyskać efekty.

Jeśli chcecie uzyskać dostęp do Bielika v2.2, to jest to możliwe w sekcji Bielik vs świat. W tym miejscu można porównać go z innymi dostępnymi (również jego starszymi wersjami). Wystarczy tylko wpisać prompt i następnie na rozwijalnej liście wskazać jeden z pozostałych modeli. Poniżej możecie zobaczyć, jak Bielik poradził sobie z "bajką o Przemku" vs GPT 4o mini.

Bielik v2.2 wymagał superkomputerów
Praca tego modelu językowego wymagała wielkiej mocy obliczeniowej. W tym celu skorzystano z pomocy Akademickiego Centrum Komputerowego AGH w Krakowie i wykorzystano superkomputery Athena oraz Helios (o mocy 7,7 petaflopsów i 35 petaflopsów). To pozwoliło na dalszy rozwój Bielika, który coraz lepiej radzi sobie z polskimi tematami.
Co ważne twórcy projektu SpeakLeash zachęcają do dołączenia do społeczności, która zajmuje się dalszym rozwojem Bielika. W ten sposób można będzie wesprzeć rozwój polskiej sztucznej inteligencji. Już teraz projekt ma ponad tysiąc aktywnych uczestników.
***
Bądź na bieżąco i zostań jednym z 90 tys. obserwujących nasz fanpage - polub Geekweek na Facebooku i komentuj tam nasze artykuły!
***
Co myślisz o pracy redakcji Geekweeka? Oceń nas! Twoje zdanie ma dla nas znaczenie.