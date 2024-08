Bielik v2.2 to aktualna wersja polskiego modelu językowego, który jest rozwijany przez Krzysztofa Ociepę od 2023 r. Jego pierwszą wersją był APT-3 i bazuje na francuskim modelu Mistral-7B. Jakie obecnie możliwości oferuje to rozwiązanie? Sprawdziłem je dzięki projektowi SpeakLeash, którym od 2022 r. kieruje Sebastian Kondracki.

Chat Arena PL w SpeakLeash

Zacznijmy od tego, że Bielik v2.2 został wytrenowany na zbiorze polskich tekstów. Początkowo wykorzystano zaledwie 10% materiałów SpeakLeash. Jednak później było ich już ponad 6 mln stron i zajmowały łącznie 290 GB.

Jeśli chcecie przetestować asystenta Chat Arena PL, to można go znaleźć w sekcji Narzędzia na stronie SpeakLeash.org.pl. Załóżmy, że chcemy stworzyć z użyciem AI krótką bajkę. Ja postanowiłem wykorzystać opcję Bitwa!, która pozwala na wygenerowanie tekstu na podstawie dwóch modeli i następnie można je porównać (nie wiedząc o tym, którymi są).

Poprosiłem też AI o udzielenie odpowiedzi na pytanie: czy Polska jest gościna? Uzyskałem wyniki, które widać poniżej. Bardziej szczegółową odpowiedź dał mi model B. Sprawdzam i okazuje się, że ukrywa się za nią Bielik. Podobnie było w przypadku innych pytań związanych tematycznie z Polską. Spróbujcie tego sami i sprawdźcie, jakie uda wam się uzyskać efekty.

Zdjęcie Bielik to polski model językowy nowej generacji. / Dawid Długosz / INTERIA.PL

Jeśli chcecie uzyskać dostęp do Bielika v2.2, to jest to możliwe w sekcji Bielik vs świat. W tym miejscu można porównać go z innymi dostępnymi (również jego starszymi wersjami). Wystarczy tylko wpisać prompt i następnie na rozwijalnej liście wskazać jeden z pozostałych modeli. Poniżej możecie zobaczyć, jak Bielik poradził sobie z "bajką o Przemku" vs GPT 4o mini.



Zdjęcie "Bajka o Przemku" w wykonaniu modelu Bielik v2.2 vs GPT 4o. / Dawid Długosz / INTERIA.PL

Bielik v2.2 wymagał superkomputerów

Praca tego modelu językowego wymagała wielkiej mocy obliczeniowej. W tym celu skorzystano z pomocy Akademickiego Centrum Komputerowego AGH w Krakowie i wykorzystano superkomputery Athena oraz Helios (o mocy 7,7 petaflopsów i 35 petaflopsów). To pozwoliło na dalszy rozwój Bielika, który coraz lepiej radzi sobie z polskimi tematami.

Co ważne twórcy projektu SpeakLeash zachęcają do dołączenia do społeczności, która zajmuje się dalszym rozwojem Bielika. W ten sposób można będzie wesprzeć rozwój polskiej sztucznej inteligencji. Już teraz projekt ma ponad tysiąc aktywnych uczestników.