AI się poddaje. Biblioteka UW prosi internautów o pomoc
Sztuczna inteligencja radzi sobie z coraz trudniejszymi zadaniami, ale niektóre rękopisy wciąż pozostają poza jej zasięgiem. Biblioteka Uniwersytecka w Warszawie szuka wolontariuszy, którzy pomogą odczytać unikatowe dokumenty, dawne plany i historyczne zapiski.

Sztuczna inteligencja potrafi dziś tłumaczyć teksty, rozpoznawać obrazy i odpowiadać na pytania. To robi wrażenie, przyznacie. Są jednak dokumenty, wobec których nawet nowoczesne algorytmy okazują się bezradne i nie mam wcale na myśli wielkich zagranicznych muzeów skrywających starożytne pisma z Bliskiego Wschodu czy Ameryki Płudniowej. Takie materiały znajdują się również u nas, w zbiorach Biblioteki Uniwersyteckiej w Warszawie. Dlatego BUW uruchomił projekt TranskriBUW i szuka wolontariuszy, którzy pomogą odczytać historyczne rękopisy.
Rękopisy, których nie potrafi odczytać sztuczna inteligencja
Jak wyjaśnia Biblioteka UW, prawidłowe skatalogowanie wielu zabytkowych dokumentów przypomina pracę detektywa. Niektóre rękopisy nie mają strony tytułowej, daty ani informacji o autorze. Bibliotekarze muszą więc rozpoznawać rodzaje pisma, pieczęcie czy dawne formy tytułów, aby ustalić, kto stworzył dokument i kiedy powstał.
- To w oparciu o te dane określamy często odbiorcę i nadawcę, umiejscawiamy dany dokument w czasie i przestrzeni, i dopiero wtedy możemy jego opis umieścić w naszych katalogach. Staje się on wówczas wyszukiwalny dla badaczy. Rozpoznanie zawartości naszych zasobów wymaga więc ogromnej wiedzy i czasu, a my mamy do skatalogowania dziesiątki tysięcy obiektów - powiedziała Agnieszka Kościelniak-Osiak, wicedyrektorka BUW.
Sytuację komplikuje historia. W czasie II wojny światowej biblioteka straciła ponad 90 proc. swoich rękopisów. Po 1945 roku zaczęto jednak ponownie budować kolekcję. Do zbiorów trafiały między innymi materiały badaczy oraz artefakty z Azji i Afryki. Czasem nie wiadomo nawet, jakim alfabetem zostały zapisane.

Wolontariusze pomagają odszyfrować historię
Obecnie uczestnicy projektu pracują m.in. nad niezwykłym rysunkiem mikrograficznym z 1762 roku autorstwa Emanuela Listnaua. Przedstawia on konny portret króla Prus Fryderyka II Wielkiego, a cały wizerunek został utworzony z odręcznie zapisanych słów w języku niemieckim.
Właśnie przy takich dokumentach sztuczna inteligencja często przegrywa. Aby nauczyć algorytm rozpoznawania konkretnego pisma, potrzeba... tysięcy przykładów. W przypadku unikatowych rękopisów takich danych zwyczajnie nie ma. Problemem jest również szwabacha, czyli dawny gotycki krój pisma, szczególnie trudny do odczytania w wersji odręcznej.
![[Akta rozwodowe z końca 18 i początku 19 wieku, dotyczące małżonków Pollaender - 1792, małżonków Puzynów - 1805, małżonków Sozańskich - 1828 oraz fragmenty innych].: #77 Stara, pożółkła kartka papieru zapisana ręcznie atramentem, tekst w języku polskim zapisany ozdobnym, dawnym pismem z wyraźnie widocznymi odstępami między wersami i nieregularnymi marginesami.](https://i.iplsc.com/000MU5DC6TKEA8BW-C125-F4.webp)
Każdy może zostać cyfrowym badaczem, ty też
W projekcie znajdują się m.in. plany bitwy pod Pragą z 1757 roku, projekty przebudowy Pałacu Saskiego czy akta rozwodowe z przełomu XVIII i XIX wieku. Obecnie społeczność TranskriBUW liczy około 240 osób, ale biblioteka zachęca do dołączania kolejnych pasjonatów historii.
Jak podkreśla Urszula Szwed-Strych z BUW, najważniejsza podczas przepisywania dokumentów jest wierność oryginałowi. Nawet błędy ortograficzne, skreślenia czy poprawki autora muszą zostać zachowane. Dzięki temu historyczne źródła mogą zostać udostępnione badaczom w możliwie najdokładniejszej formie. W tym przypadku nasza ludzka cierpliwość i spostrzegawczość wciąż okazują się skuteczniejsze niż sztuczna inteligencja.
Źródło: Biblioteka UW, naukawpolsce.pl









