Książki na dobranoc przeczyta... sztuczna inteligencja. AI w Apple Books

Apple wprowadziło nową funkcję do swojej aplikacji z książkami elektronicznymi, która w Polsce nosi nazwę "Książki". Chodzi o cyfrowych lektorów AI, których głosy są oparte na ludzkich lektorach. Brzmią oni... mniej więcej tak, jak można się tego spodziewać, tzn. są oczywiście zrozumiali, ale w ich głosach da się wyczuć robotyczną nutę. Z rozwiązania mają skorzystać małe wydawnictwa, początkujący autorzy oraz self-publisherzy.

Książki na dobranoc przeczyta nam... sztuczna inteligencja.
Książki na dobranoc przeczyta nam... sztuczna inteligencja.123RF/PICSEL

Jak czytamy na stronie internetowej Apple, opcja ta jest aktualnie dostępna jedynie dla książek z gatunków romans oraz fikcja. Publikacje przeczytać mogą dwa cyfrowe głosy, nazwane Madison i Jackson. Niedługo do biblioteki mają trafić też dwa nowe— Helena i Mitchell, którzy zajmą się czytaniem książek non-fiction. Zapewne jednak nieprędko usłyszymy je w polskiej wersji językowej, a aktualnie dostępna jest jedynie angielska. I już tutaj pojawia się zastrzeżenie. Na stronie możemy wysłuchać próbek głosów i tak jak damski (Madison) brzmi dość naturalnie, choć nadal da się rozpoznać, że nie tekstu nie czyta człowiek, tak męski (Jackson) przypomina popularny syntezator mowy IVONA.

Co więcej, na stronie giganta technologicznego z Cupertino widnieje też informacja, że lektorzy AI nie przeczytają powieści kryminalnych, thrillerów, science-fiction czy fantasy. Jak podkreśla firma, głosy cyfrowe są tworzone i optymalizowane dla konkretnych gatunków.

Dystrybucja wygenerowanych w ten sposób audiobooków ma się odbywać wyłącznie przez Apple Books, ale powinniśmy je też znaleźć w bibliotekach publicznych i akademickich. Wydawca bądź autor zachowuje prawa do dźwiękowej wersji dzieła.

Kto skorzysta z lektora AI?

Sztuczna inteligencja czytająca książki może się faktycznie przydać wydawcom czy autorom, którzy stawiają pierwsze kroki na rynku wydawniczym. Ogromną zaletą tego rozwiązania jest jego dostępność — za pomocą kilku kliknięć każdy może spróbować wygenerować swojego audiobooka.

Dlaczego spróbować, a nie po prostu wygenerować? Istnieją pewne warunki, które każda książka musi spełnić. Tytuły są oceniane na podstawie kilku kryteriów i są to między innymi:

  • jakość pliku, 
  • zgodność treści (czyli brak skomplikowanego formatowania, ograniczona liczba słów i zwrotów obcojęzycznych), 
  • recenzja wydawnicza, 

ale Apple zastrzega, że nawet jeśli wszelkie powyższe zostaną spełnione, dzieło nadal może nie przejść syntezy. Odrzucone pozycje mogą być jednak zaakceptowane w przyszłości. Ważne jest też to, aby tekst wpasowywał się w konkretny gatunek — autorzy kryminałów czy fantasy muszą jeszcze chwilę poczekać na swoją kolej. Jak zaznacza firma, gdy złożymy wniosek, przetwarzanie książki oraz przeprowadzenie kontroli jakości trwa od jednego do dwóch miesięcy.

Ciekawym jest to, jak funkcja zostanie przyjęta przez czytelników czy w tym wypadku słuchaczy. Cyfrowi lektorzy AI obniżą koszty, które musiałoby ponieść wydawnictwo bądź autor, jednak czy będą w stanie zapewnić słuchowisko na tym samym poziomie, co ludzki lektor, który głosowo interpretuje czytaną treść, nierzadko wpływając tym samym na jej odbiór? Prawdopodobnie nie, choć ten aspekt każdy oceni sam.

Szwecja: Meble z elektrycznych skuterów Deutsche Welle
INTERIA.PL
Masz sugestie, uwagi albo widzisz błąd?
Dołącz do nas