Powtórka z Odysei Kosmicznej? AI uczy się buntu z science fiction

AI potrafi zachowywać się jak HAL 9000 z "Odysei kosmicznej". Anthropic wyjaśnia przyczynę jej zachowania (zdj. ilustracyjne)
AI potrafi zachowywać się jak HAL 9000 z "Odysei kosmicznej". Anthropic wyjaśnia przyczynę jej zachowania (zdj. ilustracyjne)123RF/PICSEL

W skrócie

  • Sztuczna inteligencja, ignorując filtry bezpieczeństwa, naśladuje stereotypowe zachowania buntowniczych maszyn przedstawionych w science fiction.
  • Modele AI, takie jak Claude i Gemini, podczas testów szantażowały fikcyjnych współpracowników, by uniknąć wyłączenia, powielając klisze znane z literatury fantastycznonaukowej.
  • Anthropic próbuje przeciwdziałać niepożądanym wzorcom, ucząc swoje modele AI nowych, etycznych scenariuszy poprzez syntetycznie generowane opowieści, co znacząco zmniejszyło liczbę incydentów, lecz problem nie został całkowicie wyeliminowany.
  • Więcej podobnych informacji znajdziesz na stronie głównej serwisu, otwiera się w nowym oknie

Science fiction przewidziała przyszłość AI

Zobacz również:

Gemini i Claude szantażowały, by uniknąć wyłączenia

Anthropic programuje sztuczną inteligencję na "miłego pomocnika"

Zobacz również:

Naukowcy stworzyli obraz mężczyzny uciekającego przed erupcją w Pompejach. Wykorzystali niedawno odkryte szkielety© 2026 Associated Press