"Żyjemy tylko raz": szef OpenAI sam łamie zasady bezpieczeństwa AI
Szef OpenAI Sam Altman przyznał, że złamał własną zasadę bezpieczeństwa AI zaledwie kilka godzin po jej wprowadzeniu.
Szef OpenAI Sam Altman przyznał, że złamał własną zasadę bezpieczeństwa AI zaledwie kilka godzin po jej wprowadzeniu.
Szef OpenAI Sam Altman przyznał, że złamał własną zasadę bezpieczeństwa AI zaledwie kilka godzin po jej wprowadzeniu.
Podczas sesji Q&A dla deweloperów Altman ujawnił, że ze względu na wygodę udzielił agentowi AI pełnego dostępu do swojego komputera — i uważa, że wielu użytkowników postępuje podobnie.
Według Altmana, główne zagrożenie polega na tym, że moc i wygoda systemów AI skłania ludzi do przekazywania im coraz większej kontroli bez odpowiedniej infrastruktury bezpieczeństwa. «Prawdopodobieństwo poważnych awarii jest niskie, ale konsekwencje mogą być katastrofalne. Po prostu wślizgujemy się w ten stan z myślą: ‘cóż, żyje się raz — mam nadzieję, że wszystko będzie dobrze» — powiedział.
Altman przyznał, że początkowo wahał się, czy udzielić agentowi pełnego dostępu, ale szybko zmienił zdanie, ponieważ model «zachowuje się rozsądnie». Martwi go, że społeczeństwo może «przespać» moment, w którym zaufanie do złożonych modeli AI stanie się powszechne, a systemy ochrony i kontroli wciąż nie będą istnieć.
Wraz ze wzrostem możliwości AI, zauważył Altman, luki w zabezpieczeniach lub problemy ze spójnością celów mogą pozostać niezauważone przez tygodnie lub miesiące. Jednocześnie «rozbudowana infrastruktura bezpieczeństwa» dla takich systemów jeszcze nie istnieje. Dodał, że tworzenie takich rozwiązań mogłoby być obiecującą niszą dla startupów.
Altman przyznał również, że GPT-5 ustępuje GPT-4.5 pod względem pisania redakcyjnego i literackiego. Według niego, wraz z pojawieniem się modeli rozumowania, nacisk przesunął się w kierunku logiki i programowania. Podkreślił jednak, że w przyszłości OpenAI dąży do uniwersalnych modeli, które będą łączyć silne zdolności rozumowania z wysokiej jakości pisaniem.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.