«Живём один раз»: глава OpenAI сам нарушает правила безопасности ИИ
Глава OpenAI Сэм Альтман признался, что нарушил собственное правило по безопасности ИИ всего через пару часов после того, как стал его применять.
Глава OpenAI Сэм Альтман признался, что нарушил собственное правило по безопасности ИИ всего через пару часов после того, как стал его применять.
Глава OpenAI Сэм Альтман признался, что нарушил собственное правило по безопасности ИИ всего через пару часов после того, как стал его применять.
Выступая на сессии вопросов и ответов для разработчиков, он рассказал, что из-за удобства дал ИИ-агенту полный доступ к своему компьютеру — и считает, что так поступают многие пользователи.
По словам Альтмана, главная опасность заключается в том, что мощь и удобство ИИ-систем подталкивают людей передавать им все больше контроля без готовой инфраструктуры безопасности. «Вероятность серьезных сбоев низкая, но последствия могут быть катастрофическими. И мы просто скользим в это состояние с мыслью „ну, живем один раз, надеюсь, все будет нормально“», — сказал он.
Альтман признался, что изначально сомневался, стоит ли давать агенту полный доступ, но быстро передумал, потому что модель «ведет себя разумно». Его тревожит, что общество может «проспать» момент, когда доверие к сложным ИИ-моделям станет массовым, а систем защиты и контроля все еще не будет.
По мере роста возможностей ИИ, отметил Альтман, уязвимости в безопасности или проблемы согласованности целей могут оставаться незамеченными неделями или месяцами. При этом «большой инфраструктуры безопасности» для таких систем пока не существует. Он добавил, что создание подобных решений могло бы стать перспективной нишей для стартапов.
Кроме того, Альтман признал, что GPT-5 уступает GPT-4.5 в редакторском и литературном письме. По его словам, с появлением моделей рассуждения акцент сместился в сторону логики и программирования. При этом он подчеркнул, что в будущем OpenAI стремится к универсальным моделям, которые будут сочетать сильные способности к рассуждению с качественным письмом.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.