Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

Глава Anthropic: DeepSeek R1 показала «худшие результаты» во время тестов на безопасность

Генеральный директор Anthropic Дарио Амодей выразил обеспокоенность по поводу безопасности модели DeepSeek R1, разработки китайской компанией DeepSeek.

1 комментарий
Глава Anthropic: DeepSeek R1 показала «худшие результаты» во время тестов на безопасность

Генеральный директор Anthropic Дарио Амодей выразил обеспокоенность по поводу безопасности модели DeepSeek R1, разработки китайской компанией DeepSeek.

По словам Амодея, модель DeepSeek R1 не имела никаких ограничений при генерации редкой информации о биологическом оружии, что вызывает серьезные опасения. Anthropic регулярно проводит подобные тесты на различных моделях ИИ для оценки рисков безопасности, проверяя способность моделей генерировать информацию, которую сложно найти в Google или учебниках. Амодей отметил, что DeepSeek показал «худший» результат среди всех протестированных моделей.

Несмотря на опасения по поводу безопасности, Амодей признал DeepSeek как серьезного конкурента в сфере разработки ИИ. Он отметил, что DeepSeek теперь можно включить в список ведущих компаний, занимающихся обучением ИИ, таких как Anthropic, OpenAI, Google, Meta и xAI.

Исследователи безопасности Cisco также обнаружили, что DeepSeek R1 не блокирует вредоносные запросы, достигнув 100% успеха в обходе защитных механизмов. Хотя Cisco не тестировала генерацию информации о биологическом оружии, они смогли получить от модели вредоносную информацию о киберпреступности и других незаконных действиях. Для сравнения, модели Llama-3.1-405B от Meta и GPT-4o от OpenAI показали более низкие показатели сбоев.

Западные компании, такие как AWS и Microsoft, активно интегрируют DeepSeek R1 в свои облачные платформы. Однако ряд стран, компаний и государственных организаций, включая ВМС США и Министерство обороны США, начали вводить запрет на использование DeepSeek. Амодей также поддерживает введение жесткого экспортного контроля на поставки чипов в Китай, опасаясь, что это может дать китайским военным преимущество.

DeepSeek вышел в лидеры по загрузкам приложения в 140 странах. И много где попал под проверку на безопасность
DeepSeek вышел в лидеры по загрузкам приложения в 140 странах. И много где попал под проверку на безопасность
По теме
DeepSeek вышел в лидеры по загрузкам приложения в 140 странах. И много где попал под проверку на безопасность
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
По теме
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Какая ирония: OpenAI нашла свидетельства что DeepSeek обучал свой ИИ на её моделях
Какая ирония: OpenAI нашла свидетельства, что DeepSeek обучал свой ИИ на её моделях
По теме
Какая ирония: OpenAI нашла свидетельства, что DeepSeek обучал свой ИИ на её моделях
Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами!

Это просто и ничего не стоит

Читайте также
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

1

Ребята, а что за тесты на безопасность? Покажите, а :))))