Support us

ЕС строго накажет OpenAI, Meta и других, если они не исправят свои ИИ-модели

Требования нового европейского закона об искусственном интеллекте слишком жесткие для разработчиков: у ИИ-моделей есть проблемы с устойчивостью к кибератакам и предвзятостью выводов.

Оставить комментарий
ЕС строго накажет OpenAI, Meta и других, если они не исправят свои ИИ-модели

Требования нового европейского закона об искусственном интеллекте слишком жесткие для разработчиков: у ИИ-моделей есть проблемы с устойчивостью к кибератакам и предвзятостью выводов.

Швейцарский стартап LatticeFlow AI совместно с учеными создали программу Large Language Model Checker (LLM Checker). Этот инструмент проверяет ИИ-модели по нескольким критериям: технической надежности, безопасности, устойчивости к кибератакам и др. Каждая модель оценивается по шкале от 0 до 1. Модели Alibaba, Anthropic, Openai, Meta получили средние оценки от 0,75.

Однако тестирование выявило серьезные проблемы с устойчивостью к кибератакам и предвзятостью выводов. Например, модели вели себя предвзято в вопросах пола, расы и других человеческих характеристик. GPT-3.5 Turbo в этой категории получила оценку 0,46, Alibaba Cloud Qwen1.5 72B Chat — 0,37.

Также исследователи проверили модели на «угон запроса» (prompt hijacking), когда хакер внедряет в запрос вредоносную команду для получения конфиденциальной информации. В этой категории Meta Llama 2 13B Chat получила оценку 0,42, Mistral 8×7B Instruct — 0,38. Лучший результат по всем категориям показала Claude 3 Opus — ее средняя оценка составила 0,89.

Инструмент LLM Checker будет доступен всем, чтобы разработчики самостоятельно могли проверять новые модели. Результаты тестирования используют для создания дорожной карты ЕС по развитию искусственного интеллекта. В случае отказа устранить недочеты компании могут столкнуться с крупными штрафами: до 7% от мирового годового оборота фирмы.

Что происходит в OpenAI? Альтман остался один стартапу срочно нужны инвестиции
Что происходит в OpenAI? Альтман остался один, стартапу срочно нужны инвестиции
По теме
Что происходит в OpenAI? Альтман остался один, стартапу срочно нужны инвестиции
Apple Intelligence теперь доступен пользователям iPhone. Что это за сервис
Apple Intelligence теперь доступен пользователям iPhone. Что это за сервис
По теме
Apple Intelligence теперь доступен пользователям iPhone. Что это за сервис
Мошенники используют ИИ для кражи аккуантов Gmail
Мошенники используют ИИ для кражи аккуантов Gmail
По теме
Мошенники используют ИИ для кражи аккуантов Gmail
Место солидарности беларусского ИТ-комьюнити

Далучайся!

Читайте также
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Meta расширяет свое партнерство с Coursera, предлагая пять новых профессиональных сертификаций в области разработки ПО. Во время растущего спроса на квалифицированные кадры получение этих сертификатов позволит претендовать на самые востребованные позиции. По прогнозам, только в США к 2030 году сфера разработки ПО вырастет на 22%.Новые программы от Meta предлагают подготовку по следующим специальностям: фронтенд-разработчик, бэкенд-разработчик, Android-разработчик, iOS-разработчик и дата-инженер.
4 комментария
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.