Реклама в Telegram-каналах DzikPic и dev.by теперь дешевле. Узнать подробности 👨🏻‍💻
Support us

Google разработала ИИ для проверки фактов у других ИИ

Компания разработала ИИ-системы для оценки фактов на основе поисковой выдачи. Она называется SAFE: Search Augmented Factuality Evaluator.

Оставить комментарий
Google разработала ИИ для проверки фактов у других ИИ

Компания разработала ИИ-системы для оценки фактов на основе поисковой выдачи. Она называется SAFE: Search Augmented Factuality Evaluator.

Система находит ошибки в ответах сервисов на базе больших языковых моделей. Таким образом разработчики пытаются решить проблему так называемых «галлюцинаций»: LLM нередко ошибаются, приводя в ответах недостоверные данные и настаивая на их истинности.

исследователи DeepMind создали ИИ-приложение, которое автоматически проверяет правильность ответов LLM и выявляет неточности. Новая модель вычленяет из вывода нейросети отдельные факты, формирует запрос поисковой системе и пытается найти подтверждение изложенных сведений.

Во время тестов SAFE проверила 16 тысяч ответов нескольких сервисов, среди которых были самые популярные Gemini, ChatGPT, Claude и PaLM-2. Затем выводы сравнили с результатами поиска людей вручную. В 72% случаев выводы SAFE совпали с мнениями людей. При анализе расхождений в 76% случаев прав был ИИ.

Команда DeepMind опубликовала код SAFE в GitHub, предоставив возможность использовать систему всем желающим для повышения точности и надёжности ответов LLM-моделей.

Google согласилась уничтожить данные о просмотре собранные в режиме «инкогнито»
Google согласилась уничтожить данные о просмотре, собранные в режиме «инкогнито»
По теме
Google согласилась уничтожить данные о просмотре, собранные в режиме «инкогнито»
Чат-боты уничтожат Google? Почему пока рано говорить о победе ИИ
Чат-боты уничтожат Google? Почему пока рано говорить о победе ИИ 
По теме
Чат-боты уничтожат Google? Почему пока рано говорить о победе ИИ
ИИ поможет пользователям Google спланировать путешествие
ИИ поможет пользователям Google спланировать путешествие
По теме
ИИ поможет пользователям Google спланировать путешествие
Новый рекламный формат в наших телеграм-каналах.

Купить 500 символов за $150

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
1 комментарий
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Bubble
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.