Дапамажыце dev.by 🤍
Падтрымаць

OpenAI выпусціла GPT-5.4 з кантэкстам да 1 млн токенаў

Кампанія прадставіла новую мадэль штучнага інтэлекту GPT‑5.4, арыентаваную на прафесійныя задачы і складаныя працоўныя працэсы.

Пакінуць каментарый
OpenAI выпусціла GPT-5.4 з кантэкстам да 1 млн токенаў

Кампанія прадставіла новую мадэль штучнага інтэлекту GPT‑5.4, арыентаваную на прафесійныя задачы і складаныя працоўныя працэсы.

Мадэль даступна адразу ў некалькіх версіях: стандартнай версіі для разважанняў (GPT-5.4 Thinking) і больш магутнай канфігурацыі GPT-5.4 Pro, разлічанай на максімальна высокую прадукцыйнасць.

Адным з ключавых абнаўленняў стала значна павялічаная даўжыня кантэксту. У API версія GPT-5.4 падтрымлівае кантэкстнае акно да 1 мільёна токенаў — гэта самы вялікі паказчык сярод мадэляў OpenAI. Распрацоўшчыкі таксама заявілі аб павышанай эфектыўнасці: новая мадэль здольная вырашаць тыя ж задачы, выкарыстоўваючы заўважна менш токенаў, чым папярэдняя версія.

Па дадзеных кампаніі, GPT-5.4 дэманструе рэкордныя вынікі ў шэрагу тэстаў. У прыватнасці, мадэль прадэманстравала лепшыя паказчыкі ў бенчмарках OSWorld-Verified і WebArena Verified, якія правяраюць здольнасць ШІ кіраваць камп’ютарам і браўзерам. У тэсце GDPval, які ацэньвае выкананне задач інтэлектуальнай працы ў дзясятках прафесій, мадэль дасягнула выніку 83%.

Параўнанне вынікаў GPT-5.4, GPT-5.3-Codex і GPT-5.2 на ключавых бенчмарках. Крыніца: OpenAI.

Новая мадэль таксама лепш спраўляецца з прафесійнымі задачамі, напрыклад, стварэннем прэзентацый, фінансавых мадэляў і юрыдычных аналізаў. Распрацоўшчыкі надалі ўвагу і дакладнасці адказаў: GPT-5.4 на 33% радзей дапускае памылкі ў асобных сцвярджэннях і на 18% радзей выдае адказы, якія змяшчаюць фактычныя недакладнасці, у параўнанні з папярэдняй версіяй GPT-5.2.

Вынікі тэсту GDPval: мадэлі GPT-5.4 і GPT-5.4 Pro паказваюць больш высокі ўзровень выканання задач у параўнанні з GPT-5.2, апярэджваючы базавы ўзровень галіновых спецыялістаў. Крыніца: OpenAI.

Разам з запускам OpenAI прадставіла новы механізм працы з інструментамі — Tool Search. Раней мадэлі атрымлівалі апісанні ўсіх даступных інструментаў загадзя, што павялічвала расход токенаў. Цяпер сістэма можа запытваць інфармацыю аб патрэбных інструментах па меры неабходнасці, што робіць запыты хутчэйшымі і таннейшымі пры працы з вялікай колькасцю падлучаных сэрвісаў.

Параўнанне расходу токенаў пры выкарыстанні функцыі tool search: новая сістэма дазваляе значна знізіць аб’ём токенаў: прыкладна з 123 тысяч да 65 тысяч у сярэднім на задачу. Крыніца: OpenAI.

Акрамя таго, кампанія правяла новыя тэсты бяспекі, каб праверыць здольнасць мадэляў скажаць уласны ход разважанняў — ланцужок лагічных крокаў пры выкананні складаных задач.

Версія GPT-5.4 Thinking даступна карыстальнікам ChatGPT з падпіскамі Plus, Team і Pro, а таксама распрацоўшчыкам праз API. Больш прадукцыйная версія GPT-5.4 Pro прызначана для карпаратыўных кліентаў і задач, якія патрабуюць максімальнай вылічальнай магутнасці.

OpenAI выпусціла аплікацыю Codex для Windows
OpenAI выпусціла аплікацыю Codex для Windows
Па тэме
OpenAI выпусціла аплікацыю Codex для Windows
Anthropic абвінаваціла OpenAI у «хлусні« з-за ўгоды з Пентагонам Альтман апраўдваецца
Anthropic абвінаваціла OpenAI у «хлусні» з-за ўгоды з Пентагонам, Альтман апраўдваецца
Па тэме
Anthropic абвінаваціла OpenAI у «хлусні» з-за ўгоды з Пентагонам, Альтман апраўдваецца
OpenAI абнавіла ChatGPT: адказы больш дакладныя і менш крынжовыя
OpenAI абнавіла ChatGPT: адказы больш дакладныя і менш крынжовыя
Па тэме
OpenAI абнавіла ChatGPT: адказы больш дакладныя і менш крынжовыя
Чытайце таксама
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.