Николай Чикишев 9 снежня 2024, 15:15

Які пошук лепшы: генератыўны або традыцыйны?

Чат-боты пачалі наступ на традыцыйныя пашукавікі: з кожным месяцам усё больш распрацоўшчыкаў дадаюць пошукавыя функцыі ў АІ-сэрвісы. Наколькі яны надзейныя? І калі мы скончым гугліць?

1 каментарый

Які пошук лепшы: генератыўны або традыцыйны?

Чат-боты пачалі наступ на традыцыйныя пашукавікі: з кожным месяцам усё больш распрацоўшчыкаў дадаюць пошукавыя функцыі ў АІ-сэрвісы. Наколькі яны надзейныя? І калі мы скончым гугліць?

Якія генератыўныя пашукавікі існуюць?

Вось некалькі папулярных сэрвісаў генератыўнага пошуку:

ChatGPT search ад OpenAI

Запушчаны ў ліпені гэтага года, SearchGPT спалучаў традыцыйныя функцыі пошуку з фарматам дыялогу. У кастрычніку функцыю назвалі ChatGPT search і адкрылі доступ падпісчыкам чат-бота. Пашукавік суправаджае адказы спасылкамі на вонкавыя сайты. У дадатак да шырэйшага вэб-пошуку пошукавая сістэма выкарыстоўвае інфармацыю, якую падаюць выдаўцы, якія падпісалі пагадненні з OpenAI (напрыклад, Vox Media, The Atlantic, News Corp і Financial Times). ChatGPT search выкарыстоўвае прасунутую мадэль OpenAI ChatGPT-4o.

AI Overviews ад Google

Першапачаткова сэрвіс называўся Search Generative Experience (SGE), затым яго перайменавалі ў AI Overviews. Гэтая функцыя інтэгруе зводкі, створаныя з дапамогай штучнага інтэлекту, у вынікі пошуку Google: кароткую інфармацыю можна знайсці ў інтэрфейсе пашукавіка пад пошукавай радком.

Copilot ад Microsoft

Microsoft, асноўны інвестар OpenAI, была адной з першых кампаній, якія выпусцілі генератыўную пошукавую сістэму АІ, калі запусціла версію Bing на базе АІ у 2023 годзе. Пашукавік выкарыстаў мадэлі OpenAI. Затым карпарацыя дапоўніла свой пашукавік новымі функцыямі, назваўшы іх Copilot. Інтэграцыя дазваляе атрымліваць аналітычныя зводкі і даныя разам з традыцыйнымі вынікамі пошуку.

Perplexity AI ад Perplexity

Perplexity AI спалучае магчымасці пошукавай сістэмы і чат-бота, выкарыстоўваючы вялікія моўныя мадэлі для генерацыі адказаў. Пашукавік выдае прамыя адказы, а не спіс спасылак: крыніцы можна паглядзець у асобнай укладцы, як у ChatGPT search. На думку многіх экспертаў, пошукавая сістэма Perplexity лепш за ўсё спраўляецца з навінавым кантэнтам з усіх прадстаўленых на рынку мадэляў.

Andi Search

Andi пазіцыянуе сябе як «пошук наступнага пакалення». Пошукавая сістэма паказвае вынік у асноўнай вобласці адказу, а таксама дадатковыя вэб-спасылкі на бакавой панэлі. Можна сартаваць адказы па розных катэгорыях у залежнасці ад запыту. Andi менш гаваркі, чым папулярныя чат-боты, і не падтрымлівае кантэксту наступных запытаў. Сістэм выкарыстоўвае АІ-мадэлі Claude.

Наколькі яны дакладныя?

Гэта галоўнае пытанне пры працы з такімі пашукавікамі. Хоць яны могуць даваць шырокія і прамыя адказы, у адрозненне ад традыцыйных пашукавікоў, аднак даследаванні паказваюць, што дакладнасць і надзейнасць генератыўнага пошуку прымушае жадаць лепшага.

Галюцынацыі. Мадэлі генератыўнага АІ схільныя да «галюцынацыя», калі яны выдаюць інфармацыю, якая здаецца дакладнай, але фактычна няправільная або цалкам сфабрыкаваная. Гэтым жа пакутуюць і генератыўныя пашукавікі, так як выкарыстоўваюць у сваёй працы тыя ж АІ-мадэлі. Скандал з дзіўнымі парадамі AI Overviews (напрыклад, дадаваць клей у соус для піцы або есці камяні) вымусіў Google адкласці на час інтэграцыю функцыі.

Памылкі ў атрыбуцыі. Даследчыкі выявілі, што ў выніках пошуку, згенераваных з дапамогай штучнага інтэлекту, няправільна пазначаныя цытаты і іншая інфармацыя. Часта ChatGPT не можа правільна ідэнтыфікаваць крыніцы цытат, што прыводзіць да дэзынфармацыі: чат-бот прыпісвае цытаты іншым выданням або тым, якія забаранілі доступ да сваіх матэрыялаў. Тое ж самае перыядычна робяць і іншыя чат-боты.

У адказ на крытыку распрацоўшчыкі прызнаюць абмежаванасць сваіх мадэляў і актыўна працуюць над удасканаленнем сваіх сістэм, каб паменшыць колькасць памылак і павысіць надзейнасць пошуку. Тым не менш карыстальнікам варта праяўляць асцярожнасць і пераправяраць важную інфармацыю з некалькіх крыніц, каб забяспечыць яе дакладнасць.

Чаму генератыўны пошук галюцынуе?

Базавыя мадэлі штучнага інтэлекту прызначаныя для генерацыі тэксту на аснове шаблонаў, атрыманых з шырокіх набораў даных. У гэтым палягае загваздка: мадэль не ацэньвае, наколькі інфармацыя факталагічная, а толькі прадказвае паслядоўнасць слоў на аснове назіраных заканамернасцяў. Гэта прыводзіць да стварэння кантэнту, які здаецца праўдападобным, але насамрэч няправільны або цалкам сфабрыкаваны.

Вялікія моўныя мадэлі навучаюцца на велізарных аб’ёмах даных, якія таксама ўтрымліваюць як дакладную, так і ілжывую інфармацыю, а яшчэ розныя прадузятасці і стэрэатыпы. Паколькі мадэлі імітуюць заканамернасці, якія знаходзяць у навучальных даных, яны могуць прайграваць любую хлусню або скажэнні, прысутныя ў гэтых наборах. Выяўленыя заканамернасці могуць уплываць на іншыя запыты, ніяк не звязаныя з папярэднім.

Тэхналогіі, якія павышаюць разнастайнасць у адказах, могуць нават павялічыць верагоднасць галюцынацый, бо ствараюць менш верагодныя паслядоўнасці слоў. Дагэтуль няма вядомых спосабаў праверкі дакладнасці інфармацыі пры генерацыі тэксту: распрацоўшчыкі прызнаюць праблему галюцынацый, але спадзяюцца, што яна стане менш актуальнай з часам пры развіцці АІ-тэхналогій.

Які пошук лепшы: генератыўных або традыцыйны?

Выбар паміж генератыўным і традыцыйным пошукам залежыць ад вашых пераваг.

Традыцыйны пошук заснаваны на падборы ключавых слоў і абумоўлены алгарытмам. Ён выдае ранжыраваны спіс вэб-старонак. Карыстальнікі могуць бачыць крыніцу інфармацыі і ацаніць ейную дакладнасць. Гады ўдасканалення дазволілі традыцыйным пашукавікам падаваць актуальную і дакладную інфармацыю. Google выдаткаваў дзясяткі гадоў на свой пошукавы алгарытм, тады як генератыўнаму пошуку ўсяго толькі некалькі месяцаў.

Аднак у традыцыйнага пошуку ёсць свае відавочныя мінусы. Напрыклад, можа спатрэбіцца прагледзець дзясяткі спасылкі, перш чым знайсці неабходную інфармацыю. Цяпер пошукавая выдача перагружаная SEO-тэкстамі, якія аптымізаваныя для алгарытмаў, але бескарысныя для чытача. Таксама традыцыйны пошук лёгка спраўляецца з кароткімі запытамі, але не здольны даць разгорнуты адказ на складаныя пытанні.

Генератыўны пошук прапаноўвае абагульненыя адказы, пазбаўляючы карыстальніка ад марнавання часу на пошук неабходнай крыніцы. Таксама фармат дыялогу дапамагае ўдакладняць запыт і вывучаць канкрэтную тэму. АІ можа працаваць з комплекснымі пытаннямі, якія патрабуюць разгорнутага, вычарпальнага адказу, а не проста спіса крыніц.

Тым не менш генератыўны пошук дагэтуль схільны да галюцынацый і выдае недакладную інфармацыю, а спасылкі могуць весці зусім на іншыя крыніцы ці нават адсутнічаць. Таксама магчымасць генераваць кантэнт без выразнага ўказання на крыніцы выклікае пытанні аб аўтарскіх правах.

Незалежна ад таго, які варыянт пошуку выглядае эфектыўным, гэта не здымае адказнасці з карыстальніка, якому ў любым выпадку даводзіцца пераправяраць інфармацыю: стоадсоткавай дакладнасці і надзейнасці не можа даць аніводны алгарытм або самая перадавая нейрасетка.