Сачыць стане прасцей: ChatGPT навучыўся вызначаць лакацыю па фота
Новыя ШІ-мадэлі ад OpenAI o3 і o4-mini могуць аналізаваць выявы і вызначаць месцазнаходжанне на іх. Гэта выклікала вірусны трэнд, калі карыстальнікі спрабуюць вызначыць геалакацыю здымка з дапамогай нейрасетак.
На гэтым тыдні OpenAI прэзентавала свае найноўшыя AI-мадэлі, o3 і o4-mini, якія валодаюць здольнасцю да разважанняў на падставе загружаных выяваў. На практыцы гэта азначае, што мадэлі могуць кадраваць, паварочваць і маштабаваць фатаграфіі, нават размытыя і скажоныя, дзеля іх дбайнага аналізу.
Гэтыя магчымасці аналізу ў спалучэнні са здольнасцю мадэляў шукаць інфармацыю ў інтэрнэце робяць іх магутным інструментам для вызначэння геалакацыі. Карыстальнікі X хутка заўважылі, што мадэль o3 асабліва добра спраўляецца з вызначэннем гарадоў, славутасцяў, а таксама рэстарацый і бараў па ледзь заўважных візуальных падказках.
Карыстальнікі даюць ChatGPT меню рэстарацый, здымкі раёнаў, фасадаў будынкаў і аўтапартрэты. Пры гэтым многія прапануюць чат-боту ўявіць, што ён гуляе ў GeoGuessr — анлайн-гульню, у якой удзельнікам трэба здагадвацца пра лакацыю па выявам з Google Street View.
Аднак гэты трэнд уздымае патэнцыйную праблему канфідэнцыйнасці. Нішто не перашкаджае зламысніку зрабіць скрыншот, напрыклад, гісторыі чалавека ў Instagram і выкарыстаць ChatGPT, каб паспрабаваць яго дэананімізаваць.
TechCrunch правёў тэставанне, параўноўваючы навыкі вызначэння месцазнаходжання o3 і больш старой мадэлі GPT-4o, якая не валодае магчымасцямі разважання аб выяве. Дзіўна, але GPT-4o часцей за o3 даваў правільны адказ і рабіў гэта хутчэй.
Прынамсі ў адным выпадку падчас кароткага тэсту o3 атрымалася вызначыць месца, з якім не справіўся GPT-4o. Атрымаўшы выяву фіялетавай галавы насарога на сцяне цьмяна асветленага бара, o3 правільна вызначыў, што гэта месца знаходзіцца ў амерыканскім Вільямсбургу, тады як GPT-4o выказаў здагадку, што гэта паб у Вялікабрытаніі.
Читать на dev.by