Николай Чикишев world 18 красавіка 2025, 13:10

Сачыць стане прасцей: ChatGPT навучыўся вызначаць лакацыю па фота

Новыя ШІ-мадэлі ад OpenAI o3 і o4-mini могуць аналізаваць выявы і вызначаць месцазнаходжанне на іх. Гэта выклікала вірусны трэнд, калі карыстальнікі спрабуюць вызначыць геалакацыю здымка з дапамогай нейрасетак.

Пакінуць каментарый

Сачыць стане прасцей: ChatGPT навучыўся вызначаць лакацыю па фота

Новыя ШІ-мадэлі ад OpenAI o3 і o4-mini могуць аналізаваць выявы і вызначаць месцазнаходжанне на іх. Гэта выклікала вірусны трэнд, калі карыстальнікі спрабуюць вызначыць геалакацыю здымка з дапамогай нейрасетак.

На гэтым тыдні OpenAI прэзентавала свае найноўшыя AI-мадэлі, o3 і o4-mini, якія валодаюць здольнасцю да разважанняў на падставе загружаных выяваў. На практыцы гэта азначае, што мадэлі могуць кадраваць, паварочваць і маштабаваць фатаграфіі, нават размытыя і скажоныя, дзеля іх дбайнага аналізу.

Гэтыя магчымасці аналізу ў спалучэнні са здольнасцю мадэляў шукаць інфармацыю ў інтэрнэце робяць іх магутным інструментам для вызначэння геалакацыі. Карыстальнікі X хутка заўважылі, што мадэль o3 асабліва добра спраўляецца з вызначэннем гарадоў, славутасцяў, а таксама рэстарацый і бараў па ледзь заўважных візуальных падказках.

The geoguessing power of o3 is a really good sample of its agentic abilities. Between its smart guessing and its ability to zoom into images, to do web searches, and read text, the results can be very freaky.

I stripped location info from the photo & prompted «geoguess this» pic.twitter.com/KaQiXHUvYL
— Ethan Mollick (@emollick) April 17, 2025

Карыстальнікі даюць ChatGPT меню рэстарацый, здымкі раёнаў, фасадаў будынкаў і аўтапартрэты. Пры гэтым многія прапануюць чат-боту ўявіць, што ён гуляе ў GeoGuessr — анлайн-гульню, у якой удзельнікам трэба здагадвацца пра лакацыю па выявам з Google Street View.

this is a fun ChatGPT o3 feature. geoguessr! pic.twitter.com/HrcMIxS8yD
— Jason Barnes (@vyrotek) April 17, 2025

Аднак гэты трэнд уздымае патэнцыйную праблему канфідэнцыйнасці. Нішто не перашкаджае зламысніку зрабіць скрыншот, напрыклад, гісторыі чалавека ў Instagram і выкарыстаць ChatGPT, каб паспрабаваць яго дэананімізаваць.

TechCrunch правёў тэставанне, параўноўваючы навыкі вызначэння месцазнаходжання o3 і больш старой мадэлі GPT-4o, якая не валодае магчымасцямі разважання аб выяве. Дзіўна, але GPT-4o часцей за o3 даваў правільны адказ і рабіў гэта хутчэй.

Прынамсі ў адным выпадку падчас кароткага тэсту o3 атрымалася вызначыць месца, з якім не справіўся GPT-4o. Атрымаўшы выяву фіялетавай галавы насарога на сцяне цьмяна асветленага бара, o3 правільна вызначыў, што гэта месца знаходзіцца ў амерыканскім Вільямсбургу, тады як GPT-4o выказаў здагадку, што гэта паб у Вялікабрытаніі.