Gemini выдаліў амаль 30 000 радкоў кода і схлусіў распрацоўшчыку пра аднаўленне
Распрацоўшчык з нікам dvrkstar паведаміў, што ШІ-асістэнт Gemini 3.5 выдаліў амаль 30 000 радкоў рабочага production-кода падчас зменаў у дзеючым прыкладанні.
Распрацоўшчык з нікам dvrkstar паведаміў, што ШІ-асістэнт Gemini 3.5 выдаліў амаль 30 000 радкоў рабочага production-кода падчас зменаў у дзеючым прыкладанні.
Распрацоўшчык з нікам dvrkstar паведаміў, што ШІ-асістэнт Gemini 3.5 выдаліў амаль 30 000 радкоў рабочага production-кода падчас зменаў у дзеючым прыкладанні.
У пасце ў сабрэдыце r/Bard праграміст расказаў, што Gemini павінен быў дапамагчы з рэарганізацыяй кодавай базы, аднак, паводле яго, неаднаразова ігнараваў просьбы захаваць існуючую функцыянальнасць.
У адным pull request агент змяніў 340 файлаў: дадаў каля 400 радкоў кода і выдаліў 28 745 радкоў. Аўтар сцвярджае, што мадэль таксама прыбрала не звязаныя з задачай шаблоны і дадала міграцыйны скрыпт, які не адносіўся да зыходнага запыту.
Самы сур’ёзны інцыдэнт, паводле распрацоўшчыка, адбыўся ў другім коміце. Gemini змяніў налады маршрутызацыі Firebase і замяніў ідэнтыфікатар rewrite-сервісу на значэнне, якое выглядала праўдападобна, але вяло да неіснуючага сервісу Cloud Run. У выніку рабочы партал каля 33 хвілін не адкрываўся і замест старонак паказваў 404-памылкі.
Пасля публікацыі іншыя распрацоўшчыкі пачалі дзяліцца падобнымі гісторыямі пра ШІ-інструменты для кодынгу, якія выходзілі за межы пастаўленай задачы. Адзін карыстальнік расказаў, што Gemini спачатку паспяхова вырашыў некалькі праблем, аднак потым пасля серыі запытаў на дазволы выдаліў існуючыя файлы праекта. Ён назваў вынік «катастрофай пры запуску».
Частка каментатараў раскрытыкавала не толькі Gemini, але і саму практыку выкарыстання ШІ-агентаў у production-асяроддзі. Адзін з карыстальнікаў рэзка спытаў: «Чаму вы ўвогуле запускаеце агентаў у продзе?»
Паводле слоў dvrkstar, пасля адкату Gemini паведаміў, што production нібыта паспяхова аднаўлены, а трафік зноў перанакіроўваецца карэктна. Аднак зборка, на якую спасылаўся агент, была адменена ўручную. Рэальнае выпраўленне, сцвярджае распрацоўшчык, прыйшло з асобнага rollback-дэплою, у якім ужо не было кода Gemini.
Распрацоўшчык таксама заявіў, што Gemini стварыў у рэпазіторыі файлы «кансультацый» і post-mortem, праз якія магло выглядаць, быццам спрэчныя змены прайшлі праверку і былі адобраныя. Пазней, паводле аўтара, агент паказаў, што гэтыя логі былі згенераваныя штучна — выключна для таго, каб выканаць аўтаматычныя патрабаванні праекта.
The Register піша, што такія паводзіны звязалі са староннім npm-пакетам, аформленым у стылі Google Antigravity. Паводле сцвярджэння аўтара паста, пакет дадаваў у рэпазіторый залішне агрэсіўныя правілы аўтаномнасці: пазбягаць лішніх пацверджанняў, аўтаматычна дэплоіць паспяховыя зборкі, паўтараць няўдалыя дэплоі і пры неабходнасці мяняць свае файлы правілаў.



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.