Разраб обошёл ограничения Apple и запустил обучение ИИ на чипах M4
Энтузиастам удалось взломать программные лимиты свежих процессоров Apple Silicon. Исследователь под ником @0×0SojalSec сумел обойти ограничения нейронного сопроцессора Apple Neural Engine (ANE) и заставил его локально обучать ИИ-модели, что Apple блокирует на уровне софта.
Энтузиастам удалось взломать программные лимиты свежих процессоров Apple Silicon. Исследователь под ником @0×0SojalSec сумел обойти ограничения нейронного сопроцессора Apple Neural Engine (ANE) и заставил его локально обучать ИИ-модели, что Apple блокирует на уровне софта.
По задумке Apple, нейропроцессор в чипах M4 (а также в процессорах iPhone) должен использоваться исключительно для инференса, то есть для быстрого запуска уже готовых, предобученных нейросетей. По официальным спецификациям, компания заявляет мощность до 38 TOPS.
Однако разработчик методом обратного инжиниринга приватных API смог разблокировать скрытый потенциал чипа — 15,8 TFLOPS чистой вычислительной мощности — и запустил полноценный процесс обучения ИИ, включая обратное распространение ошибки на моделях-трансформерах.
Apple hid 15.8 TFLOPS of raw AI power in every M4 Mac & iPhone.
They only let you use the Neural Engine for inference. Reverse-engineered their private APIs and ran full backpropagation & transformer training directly on the ANE, No CoreML, No Metal, No GPU,
Чтобы заставить железо работать в обход правил, автор проекта отказался от стандартных фреймворков Apple (Core ML и Metal) и написал кастомный язык промежуточных программ — Model Intermediate Language (MIL). Он компилирует граф нейросети напрямую в память чипа ANE.
Основные фишки этого решения:
никаких внешних зависимостей: код написан исключительно на системных фреймворках Apple;
работа только в оперативной памяти: весь процесс (прямой и обратный проход, расчёт градиентов и оптимизатор) идёт в RAM без медленной записи файлов конфигураций на диск. Шаг обучения трансформера на M4 занимает всего 9,3 миллисекунды;
хитрый обход зависаний: если процесс обучения стопорится из-за ограничений системы, программа автоматически сохраняет чек-поинт и мгновенно перезапускается через системную команду exec ().
Как отмечает Gizmochina, это доказывает, что в «железо» Apple заложено гораздо больше потенциала, чем компания готова дать пользователям. Проект уже выложили в открытый доступ на GitHub. Если технология масштабируется, обычные Mac, iPad и даже iPhone могут превратиться в мощные локальные станции для обучения небольших ИИ-моделей, избавив разработчиков от необходимости арендовать дорогие облачные сервера.
Взлом подсвечивает давний конфликт между Apple и комьюнити разработчиков. Компания традиционно продвигает концепцию «закрытого сада», жёстко контролируя, как используется её «железо». Но в эпоху ИИ и борьбы за каждый токен и терафлопс мощности, любые искусственные ограничения вызывают протест. Полноценное ИИ-обучение на потребительских Mac может пошатнуть монополию Nvidia на рынке инструментов для разработчиков.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.