Дапамажыце dev.by 🤍
Падтрымаць

Аўтар вайб-кодынгу прадставіў nanochat — праект для навучання LLM за 4 гадзіны і $100

Сузаснавальнік OpenAI і аўтар тэрміна «вайб-кодынг» Андрэй Карпаты прадставіў свой новы опенсорсны праект nanochat — ён дазваляе стварыць і навучыць моўную мадэль літаральна «з нуля».

1 каментарый

Сузаснавальнік OpenAI і аўтар тэрміна «вайб-кодынг» Андрэй Карпаты прадставіў свой новы опенсорсны праект nanochat — ён дазваляе стварыць і навучыць моўную мадэль літаральна «з нуля».

«Проста запускаеце воблачны GPU, выконваеце адзін скрыпт і ўжо праз 4 гадзіны можаце размаўляць з уласнай LLM у вэб-інтэрфейсе, як у ChatGPT», — напісаў Карпаты ў X.

Рэпазіторый nanochat змяшчае каля 8 тысяч радкоў кода. У адрозненне ад яго мінулага праекта nanoGPT, які засяроджаны толькі на папярэднім навучанні, новы ахоплівае ўвесь цыкл стварэння LLM, уключаючы навучанне такенізатара на Rust, папярэдняе навучанне мадэлі-трансформера на датасэце FineWeb, данавучанне на дыялогах і задачах з выбарам адказу, файнцьюнінг, інферэнс і збор метрык. Карыстальнік можа ўзаемадзейнічаць з мадэллю праз камандны радок або вэб-інтэрфейс, а сістэма аўтаматычна стварае справаздачу аб прадукцыйнасці.

Кошт і маштаб можна наладжваць: базавая версія, здольная весці дыялог, запатрабуе $100 і 4 гадзіны трэніроўкі на 8×H100 GPU. Пасля 12 гадзін трэніроўкі мадэль перавышае бенчмарк GPT-2 CORE, а за $1000 і 42 гадзіны можна атрымаць версію, якая вырашае простыя задачы па матэматыцы і праграмаванню.

Карпаты хоча стварыць «моцны, мінімалістычны і максімальна чытальны» базавы стэк, які можна будзе выкарыстоўваць як аснову для навучання і даследаванняў. nanochat можа вырасці ў паўнавартасны даследчы інструмент або бенчмарк, аналагічны nanoGPT, і стаць новым пунктам уваходу ў свет LLM для распрацоўшчыкаў і студэнтаў з усяго свету.

Аўтар вайб-кодынгу: софт перажывае пераломны момант
Аўтар вайб-кодынгу: софт перажывае пераломны момант
Па тэме
Аўтар вайб-кодынгу: софт перажывае пераломны момант
Чытайце таксама
«Яна выратавала мне жыццё»: OpenAI адключае GPT-4o — карыстальнікі ўзбунтаваліся
«Яна выратавала мне жыццё»: OpenAI адключае GPT-4o — карыстальнікі ўзбунтаваліся
«Яна выратавала мне жыццё»: OpenAI адключае GPT-4o — карыстальнікі ўзбунтаваліся
Кампаніі рызыкуюць стаць «машынамі для выгарання» з-за ШІ — даследаванне
Кампаніі рызыкуюць стаць «машынамі для выгарання» з-за ШІ — даследаванне
Кампаніі рызыкуюць стаць «машынамі для выгарання» з-за ШІ — даследаванне
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
«Мір у небяспецы»: кіраўнік каманды бяспекі Anthropic звольніўся і пакінуў загадкавы ліст
Стваральнік OpenClaw не фанат агульнага ШІ. Кажа, будучыня за спецыялізаваным
Стваральнік OpenClaw не фанат агульнага ШІ. Кажа, будучыня за спецыялізаваным
Стваральнік OpenClaw не фанат агульнага ШІ. Кажа, будучыня за спецыялізаваным

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

table
table Table в Database
-1

АААСТАНАВИТЕСЬ!!!!!111