Ai2-ն՝ Սիեթլում գտնվող ոչ առևտրային AI հետազոտական ինստիտուտը, թողարկել է մի մոդել, որը, ըստ նրանց, գերազանցում է չինական AI ընկերության DeepSeek-ի առաջատար համակարգերից մեկին՝ DeepSeek V3-ին:
Ai2-ի Tulu 3 405B մոդելը, ըստ ինստիտուտի ներքին փորձարկումների, որոշ AI թեստերում նաև գերազանցում է OpenAI-ի GPT-4o-ին: Ավելին, ի տարբերություն GPT-4o-ի (և նույնիսկ DeepSeek V3-ի), Tulu 3 405B-ն բաց կոդով է, ինչը նշանակում է, որ այն վերարտադրելու համար անհրաժեշտ բոլոր բաղադրիչները հասանելի են անվճար և թույլատրելի արտոնագրերով:
Ai2-ի ներկայացուցիչը TechCrunch-ին ասել է, որ լաբորատորիան կարծում է, որ Tulu 3 405B-ն «ընդգծում է ԱՄՆ-ի ներուժը՝ լինելու գլոբալ առաջատար գերազանց գեներատիվ AI մոդելների մշակման գործում»:
«Այս հաջողությունը կարևոր պահ է բաց AI-ի ապագայի համար, որը հաստատում է ԱՄՆ-ի դերը որպես մրցունակ, բաց կոդով մոդելների առաջատար», – ասել է ներկայացուցիչը: «Այս թողարկմամբ Ai2-ն ներկայացնում է DeepSeek-ի մոդելների հզոր ամերիկյան այլընտրանք, որը ցույց է տալիս, որ ԱՄՆ-ը կարող է առաջատար դիրք գրավել մրցունակ, բաց կոդով AI-ի ոլորտում՝ առանց տեխնոլոգիական հսկաների կախվածության»:
Tulu 3 405B-ն բավականին մեծ մոդել է: Ըստ Ai2-ի, այն պարունակում է 405 միլիարդ պարամետր և այն ուսուցանելու համար անհրաժեշտ է եղել 256 GPU-ի զուգահեռ աշխատանք: Պարամետրերը մոտավորապես համապատասխանում են մոդելի խնդիրների լուծման ունակություններին, և ավելի շատ պարամետրեր ունեցող մոդելները, որպես կանոն, ավելի լավ են աշխատում, քան պակաս պարամետրեր ունեցողները:
Ai2-ն պնդում է, որ PopQA թեստում, որը բաղկացած է Վիքիպեդիայից վերցված 14,000 մասնագիտացված գիտելիքների հարցերից, Tulu 3 405B-ն գերազանցել է ոչ միայն DeepSeek V3-ին և GPT-4o-ին, այլև Meta-ի Llama 3.1 405B մոդելին: Tulu 3 405B-ն նաև ամենաբարձր արդյունքն է ցուցաբերել GSM8K թեստում, որը պարունակում է տարրական դպրոցի մակարդակի մաթեմատիկական խնդիրներ:
Tulu 3 405B-ն կարելի է փորձարկել Ai2-ի chatbot վեբ հավելվածի միջոցով, իսկ մոդելի ուսուցման կոդը հասանելի է GitHub-ում և Hugging Face AI հարթակում: Փորձեք այն, մինչև հաջորդ գերազանց մոդելը կհայտնվի: