OpenAI dezvăluie două noi modele de procesare a limbajului!
Producătorul ChatGPT a lansat două modele de inteligență artificială deschise, primele după o pauză de mai bine de cinci ani în care au fost lansate doar modele închise. Cel mai puternic dintre cele două modele, gpt-oss-120b, rulează pe un sistem cu o singură placă video Nvidia, în timp ce gpt-oss-20b poate funcționa pe un laptop cu 16GB de memorie RAM.
Conform testelor sintetice prezentate, cele două modele au o performanță situată sub celelalte modele ale companiei, dar se află deasupra altor modele deschise disponibile pe piață. Totuși, deschiderea acestor noi modele este discutabilă, deoarece acestea nu pot îndeplini toate sarcinile pe care le pot realiza celelalte modele. Când se confruntă cu sarcini pe care nu le pot rezolva, modelele deschise au capacitatea de a se conecta, prin cloud, la modelele mai avansate ale companiei.
Un alt aspect important este că OpenAI nu a făcut publice sursele datelor pe care au fost antrenate noile modele, contrar practicii obișnuite pentru modelele de AI cu adevărat deschise. În plus, modelele noi se confruntă cu problema halucinațiilor, având o rată de halucinații de 49% pentru gpt-oss-120b și 53% pentru gpt-oss-20b, ceea ce înseamnă că utilizatorii nu pot avea încredere în jumătate din răspunsurile generate.
Noile modele OpenAI sunt disponibile pentru descărcare pe Hugging Face.
