Meta Platforms lansează un model AI revoluționar pentru roboți și mașini autonome
Meta Platforms a prezentat un nou „model AI al lumii”, destinat să îmbunătățească înțelegerea mediului tridimensional și a mișcărilor obiectelor fizice de către roboți și vehicule autonome. Acest model open-source, denumit V-JEPA 2, este capabil să înțeleagă, să prezică și să planifice în lumea fizică.
Modelul V-JEPA 2 își propune să reproducă logica lumii reale, creând o simulare internă a realității care permite inteligenței artificiale să învețe, să planifice și să ia decizii într-o manieră similară cu cea umană. De exemplu, V-JEPA 2 recunoaște că o minge care cade de pe o masă va atinge pământul sau că un obiect ascuns privirii nu dispare pur și simplu.
Inteligența artificială reprezintă o prioritate pentru CEO-ul Meta, Mark Zuckerberg, având în vedere competiția acerbă cu OpenAI, Microsoft și Google. Conform unor surse, Meta intenționează să investească 14 miliarde de dolari în firma de AI Scale AI și să-l angajeze pe CEO-ul acesteia, Alexandr Wang, pentru a-și consolida strategia de AI.
Modelul V-JEPA 2 este promovat ca un instrument esențial pentru roboți de livrare și mașini autonome, care trebuie să navigheze în lumea reală în timp real. Spre deosebire de modelele tradiționale care folosesc cantități mari de date etichetate sau filmări video, V-JEPA 2 raționează într-un spațiu simplificat „latent”, înțelegând cum se mișcă și interacționează obiectele.
Yann LeCunn, șeful AI de la Meta, a declarat că „a permite mașinilor să înțeleagă lumea fizică este foarte diferit de a le face să înțeleagă limbajul”. El a adăugat că „un model al lumii este ca un geamăn digital abstract al realității, pe care AI-ul îl poate consulta pentru a înțelege lumea și a prezice consecințele acțiunilor sale, putând astfel să planifice un curs de acțiune pentru a îndeplini o sarcină dată”.
Modelele AI de tip „world model” au atras tot mai mult interes în comunitatea de cercetare, deoarece specialiștii caută să depășească modelele lingvistice care stau la baza aplicațiilor generative precum ChatGPT de la OpenAI și Gemini de la Google. În septembrie anul trecut, cercetătoarea AI Fei-Fei Li a strâns 230 de milioane de dolari pentru startup-ul World Labs, care își propune să creeze „modele mari ale lumii” pentru o mai bună înțelegere a structurii mediului fizic. De asemenea, divizia DeepMind a Google dezvoltă propriul model numit Genie, care poate simula jocuri și medii 3D în timp real.
