Изследователи от лабораторията GEAR на Nvidia съвместно с различни университети разработиха платформата ENPIRE, която дава възможност на AI агентите автономно да обучават роботите да изпълняват сложни физически задачи без човешка намеса. При тестове на AI агенти на OpenAI, Anthropic и Moonshot системата постига 99% успеваемост при задачи, вариращи от преместване на блок до инсталиране на графичен процесор в дънна платка. Nvidia ще предостави отворения код на ENPIRE, така че всеки да може да разгърне своя лаборатория за автономни роботи.
ENPIRE се състои от четири модула. Първият отговаря за автоматичното рестартиране и валидиране на задачите, вторият усъвършенства правилата за поведение на роботите, третият оценява тези правила върху множество физически роботи, работещи паралелно, а четвъртият отстранява грешките – анализира логовете за грешки, обработва научните трудове и подобрява алгоритмичния код. Заедно тези модули образуват затворен цикъл на самоусъвършенстване, който не изисква човешка намеса.
Системата е тествана с три AI агента: Codex от OpenAI, базиран на GPT-5.5, Claude Code от Anthropic, базиран на Opus 4.7, и Kimi Code от Moonshot AI, базиран на Kimi K2.6. Всеки екип от агенти самостоятелно разработва алгоритмите за обучение на роботите, тества ги в реални експерименти и запазва само онези промени, които подобряват резултата.
„Част от лабораторията ни вече неуморно се самоусъвършенства през нощта, а на сутринта само четем докладите“,
пише Джим Фан, директор на отдела за изкуствен интелект в Nvidia.В резултат на това AI агентите постигнаха 99% успеваемост в няколко задачи за манипулиране: преместване на Т-образен блок в дадена позиция, подреждане на болтчета в кутия, връзване и рязане на пластмасови връзки и поставяне на графичен процесор в гнездото на дънната платка и след това изваждането му. При задачата с болтчетата и други агентите постигнаха почти 100% успеваемост по-бързо от най-добрия метод, разработен от човешки изследователи.
Експериментите показаха също, че размерът на екипа от агенти пряко влияе върху скоростта на обучението. Група от осем агенти изпълни задачата за преместване на блок за два часа, екип от четири агента – за три часа, а на един агент бяха необходими почти пет часа. Паралелната работа на няколко агента позволява по-бързо изследване на различните подходи и избор на най-добрите от тях.
Изследователите документират и ограниченията. Роботите често бездействали, докато агентите били заети с четене на логовете, писането на код или с изчакване на отговора на езиковия модел. Големите екипи от агенти прекарват непропорционално много време в обобщаване на идеите си, вместо в активна работа с роботите. Освен това агентите невинаги използват ефективно наличните изчислителни ресурси, когато провеждат паралелни сесии за обучение.
Отделен фактор са разходите. Колкото повече агенти участват, толкова повече токени са им необходими. Това е особено актуално, тъй като разработчиците на изкуствен интелект, включително Anthropic, обмислят промени в цените, които ще увеличат разходите за използване на такива системи.
Въпреки това екипът възнамерява да отвори изходния код на ENPIRE за всеки, който се интересува.
Новата разработка се вписва в стратегията на Nvidia за физическия AI. В края на месец май компанията обяви партньорство с китайската компания за роботика Unitree за създаване на референтен хуманоиден робот за изследователските лаборатории. А в началото на юни главният изпълнителен директор на Nvidia Дженсен Хуанг се срещна с ръководството на Hyundai Motor, компанията майка на Boston Dynamics, за да обсъдят масовото производство на роботи с изкуствен интелект.