DeepMind представи нова парадигма в машинното обучение

DeepMind      DeepMind, дъщерната компания на Google, публикува научна статия за новата парадигма в машинното обучение Scheduled Auxiliary Control или SAC-X (планиран допълнителен контрол). Учените създадоха модел, който от нулата се учи самостоятелно да изпълнява поставените задачи при незначителен обем входни данни.

Алгоритъмът бе тестван чрез компютърни симулации, а след това с реални хардуер и оборудване.

Първата основна задача, поставена пред новия алгоритъм е подреждането на кубчета в кутия. На пръв поглед, задачата не изглежда сложна, но за нейното решаване изкуственият интелект трябва да притежава ключови зрително-моторни умения и навици – приближаване до обекта, хващане, повдигане, отваряне на кутията и поставяне на предметите в нея.

Специфичното в тази задача е, че изкуственият интелект трябва самостоятелно да се научи да координира деветте стави на механичната ръка, за да изпълни правилно всички действия.

Парадигмата SAC-X се базира на идеята, че за да изпълнява сложни задачи, изкуственият интелект първоначално трябва да изследва малката достъпна за него област и да овладее базовите навици. Освен тази основна задача, ИИ получава и няколко допълнителни, които поощряват изследването на пространството, достъпно за сензорите. Например, да се активират тактилните сензори на пръстите, да се увеличи силата на китката, да се увеличи до максимум ъгъла на ставата, приближаване до обекта за постигане на комфортна зона на видимост и други.

Допълнителните междинни цели значително увеличават шансовете за разбиране и изпълнение на по-сложни задачи. Постигането на всяка една от тези задачи се награждава чрез специален сигнал, който в този случай означава възнаграждение и прекратяване на работата по конкретната задача или подзадача.

DeepMind

Новият ИИ самостоятелно избира следващата си цел. За вземането на това решение помага модулът за планиране, който по време на тренировките и самообучението самостоятелно се усъвършенства. С помощта на този модул бе постигната максимална ефективност на изпълнение на задачите при минимум входни данни.

Научната работа относно новата ИИ парадигма Scheduled Auxiliary Control бе публикувана в arxiv.org на 28 февруари тази година.

Коментари
Все още няма коментари
Статистика
Прегледи 69
Коментари 0
Рейтинг
Добавена на03 Март 2018
ИзточникKaldata

Тагове
DeepMind