Baidu излиза на сцената на компютърното зрение

Китайският технологичен гигант Baidu излиза на сцената на машинното обучение със собствена технология за разпознаване на изображения от компютър, навлизайки в борба с Google в тази сфера. Според Baidu, разработената от тях технология е по-съвършена от всяка подобна технология за изкуствен интелект, която е създадена досега.За да успее на попрището на машинното визуално разпознаване, създателят на най-голямата китайска търсачка използва собствен супер компютър. Той представлява обединен клъстър от 36 Линукс сървъра, всеки от тях подпомаган два шест-ядрени процесора Intel Xeon E5-2620 с работна честота от 2.5Ghz. В основата на суперкомпютъра и възможността му за сканиране на изображения стоят четири графични процесора Nvidia Tesla K40m, интегрирани във всяка система, което дава като резултат възможността за извършването на 617 трилиона операции с плаваща точка в секунда. Това е с 20% по-голяма изчислителна мощ от тази, от която се възползват специалистите на Националното управление на океанските и атмосферни изследвания на САЩ (US National Oceanic and Atmospheric Administration, NOAA). Андрю Нг, главен учен към Baidu и бивш служител на Google, обяснява, че крайната цел на инвестицията в областта на дълбочинното обучение (deep learning) постигането на по-добри резултати в качеството на обработваните изображения за целите на изследването и тестовете. Всъщност суперкомпютърът на Baidu е изграден единствено за целите на тестване на модела, обястява той пред Bloomberg. В изследването на Baidu (pdf) се обяснява, че използването на изображения с резолюция 256х256 пиксела, който най-често се използва за тестване на модели в областта на компютърното зрение (computer vision), често води до ситуация, в която по-малките обекти губят твърде много от резолюцията си при обработка на изображенията. Увеличаване на нивото на детайлност запазва по-голяма част от информацията и по този начин по-голям успех във вярното разпознаване на обектите.От Baidu споделят, че използването на изображения с по-висока резолюция е способствало за достигането на нива за грешка от 5.98% в теста на ImageNet, което поставя технологията на китайците 0.7% под рекорда на Google или още по-близко от нивото за грешка при разпознаването на обект, което допуска човешкото око - 5.1%.

Прегледи	190
Коментари	0
Добавена на	18 Ян 2015
Източник	Kaldata