Робот се самообучава наблюдавайли човек как управлява автомобил
В лабораторията за проучване на изследователска армия, част от американската армия, и съвместно с университета в Тексас в гр.Остин, изследователите създадоха алгоритъм, който позволява на автономно наземно превозно средство да подобри съществуващите си навигационни роботизирани системи, като наблюдава човешко шофиране. Екипът изпробва своя подход – наречен адаптивен параметър за планиране на обучение от демонстрация, или APPLD – на един от експерименталните автономни роботизирани наземни машини на армията.
„Използвайки подходи като APPLD, настоящите войници в съществуващите учебни съоръжения ще могат да допринесат за подобрения в автономните роботизирани системи, просто като експлоатират своите превозни средства както обикновено“, заяви армейският изследовател д-р Гарет Уорнел.
Вместо да замества изцяло класическата система и тепърва да се създава нов код, APPLD се научава как да надстрои съществуващата система, за да се държи по-скоро като човешко поведение по време на шофиране, независимо от терена.
Д-р Ъорнел добавя „Например, когато се намираше в тесен коридор, човешкият водач се забави и внимателно шофира. След като наблюдава това поведение, роботизираната автономна система се научи също да намалява максималната си скорост и да увеличава изчислителния си потенциал в подобни среди. Това в крайна сметка позволи на автомобила успешно придвижване в тесни коридори, където преди това робота се е провалил слагайки приоритет на бързината. “
Експериментите на екипа показаха, че след тренировка APPLD роботизираната системата е в състояние да навигира в тестовите среди по-бързо и с по-малко повреди, отколкото при класическата система. Освен това, обучената APPLD роботизирана система често навигира в околната среда по-бързо от човека, който я е тренирал първоначално, т.е. роботът изпреварва учителят си.
„Сегашните автономни роботизирани навигационни системи обикновено трябва да бъдат пренастроени на ръка за всяка нова среда на разполагане“, казва армейският изследовател д-р Джонатан Финк. „Този процес е изключително труден – трябва да се извърши от човек с широко обучение в робототехниката и изисква много опити и грешки, докато не бъдат намерени правилните настройки на системата. За разлика от тях APPLD настройва системата автоматично, като гледа човек управлявайте системата – нещо, което всеки може да направи, ако има опит с контролер на видеоигри. По време на внедряването, APPLD също позволява на системата да се пренастрои в реално време, докато се променя средата. „