Технологията помага на самоуправляващите се автомобили да се учат от собствените „спомени“

Изследователи от университета Корнел са разработили начин да помогнат на автономните превозни средства да създават „спомени“ от предишни преживявания и да ги използват в бъдеща навигация, особено при неблагоприятни метеорологични условия, когато автомобилът не може безопасно да разчита на своите сензори.

Автомобилите, използващи изкуствени невронни мрежи, нямат спомен от миналото и са в постоянно състояние да виждат света за първи път – без значение колко пъти са карали по определен път преди.

Изследователите са създали три едновременни статии с цел преодоляване на това ограничение. Два са представени на докладите на конференцията IEEE за компютърно зрение и разпознаване на образи (CVPR 2022), която се провежда на 19-24 юни в Ню Орлиънс.

“Фундаменталният въпрос е, можем ли да се поучим от многократните обиколки?” каза старшият автор Килиан Вайнбергер, професор по компютърни науки. „Например, колата може да сбърка дървото със странна форма за пешеходец, когато лазерният скенер го забележи от разстояние, но след като е достатъчно близо, категорията на обекта ще стане ясна. Така че, вторият път, когато минавате покрай същото дърво, дори в мъгла или сняг, ще се надявате, че колата се е научила да го разпознава правилно.

Оглавявана от докторант Карлос Диас-Руис, групата състави набор от данни, като кара кола, оборудвана със сензори за откриване и обхват на светлината LiDAR, многократно по 15-километрова верига в и около Итака, 40 пъти за период от 18 месеца. Обиколките улавят различни среди (магистрала, град, кампус), метеорологични условия (слънчево, дъждовно, сняг) и часове от деня. Този получен набор от данни има повече от 600 000 сцени.

„Това умишлено излага едно от ключовите предизвикателства в самоуправляващите се автомобили: лошите метеорологични условия“, каза Диас-Руис. “Ако улицата е покрита със сняг, хората могат да разчитат на спомени, но без спомени невронната мрежа е в сериозно неблагоприятно положение.”

HINDSIGHT е подход, който използва невронни мрежи за изчисляване на дескриптори на обекти, докато колата ги минава. След това компресира тези описания, които групата нарече характеристики на SQuaSH? (Пространствено-квантизирана разредена история) и ги съхранява на виртуална карта, като „памет“, съхранявана в човешкия мозък.

Следващият път, когато самоуправляващият се автомобил преминава през същото място, той може да потърси локалната база данни на SQuaSH на всяка точка на LiDAR по маршрута и да „запомни“ какво е научил последния път. Базата данни непрекъснато се актуализира и споделя между превозните средства, като по този начин се обогатява наличната информация за извършване на разпознаване.

“Тази информация може да бъде добавена като характеристики към всеки базиран на LiDAR 3D детектор на обекти;” каза докторантът Юронг Ю. „И детекторът, и представянето на SQuaSH могат да бъдат обучени съвместно без допълнителен надзор или човешка анотация, което е време и трудоемко.“

HINDSIGHT е предшественик на допълнителни изследвания, които екипът провежда, MODEST (Откриване на мобилни обекти с ефимерност и самообучение), което би стигнало още по-далеч, позволявайки на колата да научи целия тръбопровод на възприятието от нулата.

Докато HINDSIGHT все още предполага, че изкуствената невронна мрежа вече е обучена да открива обекти и я допълва със способността да създава спомени, MODEST приема, че изкуствената невронна мрежа в превозното средство никога не е била изложена на никакви обекти или улици изобщо. Чрез множество обиколки на един и същ маршрут той може да научи кои части от околната среда са неподвижни и кои са движещи се обекти. Бавно се научава какво представлява другите участници в трафика и какво е безопасно да се игнорира.

След това алгоритъмът може да открие тези обекти надеждно – дори на пътища, които не са били част от първоначалните многократни обиколки.

Изследователите се надяват, че подходите биха могли драстично да намалят разходите за разработване на автономни превозни средства (които в момента все още разчитат в голяма степен на скъпи анотирани данни от хора) и да направят такива превозни средства по-ефективни, като се научат да навигират в местата, в които се използват най-много.

/ Публично съобщение. Този материал от изходната организация/автор(и) може да бъде с характер на момент, редактиран за яснота, стил и дължина. Изразените възгледи и мнения са на автора(ите). Вижте изцяло тук.