Виртуалният гръбначен мозък непрекъснато се оптимизира – ScienceDaily

Новороденото жирафче или жребче трябва да се научи да ходи на краката си възможно най-бързо, за да избегне хищниците. Животните се раждат с мрежи за мускулна координация, разположени в гръбначния им мозък. Въпреки това, научаването на точната координация на мускулите и сухожилията на краката отнема известно време. Първоначално малките животни разчитат в голяма степен на свързани рефлекси на гръбначния мозък. Макар и малко по-основни, рефлексите за двигателен контрол помагат на животното да избегне падане и нараняване по време на първите си опити за ходене. Трябва да се практикува следният, по-напреднал и прецизен контрол на мускулите, докато в крайна сметка нервната система се адаптира добре към мускулите и сухожилията на краката на младото животно. Край на неконтролираното препъване – младото животно вече може да се справи с възрастните.

Изследователи от Института Макс Планк за интелигентни системи (MPI-IS) в Щутгарт проведоха проучване, за да разберат как животните се учат да ходят и да се учат от препъване. Те построиха четирикрак робот с размерите на куче, който им помогна да разберат подробностите.

„Като инженери и роботици, ние потърсихме отговора, като изградихме робот, който има рефлекси точно като животно и се учи от грешките“, казва Феликс Руперт, бивш докторант в изследователската група за динамично движение в MPI-IS. „Ако едно животно се спъва, това грешка ли е? Не, ако се случи веднъж. Но ако се спъва често, това ни дава мярка за това колко добре ходи роботът.“

Феликс Руперт е първият автор на “Изучаване на пластично съпоставяне на динамиката на робота в централни генератори на шаблони със затворен контур”, който ще бъде публикуван на 18 юли 2022 г. в списанието Nature Machine Intelligence.

Алгоритъмът за обучение оптимизира виртуалния гръбначен мозък

След като се научи да ходи само за един час, роботът на Ruppert използва добре сложната си механика на краката. Байесов алгоритъм за оптимизация ръководи обучението: измерената информация от сензора за крака се съпоставя с целевите данни от моделирания виртуален гръбначен мозък, работещ като програма в компютъра на робота. Роботът се научава да ходи, като непрекъснато сравнява изпратената и очакваната сензорна информация, изпълнява рефлексни цикли и адаптира своите модели за управление на двигателя.

Алгоритъмът за обучение адаптира контролните параметри на централен генератор на шаблони (CPG). При хора и животни тези централни генератори на модели са мрежи от неврони в гръбначния мозък, които произвеждат периодични мускулни контракции без вход от мозъка. Централните мрежи за генериране на шаблони подпомагат генерирането на ритмични задачи като ходене, мигане или храносмилане. Освен това рефлексите са неволни действия за контрол на двигателя, задействани от твърдо кодирани невронни пътища, които свързват сензори в крака с гръбначния мозък.

Докато младото животно ходи по идеално равна повърхност, CPG могат да бъдат достатъчни, за да контролират сигналите за движение от гръбначния мозък. Малка неравност на земята обаче променя походката. Рефлексите се задействат и коригират моделите на движение, за да предпазят животното от падане. Тези моментни промени в сигналите за движение са обратими или „еластични“ и моделите на движение се връщат към първоначалната си конфигурация след смущението. Но ако животното не спре да се спъва в много цикли на движение – въпреки активните рефлекси – тогава моделите на движение трябва да бъдат научени отново и направени “пластични”, т.е. необратими. При новороденото животно CPG първоначално все още не са настроени достатъчно добре и животното се препъва, както на равен, така и на неравен терен. Но животното бързо научава как неговите CPG и рефлекси контролират мускулите и сухожилията на краката.

Същото важи и за кучето-робот с размерите на лабрадор на име „Морти“. Нещо повече, роботът оптимизира своите модели на движение по-бързо от животно, за около един час. CPG на Morti се симулира на малък и лек компютър, който контролира движението на краката на робота. Този виртуален гръбначен мозък е поставен на гърба на четириногия робот, където би била главата. По време на часа, който е необходим на робота да върви гладко, сензорните данни от краката на робота се сравняват непрекъснато с очакваното докосване, предвидено от CPG на робота. Ако роботът се спъне, алгоритъмът за обучение променя колко далеч краката се люлеят напред-назад, колко бързо се люлеят краката и колко дълго е кракът на земята. Коригираното движение също влияе върху това колко добре роботът може да използва своята съвместима механика на краката. По време на процеса на обучение CPG изпраща адаптирани моторни сигнали, така че роботът отсега нататък да се спъва по-малко и да оптимизира ходенето си. В тази рамка виртуалният гръбначен мозък няма изрични познания за дизайна на краката на робота, неговите двигатели и пружини. Тъй като не знае нищо за физиката на машината, липсва „модел“ на робот.

„Нашият робот практически е „роден“, без да знае нищо за анатомията на краката си или как работят“, обяснява Руперт. „CPG прилича на вградена автоматична интелигентност за ходене, която природата предоставя и която ние сме прехвърлили на робота. Компютърът произвежда сигнали, които управляват двигателите на краката, а роботът първоначално ходи и се спъва. Данните се връщат от сензорите към виртуален гръбначен мозък, където се сравняват данните от сензора и CPG. Ако данните от сензора не съвпадат с очакваните данни, алгоритъмът за обучение променя поведението при ходене, докато роботът ходи добре и без да се спъва. Промяна на изхода на CPG, като същевременно поддържа рефлексите активни и наблюдава препъването на робота е основна част от учебния процес.”

Енергийно ефективен робот за управление на кучета

Компютърът на Морти черпи само пет вата мощност в процеса на ходене. Индустриалните четириноги роботи от известни производители, които са се научили да работят с помощта на сложни контролери, са много по-гладни за енергия. Техните контролери са кодирани със знанието за точната маса и геометрията на тялото на робота – използвайки модел на робота. Те обикновено консумират няколко десетки, до няколкостотин вата мощност. И двата типа роботи работят динамично и ефективно, но консумацията на изчислителна енергия е много по-ниска в модела на Щутгарт. Той също така предоставя важна информация за анатомията на животните.

„Не можем лесно да изследваме гръбначния мозък на живо животно. Но можем да моделираме такъв в робота“, казва Александър Бадри-Спрьовиц, който е съавтор на публикацията с Рупърт и ръководи групата за изследване на динамичното движение. „Ние знаем, че тези CPG съществуват в много животни. Знаем, че рефлексите са вградени; но как можем да комбинираме и двете, така че животните да научат движения с рефлекси и CPG? Това е фундаментално изследване в пресечната точка между роботиката и биологията. Роботизираният модел дава ни отговори на въпроси, на които само биологията не може да отговори.”

.