Мама-робот создает роботов-детей для изучения искусственной эволюции

Мама-робот создает роботов-детей для изучения искусственной эволюции

При создании полностью нового робота, здравой мыслью является проверка его логики, чтобы понаблюдать за тем, насколько алгоритм поведения грамотно составлен. Но даже робот с идеальной имитацией едва ли покажет вам, как он будет вести себя, если вы построите полную версию. Как мы уже убедились, даже самые сложные симуляторы не всегда отображают будущее поведение робота в реальном мире.

Этот фундаментальный разрыв между симуляцией и реальностью становится особенно проблематичным, когда вы имеете дело с областью робототехники, где нецелесообразно строить физические версии всего, что разрабатывается. Эволюционная робототехника - это очень хороший пример того, где испытывается конструкция робота посредством внедрения схемы поведения на протяжении сотни и даже тысячи поколений. В виртуальной среде он работает прекрасно, но на практике все в разы сложней. Однако, с вещами вроде эволюционной робототехники, мы возвращаемся к первоначальному вопросу, который заключается в том, что развитый робот, идеально работающий в симуляции, работает совершенно неправильно в реальном мире. Это также ставит под вопрос значение итерации в работе робота во время симуляции в целом.

В статье, опубликованной PLOS ONE на прошлой неделе, Люциус Бродбек, Саймон Хаузер и Фумия Ида из Института робототехники и интеллектуальных систем швейцарской высшей технической школы Цюриха, сделали еще один шаг вперед, научив "робота-маму" автоматически строить "детей-роботов" из заданных компонентов, чтобы проследить, как они двигаются, моделируя тяжелый процесс эволюции роботов без каких-либо компромиссов.

Основная идея эволюционной робототехники заключается в построении кучи простых роботов, проведении над ними определенных тестов, выделении нескольких самых перспективных особей, и исследовании их структуры для воспроизведения в новом поколении. Именно так и работает биологическая эволюция (выживает самый приспособленный и все такое), и тот факт, что вы сидите и читаете этот текст, может служить достойным тому доказательством. Для тех из нас, у кого нет эонов времени на ожидание, роботы могут принудительно эволюционировать гораздо быстрее, так как вас интересует исключительно один аспект поведения, и существование робота крайне примитивно.

Это манипулятор UR5, "мама-робот" (он так называется в документах), которая строит локомотивные агенты (то, что можно назвать "ребенком-роботом") из стандартизированных запчастей, включая активные кубы с одной вращающейся лицевой стороной, и пассивные из дерева. Мама-робот склеивает активные и пассивные кубики вместе, и затем переносит их к зоне тестирования, где они удаленно активируются и находятся под надзором камеры.

Как только оценка составлена, дети-роботы разбираются (пока что вручную) путем удаления горячего клея, а компоненты возвращаются на конвейер создания новых роботов. Тем временем, "отличившиеся" с точки зрения ПО особи (те, что продвинулись дальше остальных быстрее остальных), пускаются по следующему кругу без изменений. Система также мутирует и скрещивает элитные особи для создания части следующего поколения.

Чтобы понять, как работает селекция и мутация роботов, модно сравнить ее с теорией генов. Дизайн каждого робота может быть описан геномом, состоящим из 1-5 генов, где каждый ген описывает характеристики модулей, которые создают ребенка-робота, включая его "мозг" (в форме параметров моторных команд). Ребенок, который создается на видео выше, имеет три гена, и каждый ген включает информацию о том, как этот модуль ориентирован и где он крепился на предыдущем модуле.

В случае мутации, случается одно из трех: геном "элитника" или весь ген набирается наугад, либо весь ген наугад, либо один параметр существующего гена меняется в случайном порядке. Потому, в контексте робота, который строился в первом видео, он мог получить еще один модуль, приклеенный куда-то (добавление гена), мог потерять один из трех модулей (удаление гена), или один из модулей мог быть прикреплен к левой стороне, вместо правой (изменение параметра существующего гена).

Кроссовер (разведение) элитных роботов немного проще, чем мутация: два элитных робота-родителя делят гены ровно пополам, и первые несколько генов первого родителя присоединяются к последним нескольким генам второго родителя. Это может привести к некоторым странностям, потому мутация предпочтительней кроссовера. После просчета всех мутаций и кроссоверов, мама-робот строит новое поколение, тестирует его, и повторяет эволюционный процесс еще раз.

Мама-робот создает роботов-детей для изучения искусственной эволюции

Исследователи проводили пять экспериментов, по 10 поколений из 10 роботов в каждом. На рисунке выше изображен каждый робот эксперимента №2. Каждая миниатюра является видом сверху в начале процесса оценки. Число в верхнем углу каждого изображения свидетельствует о его пригодности. Линии между картинками показывают использованный для генерации нового генотипа метод (толстый черный - элита; тонкий черный - кроссовер; тонкий серый - мутация). Отрицательная выживаемость и отсутствие изображения указывают на провал процесса построения соответствующего робота. Изображения указывают, что различные типы роботов будут протестированы, а их пригодности увеличиваются в ходе эксперимента.

Это довольно сложная серия фотографий показывает один из пяти экспериментов, где 10 поколений роботов были сконструированы, эволюционировали, и усовершенствовались. Очень часто встречается значительное различие даже между элитными роботами поколения, видимо, из-за того, что многие представители были нестабильны: иногда неплохо справлялись, а иногда совсем не справлялись (картинка ниже).

Мама-робот создает роботов-детей для изучения искусственной эволюции

Как можно заметить, элита не всегда хорошо проявляет себя в повторном тесте, даже при том же дизайне. Исследователи объяснили отсутствие повторного теста поколения тем, что такая непоследовательность является частью эволюционного процесса.

"Есть значительные отклонения в поведении некоторых агентов даже с идентичным геном, который является причиной, почему элита иногда не воспроизводит аналогичные результаты в последующих поколениях. С другой стороны, получается, что даже без нескольких испытаний, было обнаружено, что эволюционное давление имеет тенденцию выбирать более последовательных из всего поколения, и обычно повторяемый геном сохраняется на протяжении поколений. Вот потому мы и сохраняем текущую последовательность эксперимента. Ведь все должно учитываться в сторону выживания, таким образом, отсутствие точных повторяющихся испытаний не будут влиять на общую картину того, что мы пытаемся понять в физической эволюции робота."

Во всех экспериментах, выносливость зависит от начального поколения (А). Это означает, что эволюционный процесс, применяемый к исходной популяции роботов повышает их возможности передвигаться. Вид сверху на траекторию четырех успешных роботов экспериментов 1А, 1С и 2 показывает, что применяются различные стратегии передвижения (В). В то время, как наиболее успешные решения обеспечивают устойчивый предельный цикл, а также более нестандартное поведение (синий) позволяет достичь более высокой производительности.

В целом, "наблюдался прирост выживаемости более чем на 40% за 10 поколений во всех экспериментах", что очень хорошо, но впечатляющая часть в том, что это все с физической точки зрения: роботы все были построены и протестированы, потому вы знаете, что ваш элитный дизайн действительно является элитой, и будет вести себя хорошо, в каком приложении бы ни оказался этот маленький робот, состоящий из нескольких кубов.

Значит ли это окончание эволюционного моделирования роботов? Совсем нет, и исследователи могут указать на то, что их методы, скорее всего, начнут работать даже лучше в комбинации с симуляцией.

Демонстрации показывают возможности безмодельной эволюции физической системы. Оценка пригодности делается физическим роботом, который приносит реальные данные в трудоемкий процесс. Симуляции, с другой стороны, могут протестировать больше решений в более короткий срок. Поэтому, было бы интересно совместить оба метода вместо использования только одной крайности имитационных или реальных испытаний. Симуляция может, например, использоваться для предварительного отбора перспективных кандидатов для реальных испытаний, сократив время, затрачиваемое на решения с низким или вообще без шанса на успех.

Система Orphus
comments powered by Disqus
 
Top