Эволюция порока Исследователи научили роботов лгать и размножаться

Долгое время считалось, что способность обманывать присуща только человеку. По мере развития науки обманщики нашлись и в животном мире. Теперь настала очередь роботов. Ученые "вырастили" 500 поколений машин, и к последним стадиям эволюции роботы стали профессионально дурить своих товарищей, чтобы получить больше "еды". При моделировании робоэволюции исследователи учли все детали, включая и самое интересное - половое размножение.

Авторы новой работы, принятой к публикации в журнал Proceedings of the National Academy of Sciences, изучают эволюцию. Этот термин вызывает у многих людей ассоциации разве что с первичным бульоном и знаменитой (и при этом неверной) фразой "человек произошел от обезьяны". В действительности, эволюционировать может практически все что угодно. Первый автор работы - Сара Митри (Sara Mitri) занимается эволюцией коммуникации. Специальность Лорена Келлера (Laurent Keller) - эволюционная биология с уклоном в эволюцию социальных отношений у муравьев. Дарио Флореано (Dario Floreano) моделирует эволюцию у роботов. В новом исследовании трое ученых объединили свои усилия, чтобы выяснить, как изменится в ходе эволюции поведение роботов, способных общаться друг с другом и при этом вынужденных конкурировать за еду.

Эволюция в манеже

Отдельной социальной ячейкой созданного исследователями робообщества была группа из десяти машин. Их внешность совсем не напоминала облик роботов из научно-фантастических фильмов. Каждый робот представлял собой плоскую платформу, закрепленную на двух гусеницах. Рядом с гусеницами были встроены детекторы, определяющие цвет поверхности. Каждый робот был опоясан лентой, которая могла светиться синим. Наверху платформы располагалась камера, способная улавливать этот свет.

A. Экспериментальный манеж с "едой" (F) и "ядом" (P). B. Внешний вид робота. Изображение авторов исследования
Lenta.ru

Жизненное пространство роботов было ограничено небольшим манежем, в одном конце которого находилась "еда" (участок пола, ограниченный светлым кольцом), а в другом - "яд" (часть поверхности, очерченная темным кольцом). Машины были запрограммированы как можно дольше оставаться возле "еды". Определить, что перед ними, роботы могли при помощи детекторов, вплотную подъехав к источнику "еды" или "яда". При этом рядом с "едой" могли одновременно уместиться не более восьми роботов.

Эволюционный успех роботов оценивался, исходя из количества времени, проведенного возле "еды" и "яда". Машина получала один балл за каждую единицу времени, когда она находилась рядом с "едой", и минус балл, если она проводила заданное количество секунд возле "яда". В ходе эксперимента роботы постепенно обучались тратить меньше времени на поиск источника пищи. Время жизни каждого поколения роботов составляло 1200 временных единиц. По истечении этого срока исследователи отбирали двух из десяти роботов, набравших максимальное количество баллов.

Счастливчики получали возможность произвести потомство. На данном этапе развития робототехники непосредственно скрещивать двух роботов ученые не умеют. Чтобы смоделировать половое размножение, исследователи вносили изменения в "геномы" машин, контролирующие их "нервную систему". Каждый робот обладал 11 входящими "нейронами", которые соединялись с тремя исходящими через 33 "синапса". Значимость, или "вес", сигнала, прошедшего по каждому из "синапсов", была различной. Роботы варьировали параметры ответа (скорость кручения гусениц или включение синего свечения) в зависимости от суммарной величины сигнала, поступившего от всех 33 синапсов. "Вес" каждого "синапса" кодировал один из "генов". Соответственно, всего в "геноме" роботов было по 33 гена.

При половом размножении живых существ геномы отца и матери смешиваются друг с другом. Кроме того, в генах потомков обязательно появляются мутации, возникшие в ходе процесса перемешивания. Для создания нового поколения роботов авторы работы случайным образом выбирали "папу" и "маму" из числа машин, наиболее преуспевших в своей жизни. "Гены" родителей ("вес" отдельных "синапсов") перемешивались, и в них с определенной частотой вносились мутации (изменение "веса"). Новое поколение роботов также запускалось на манеж, и процесс естественного отбора повторялся. В каждой серии экспериментов (всего их было две) авторы "вырастили" по 500 поколений роботов. Каждое последующее поколение искало "еду" несколько эффективнее предыдущего.

Конкуренция и разнообразие

Этот эксперимент был бы не так интересен, если бы роботы боролись за "еду" абсолютно независимо друг от друга. У живых существ, даже у самых примитивных, такая ситуация никогда не встречается. Все организмы контактируют между собой, вынося из общения некую информацию. Иногда одна особь подает другой какой-то сигнал намеренно, а иногда это происходит непроизвольно. При этом передача информации происходит в обоих случаях.

В робообществе единственным средством передачи сигнала между машинами служил синий свет, который испускала опоясывающая роботов лента. По мере того, как машина совершенствовала свои навыки поиска "еды", в каждый момент времени рядом с ней находилось больше роботов, чем в предыдущих поколениях. Соответственно, интенсивность голубого свечения возле источника "еды" возрастала.

Роботы довольно быстро поняли, что синее свечение с высокой вероятностью указывает на "еду", и у них выработался рефлекс ехать в направлении света. Такое поведение привело к усилению конкуренции возле источника "еды": доходило до того, что роботы начинали отталкивать друг друга от заветного светлого кольца. Очевидно, что сокрытие синего сигнала улучшило бы шансы отдельного робота оказаться рядом с "едой". Во второй серии опытов ученые дали роботам возможность контролировать свечение ленты.

Пунктиром показана информативность голубого свечения в первой серии опытов, сплошной линией - во второй. Нулевое значение информативности соответствует абсолютно равномерному распределению сигнала. Информативность равна единице, когда синий свет однозначн
Lenta.ru

Результат превзошел все ожидания. Обманывать своих товарищей начало уже десятое поколение роботов. К 52-му поколению роботы существенно реже включали ленту, находясь рядом с "едой", чем будучи поблизости от "яда". Соответственно, информативность сигнала к 52-му поколению резко упала. Наглядно падение представлено на графике справа.

Уменьшение информативности передаваемых роботами сигналов было ожидаемым. Неожиданным оказалось, что она не упала до нуля. Вплоть до 500-го поколения роботы иногда включали ленту, находясь рядом с источником "еды". Поэтому в череде поколений машин сохранился рефлекс движения в сторону синего свечения.

Объяснить этот парадоксальный, казалось бы, результат можно следующим образом. Падение информативности синего свечения привело к тому, что роботы стали слабее реагировать на него. В поздних поколениях включение ленты рядом с "едой" с меньшей вероятностью приводило к тому, что к неосторожному роботу сбегались несколько конкурентов. А значит, робот мог набрать максимальное число баллов и дать потомство даже в том случае, если он не научился всегда обманывать окружающих.

Такая мягкость естественного отбора привела к тому, что к 500-му поколению в робообществе сформировались несколько типов машин с кардинально разным поведением. Большая часть (61,5 процент) из них никогда не включали ленту, если поблизости была "еда". С вероятностью 50 процентов синее свечение рядом с "едой" испускали 11,2 процента роботов. Вероятность свечения остальных машин находилась в промежутке между 0 и 100 процентами.

Появление в популяции нескольких типов геномов является следствием так называемого дрейфа генов. Этот процесс происходит, когда особь с неким набором генов случайно получает возможность дать потомство и распространить свои гены в популяции. Дрейф генов приводит к появлению большого геномного разнообразия в условиях, когда давление отбора не очень сильно. При этом возможность оставить потомство появляется у особей с самыми разными генотипами. При жестком давлении размножиться могут организмы, обладающие строго определенным набором признаков.

Как научить плохому

По итогам своей работы авторы сделали несколько выводов. Во-первых, они показали, что общение между особями и передача информации являются немаловажными факторами для выработки стратегий поведения. Во-вторых, исследователи еще раз подтвердили, что борьба за ресурсы не приводит к полному исчезновению информативных сигналов даже в том случае, когда они могут навредить особи, передающей сигнал. В-третьих, работа авторов является наглядным доказательством пригодности роботов для моделирования эволюционных процессов в живых системах.

Противники теории эволюции часто приводят невозможность проверки ее положений экспериментально в качестве довода, подтверждающего их точку зрения. С помощью роботизированных систем можно во много раз "ускорить" эволюционные процессы и задействовать в них очень большое число особей. Роботы дают возможность эволюционистам изучить те или иные аспекты прошлого живых организмов и предсказать, как они будут развиваться в будущем.

Эволюция порока Исследователи научили роботов лгать и размножаться

Эволюция в манеже

Конкуренция и разнообразие

Как научить плохому

Последние новости