Японские нейробиологи научились угадывать по данным электроэнцефалограммы, что снится человеку. Ученые пока не могут продемонстрировать, как именно выглядят образы из снов, однако вполне вероятно, что это произойдет уже очень скоро: ранее эта же группа на основе данных томографии научилась воспроизводить демонстрируемые наяву статичные изображения, а их американские конкуренты показали настоящее "мысленное кино".
Нейробиология - крайне разношерстная и, наверное, наиболее бурно развивающаяся область современных наук о жизни. В отличие от молекулярной и клеточной биологии, здесь неизвестно настолько много, что будет вполне уместным сравнение с научным Клондайком, куда еще не ступала нога золотоискателя. Здесь пока находится место и для рисковых ученых (а иногда - и вовсе не ученых), занятых проблемой поиска сознания, и для тех, кто исследует более "осязаемые", но от этого не менее значимые вещи - например, стволовые клетки мозга.
Самые впечатляющие результаты в последнее время демонстрируют исследователи, занятые изучением нейрональных основ зрения. Проще говоря, эти ученые пытаются понять, как мозг распознает визуальные образы, как он отделяет в них важную информацию от неважной и как узнает предмет, содержащийся в изображении. Это, однако, не означает, что исследования в этой области касаются только зрения - совсем наоборот.
Почему именно зрение?
Когда Фрэнсису Крику, открывшему вместе с Уотсоном структуру ДНК, надоело почивать на лаврах, он
(довольно неожиданно для многих) занялся нейробиологией зрения. И мотивацией к этому послужил не интерес к зрению как таковому, а стремление понять основы сознания и мышления.
Возьмем, к примеру, куб Неккера - такой незамысловатый рисунок, где изображены все 12 ребер куба. Если смотреть на него внимательно, то можно заметить: иногда кажется, что мы смотрим на него сверху, а иногда - что снизу. Специалистом в создании таких иллюзий был Мауриц Эшер. Однако здесь феномен конкуренции интерпретаций представлен в дистиллированном виде.
Широко известен опыт в том же духе, но со стереоскопической составляющей (binocular rivalry). Если продемонстрировать двум глазам разные картинки, то они будут не просто сливаться воедино, а конкурировать, вытеснять друг друга.
Оба опыта объединяет тот важный факт, что картинка, которую видят глаза, во время эксперимента не меняется. Видим ли мы куб Неккера сверху или снизу, определяется не тем, какая информация попадает в мозг по зрительным нейронам, а тем, на что мы обращаем внимание.
Один из главных прорывов в нейробиологии заключается в том, что ученым удалось наконец "пощупать" это внимание. Оказалось, что изменение ментальной интерпретации можно объективно зафиксировать, так как оно изменяет электрическую активность мозга.
Именно здесь находится та составляющая, которая привлекла интересующегося сознанием, но скептически мыслящего Фрэнсиса Крика. Интерпретация образа, которую мы видим, отличается от той, которую мы не видим, прежде всего тем, что видимая интерпретация осознается - она находится в данный момент в нашем сознании. Значит, где-то здесь и пролегает подвижная граница между теми нейронами, которые связаны с сознанием, и теми, которые с ним не связаны. Так, по крайней мере, думают многие нейробиологи.
Функциональная томография
Для объективного изучения требуется метод, способный давать объективные результаты. Люди тысячелетиями пытались понять, как устроено зрение, почему возникают иллюзии и зачем снятся сны, но науки из этого не получалось до тех пор, пока не была изобретена функциональная магнитно-резонансная томография (фМРТ).
Принцип фМРТ заключается в том, что с помощью измерения концентрации кислорода в отдельных зонах мозга можно установить их активность. Активные нейроны потребляют много энергии, их разрядка стимулирует повышенный ток крови в ближайших капиллярах. Это, в свою очередь, приводит к повышению концентрации в данном месте кислорода, что можно увидеть на картинке томографа.
Понятно, что такой опосредованный способ измерения активности нейронов не идет ни в какое сравнение с прямым измерением электрического потенциала нервных клеток при помощи электродов.
Во-первых, он усредняет активность многих тысяч клеток, находящихся в пределах вокселя - минимальной единицы объема мозга, активность которой измеряет прибор. У современных томографов воксель представляет собой куб со стороной не менее двух-трех миллиметров.
Во-вторых, изменение кровотока происходит на несколько порядков медленнее, чем электрическое возбуждение нейронов. Оно измеряется минутами, в то время как импульсы нейронов - миллисекундами.
Учитывая такие ограничения, приходится удивляться, как ученым вообще удается получить какие-то осмысленные результаты из данных фМРТ - не то что читать мысли. Оказывается, что в интерпретации данных сканера нейробиологам помогает моделирование и машинное обучение.
"Neuron"
В 2008 году группе исследователей под руководством Юкиясу Камитани (Yukiyasu Kamitani) удалось то, что раньше представлялось ученым совершенно невозможным. Они смогли воспроизвести изображения, который видели испытуемые, основываясь только на данных фМРТ их зрительных зон. Изображения были небольшие - всего 10х10 пикселей, однако этого оказалось достаточно, чтобы составить из них слово "neuron" - название журнала, в котором была опубликована статья.
Попробуем объяснить это на опыте попроще. Предположим, мы демонстрируем добровольцу узор из полосок разного наклона - вертикальных, диагональных и так далее. При этом мы считываем активность тысяч вокселей в той области мозга, которая, как мы знаем из физиологических работ, отвечает за первичный анализ зрительной информации (V1). Затем мы демонстрируем узоры с другими углами наклона и смотрим, как меняется активность разных вокселей.
Глядя на кривые, увидеть навскидку что-то осмысленное невозможно: активность немного меняется, но не так, как нам бы хотелось (например, чтобы отдельные воксели "отвечали" за отдельные углы наклона узора). Тогда для расшифровки полученных данных мы применяем метод машинного обучения. Проводим множество измерений при разных углах наклона узора и меняем математические "веса" активности тех или иных вокселей в модели. В каком-то смысле это напоминает подгонку кривых под экспериментальные данные методом регрессии.
В итоге мы получаем модель, в которой разным углам наклона соответствуют разные паттерны активации вокселей, и можем выполнить обратную задачу - угадать угол наклона по паттерну активации.
Чтобы применить такой подход для расшифровки изображений, его требуется усложнить. В эксперименте Камитани мы имеем дело не с одной переменной - углом наклона, а с изображением из сотни пикселей, которые могут быть белыми либо черными. Число их уникальных комбинаций огромно - 2100, составить паттерны для каждой из них невозможно, все комбинации нельзя даже просто показать добровольцу за разумное время.
Кроме того, мы не можем сказать, что, к примеру, левая верхняя сторона изображения распознается одной зоной визуальной коры мозга, а правая нижняя - другой. Как показывают эксперименты, это не так - в интерпретации участвует вся визуальная зона V-1.
Чтобы решить задачу, японские ученые применили остроумный редукционистский подход. Они поделили изображение на перекрывающиеся кусочки и провели корреляцию с данными томографа для каждого кусочка отдельно.
Здесь важно подчеркнуть: успех или неудача в чтении данных томографа зависит от того, что мы знаем о том, как визуальная кора интерпретирует изображение. Другими словами, все зависит от того, какой из параметров изображения мы будем учитывать в модели - на что мы будем ее тренировать (в предыдущем примере это был просто угол наклона).
Если, допустим, мы считаем, что мозг кодирует изображение как компьютер в формате BMP, то есть воспринимает для каждого пикселя его интенсивность, то работающей модели у нас не выйдет и изображения мы не получим. Потому что, как показывают физиологические опыты над животными, в визуальной коре V1 воспринимается не интенсивность изображения, а его контраст, угол, движение и некоторые другие параметры.
Японские ученые в качестве вводного параметра выбрали контраст. Им удалось получить множество математических моделей для кодирования каждого из перекрывающихся кусочков изображения. Из этих кусочков компьютер мог легко собрать восстановленное изображение, которое хоть и не было идеальным, но очень хорошо соответствовало демонстрируемой картинке. Это, конечно, было огромным шагом вперед по сравнению с тем, чтобы предсказать по томографии угол ориентации демонстрируемого изображения или, например, букву алфавита.
Ментальное кино
Спустя всего три года конкурирующая группа американских исследователей под руководством Джека Гэлланта сделала еще один прорывной шаг в направлении декодирования изображений. Им удалось воспроизвести по данным фМРТ не статическую черно-белую картинку разрешением в сто пикселей, а динамическое и достаточно подробное изображение ("natural movie", как назвали его авторы).
При этом ученые применили модель другой архитектуры. Основное внимание в ней уделялось не декодированию информации, а более аккуратному моделированию того, как мозг воспринимает изображения. Для этого они составили две отдельные модели. Первая симулировала поведение отдельных нейронов в ответ на изменения в демонстрируемом изображении, а вторая рассчитывала, как поведение тысяч таких нейронов скажется на яркости отдельных вокселей на фМРТ. В качестве первичных свойств изображения (по аналогии с углом и контрастом в предыдущих примерах) авторы рассматривали угол и скорость движения отдельных элементов.
Трое соавторов статьи (они сами выступили в роли добровольцев) проводили в томографе часы напролет, просматривая старые фильмы и видеоклипы с Youtube. В это время компьютер тщательно собирал данные об активности их визуальной коры. На этих данных проводилось обучение модели. После того как обучение было закончено, добровольцам демонстрировали новые короткие ролики (их не было в исходном наборе), и на основе полученной активности коры компьютер должен был восстановить то, что видели подопытные.
Результат, безусловно, получился впечатляющим, причем, судя по всему, даже для самих авторов. Дело в том, что, как уже указывалось раньше, данные фМРТ - это просто изменение кровотока в мозге. По сравнению с тем, как движется изображение на видео, это изменение происходит очень медленно. Никто из специалистов не ожидал, что из этих данных можно вычленить информацию о движении изображения в видеороликах. Это считалось совершенно невозможным, пока Гэллант и его постдок Нишимото не попытались это осуществить.
Дело за снами
Группе Юкуасу Камитани пришлось ответить чем-то еще более впечатляющим, чем реконструкция движущегося изображения. На конференции нейробиологов, которая только что закончилась в Новом Орлеане, он представил доклад по расшифровке образов из сновидений. Работа с описанием деталей эксперимента пока еще не опубликована, поэтому придется обойтись кратким пересказом доклада, приводимым Nature News.
В ходе эксперимента добровольцы должны были пересказывать содержание своих сновидений, которые они наблюдали сразу после засыпания. Их будили, расспрашивали о том, что они видели, а затем снова давали заснуть и вновь будили. Такие циклы засыпания-пробуждения проводили блоками по три часа, причем за час несчастных добровольцев будили по шесть-семь раз.
Все это время за активностью визуальной коры мозга внимательно следили при помощи электроэнцефалографии. Почему на этот раз ученые выбрали именно этот метод (гораздо более примитивный, чем фМРТ), пока сказать невозможно. Может быть, добровольцам просто неудобно было постоянно засыпать и просыпаться в томографе. Но узнаем это мы не раньше, чем будет опубликовано исследование.
Не имея возможности заглянуть при помощи фМРТ в визуальную кору и восстановить изображения так, как ранее Камитани и Гэллант уже делали, ученые решили применить более грубый подход. Они вычленяли из отчетов подопытных отдельные слова и строили модель на базе этих образов. Чтобы упростить задачу, те же образы добровольцам показывали в виде картинок уже наяву и искали общие паттерны возбуждения в визуальной коре.
В результате японским нейробиологам удалось получить модель, которая могла по данным энцефалограммы угадать, что снится человеку (в рамках набора ключевых слов) с вероятностью в 75-80 процентов.
Ясно, что эти результаты пока являются предварительными. Они очень сильно ограничены использованием электроэнцефалографии, которая дает гораздо более грубые данные, чем фМРТ. Однако, тем более впечатляют результаты моделирования: если ученым удалось вычленить визуальный образ из данных потенциала нескольких электродов, то что говорить о томографии. Если нечто подобное удастся сделать с фМРТ, то в скором времени мы сможем увидеть, как выглядят изнутри наши и чужие сны. По крайней мере технология для этого уже почти готова.
Вместо заключения
Как можно понять из этого рассказа, понимание работы мозга сейчас ограничивается прежде всего методами, при помощи которых ученые получают данные о его активности. Это, прежде всего, капиллярные электроды, идеально фиксирующие активность отдельных, но только нескольких нейронов (и неприменимые для человека), а также электроэнцефалография и фМРТ, дающие грубые усредненные данные.
Недавно, однако, была опубликована статья о том, как при помощи манипуляций с геномом ученые заставили светиться отдельные нейроны в мозге мыши. Этот метод позволяет очень быстро и точно получать данные об активности многих тысяч нервных клеток. К человеку он, конечно, неприменим, да и пока непонятно, будет ли он работать "вживую", а не на срезах. Однако, если представить, что это все-таки случится, Камитани и Гэллант будут знать, что делать с такими фантастически подробными данными.