Шрифт:
Закладка:
Мое время не могло быть лучше, даже если это было не более чем случайностью. Я еще не знал об этом, но изучение зрения стало отростком искусственного интеллекта как такового - одно сообщество среди многих, находящихся в изгнании, раздробленных и отброшенных от знамени, которое когда-то их объединяло, а сейчас десятилетие находится в глубокой заморозке очередного экономического спада. Затухание некогда захватывающих перспектив, таких как нейронные сети и экспертные системы, привело к очередному витку отчуждения, когда стартапы закрыли свои двери, а академический интерес угас. Это была очередная зима в области ИИ, и я находился в ее гуще. Но оттепель наступала быстро.
Глава 6. Северная звезда
На горизонте забрезжил рассвет в Пасадене, окрашенный в палитру теплых цветов, которые я уже успел признать типично калифорнийскими. Его призыв выйти на улицу и пренебречь обязательствами дня был заманчив, но ни одно небо не было достаточно голубым, чтобы соперничать с обещанием открытий. Сегодня был первый день нового эксперимента, к которому я готовился несколько месяцев, и он ждал меня под землей.
Наша работа проходила в отделе психофизики лаборатории Коха - тенистом подвальном мире, скрытом под лужайками и велосипедными дорожками Калтеха. Лишенное естественного света и регулярно лишаемое искусственного, это было место почти идеальной изоляции: три одинаковые кабинки, разделенные затемняющими шторами, каждая достаточно большая, чтобы изолировать органы чувств одного сидящего человека.
Оказавшись внутри, наши испытуемые клали одну руку на мышь, другую - на клавиатуру и вглядывались в темноту. После кратковременного затишья загорался монитор, на котором появлялась последовательность изображений, настолько бессвязных, что они могли быть созданы дадаистом: буквы, расположенные как алфавитный суп; фотографии случайных, разрозненных сцен; внезапные вспышки цветного шума - все с точностью до миллисекунды и вызывающие точно измеренные повторные спонсоры щелчков и нажатий клавиш. Затем, в течение нескольких секунд, темнота возвращалась. В воздухе повисало еще одно мгновение неподвижности, и последовательность повторялась. Снова, и снова, и снова.
Как бы хаотично это ни выглядело, ни одна деталь не была произвольной. Все это было похоже на попытку, пусть и надуманную, прочитать мысли или хотя бы составить представление об их содержании. Несколько секунд бешеного движения пальцев, неглубокого дыхания и расширяющихся зрачков, запечатленных в зарослях данных, на полное распутывание которых могут уйти дни, недели и даже месяцы. Секреты органов чувств глубоко спрятаны, и вытащить их на свет хотя бы на мгновение может оказаться странным делом.
Эволюция в течение полумиллиарда лет упорно трудилась над одним-единственным светочувствительным белком, неустанно подталкивая его к созданию столь изысканного аппарата, что он почти не поддается пониманию. Теперь, в Калтехе, плоды этого труда должны были стать нашим учителем - вся зрительная кора, простирающаяся от стеклянной поверхности глаза до самых глубоких глубин разума. По мнению моих консультантов, первым шагом на пути к обещанному машинному интеллекту должно было стать лучшее понимание человеческого рода.
Я не знал, на что именно я рассчитывал в годы учебы в аспирантуре, кроме возможности погрузиться в область, которая украла мое сердце. Но я надеялся, что где-то на этом пути я найду занятие, которому смогу следовать с рвением моих образцов для подражания - духом, который побудил Эрика Висхауса превратить одержимость аномалиями плодовой мушки в Нобелевскую премию или Нила деГрасса Тайсона превратить космос в числовую поэзию. Мне нужна была своя собственная Полярная звезда. Но пока я ее не нашел, я довольствовался тем, что обдумывал вопрос о том, как на самом деле работает невыразимый опыт видения, - или, говоря нескладным языком подзаголовка моего учебника, как фотоны становятся феноменологией.
Первый шаг к этому пониманию был сделан на страницах моего учебника "Наука о зрении", в котором рассказывалось о психологе Анне Трейсман из Принстона . Вундеркинд эксперимента и гигант когнитивной науки двадцатого века, она сочетала очаровательно простые инструменты с сырой изобретательностью, чтобы исследовать человеческое восприятие, за десятилетия до появления цифровых технологий, которые значительно ускорили бы ее исследования.
Разработанная Трейсманом "теория интеграции признаков внимания" стала почти универсальной основой для понимания природы зрительного восприятия. Представляя испытуемым кратковременную вспышку абстрактной композиции - например, одиночный красный круг в мешанине зеленых и красных квадратов, - она смогла разделить время, необходимое им для восприятия изображения на разных уровнях глубины. Она обнаружила, что люди практически мгновенно определяют присутствие красного цвета - просто знают, что он содержится где-то внутри изображения, - но им требуется больше времени, чтобы найти именно красный круг, поскольку его идентичность представляет собой сочетание двух разных признаков: цвета и формы, совпадающих в одном и том же месте. Другими словами, способность интегрировать восприятие красного цвета и восприятие круга не только занимала больше времени, но и представляла собой совершенно отдельный, более интенсивный этап визуальной обработки.
Работа Трейсмана была грандиозной по своему размаху и плотной по своим объяснениям, но ее объединяла идея о том, что человеческое зрение начинается с определения мелких деталей, а затем устанавливает взаимосвязи между ними, пока они не откроют полную картину. Это был интуитивный тезис, и он предлагал метрику для понимания работы зрения: простые объекты, определяемые небольшим количеством признаков, можно распознать быстро - например, оранжевый мяч на сером асфальте, - в то время как более сложные сцены, такие как извилистая лесная тропа или детали лица друга, требуют больше времени.
Эта парадигма, как я видел, повторялась в изучении компьютерного зрения, когда исследователи писали и совершенствовали алгоритмы, способные определять фундаментальные детали на фотографиях и других изображениях - резкие края, изменения света и цвета, фрагменты текстуры или узоры - а затем создавали алгоритмы более высокого уровня, чтобы распознавать связи между ними и ассоциировать их с более значимыми вещами, такими как люди и объекты. То немногое, что я знал о зрении, имело смысл. Но вскоре картина должна была стать гораздо сложнее.
"У меня есть кое-что для твоего списка чтения, Фей-Фей, - сказал Пьетро, положив копию статьи на стол передо мной.
"Это?"
Я взял его в руки и пролистал, заметив, что он меньше четверти объема большинства опубликованных работ. Пьетро понимающе улыбнулся.
"Поверьте мне. Вам захочется это прочитать".
Он не шутил.
Статья, представленная нейробиологом Саймоном Торпом в раздел "Письма" журнала Nature за 1996 год, была короткой - всего три страницы, но громогласной в своих выводах. Даже ее несерьезное название - "Скорость обработки информации в зрительной системе человека" - преуменьшало то влияние, которое она могла оказать, поскольку ставила под сомнение общепринятую ортодоксальность целой области. Это