Онлайн
библиотека книг
Книги онлайн » Разная литература » Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li

Шрифт:

-
+

Закладка:

Сделать
1 ... 67 68 69 70 71 72 73 74 75 ... 95
Перейти на страницу:
о жизни физика в те пьянящие дни, пытаясь представить себе тайну и благоговение, которые, должно быть, испытывали те первые пионеры. Трудно было не позавидовать им, их взгляды на реальность изменились так радикально и так внезапно в результате пробуждения к тайнам квантового мира и релятивистского величия космоса. Они родились в нужное время и в нужном месте, чтобы получить один из самых захватывающих даров истории. Не кажется гиперболой мысль о том, что современное воплощение нейронных сетей - это эквивалент нашего поколения.

Однако уже тогда были причины признать, что будущее не будет чисто поэтическим. Одним из наиболее ярких предвестников перемен стала трансформация научных конференций, посвященных ИИ. На протяжении десятилетий они были скромными мероприятиями, в которых участвовали исключительно профессора, исследователи и студенты, не привлекая внимания СМИ и испытывая нехватку денег. Корпоративные спонсоры были редки, обычно ограничивались академическими издательствами вроде Springer и занимали лишь несколько длинных столов в углу выставочного зала. Но в последующие годы после AlexNet имена из самых вершин списка Fortune 500 превратили мероприятия в зрелища, каждое новое собрание все больше напоминало отраслевую выставку на Лас-Вегас-Стрип. Уже через несколько лет огромные стенды с логотипами, купающиеся в разноцветной подсветке, стали обычным явлением, а такие компании, как Google и Microsoft, устраивали экстравагантные вечеринки для аспирантов, рассматривающих варианты карьеры.

Голод охватил эту область, поскольку возникло желание добиться большего. Больше слоев, чтобы сделать нейронные сети глубже и мощнее. Больше кремния, чтобы ускорить процесс обучения и сделать возможным развертывание все более крупных сетей. И, конечно, больше данных. Больше изображений, больше видео, больше аудио, больше текста и всего остального, что сеть может научиться понимать. Больше всего.

Было интересно думать о возможностях, которые могут открыть эти новые организованные данные, но в то же время и страшно; в моей лаборатории мы уже убедились, что в материале всегда скрыто больше, чем мы думали. Это никогда не были просто изображения, или аудио, или текст - данные позволяли модели формировать представление о мире, а большие данные означали более мощные и нюансированные представления. Отношения, связи и идеи. Истины и неправды. Проницательность и предрассудки. Новое понимание, но и новые подводные камни. Революция глубокого обучения уже наступила, и никто из нас не был к ней готов.

Тем временем исследовательская программа нашей лаборатории проявляла собственную прожорливость: сколько бы мы ни достигли, каждая новая публикация, казалось, порождала десять последующих идей, которые кто-то, будь то постдок или аспирант первого года обучения, был готов подхватить и воплотить в жизнь. Именно это мне и нравилось, даже если часто это казалось чрезмерным.

Я подумал, что истинная ценность Полярной звезды как метафоры заключается не только в ее способности указывать путь, но и в том, что ее расстояние остается вечно бесконечным. К ней можно стремиться до изнеможения, она может стать объектом одержимости всей жизни, но так и не быть достигнутой. Это символ самой характерной черты ученого: любопытство настолько неугомонно, что навсегда отталкивает удовлетворение, как противоположные магниты. Звезда в ночи, мираж вдали, дорога без конца. Я понял, что именно таким для меня становится ИИ. ImageNet стал поворотным моментом, который, безусловно, стоит отпраздновать, но это был не конец пути. Скорее, это было начало еще более грандиозного путешествия. И помимо этого, я теперь был уверен, меня ждало больше, чем может вместить карьера и даже жизнь.

 

Получив в свое распоряжение пригодную для публикации демонстрацию нашей техники создания подписей к изображениям, мы с Андреем провели следующие несколько недель, совершенствуя наши методы и документируя результаты. Результат нашего гамбита оправдал все мои надежды: хотя предложения все еще оставались простыми и немногословными, они были точными и достаточно естественными в своей формулировке. Это действительно был, по словам Джереми Вулфа, алгоритм, который улавливал "суть" того, что видел.

Пришло время поделиться ею с миром. В конечном итоге это означало академическую аудиторию, и наша работа была принята к участию в конференции 2014 года по системам обработки нейронной информации, или NeurIPS, до которой оставалось несколько недель. Тем временем меня пригласили выступить с лекцией на семинаре IBM в Аламеде, на другом берегу залива, и я не смог удержаться, чтобы не рассказать о том, чего мы добились раньше срока.

Обмен неопубликованными работами был нестандартным шагом, но телефонный звонок, который я получил сразу после этого, подтвердил, что он был правильным. Он поступил от Джона Маркоффа, технологического репортера The New York Times, когда я все еще находился на заднем сиденье своего Uber, направлявшегося в Стэнфорд. Я давно питал симпатию к Джону, поскольку он был одним из немногих представителей СМИ, кто оценил важность ImageNet на ранних этапах ее развития, освещая ее в Times несколькими годами ранее. Тем не менее, импровизированный звонок был необычным.

"Джон? Привет! Как дела?"

"Хорошо, хорошо. Угадайте, кто был в аудитории IBM сегодня утром?"

Ха. Мне и в голову не приходило, что здесь может присутствовать журналист. Я почувствовал, что происходит что-то странное.

"Этот ваш алгоритм - тот, который генерирует предложения для описания изображений, - вы сказали, что он еще не опубликован, верно?"

"Именно так. Но мы представим его официально на выставке NeurIPS в декабре".

"Приятно слышать", - уклончиво ответил Джон, прежде чем перейти к делу. "Послушайте, я хотел сообщить вам, что у меня в руках есть материал - разумеется, под эмбарго - о другой исследовательской группе. Я не могу сказать, кто это, но они утверждают, что создали первый алгоритм, который... ну, - он неловко рассмеялся, - "генерирует предложения, описывающие изображения".

Что?

Это не имело смысла. Мы с Андреем даже не подозревали, что кто-то еще работает над этой проблемой. Но Джон оказался прав. Всего через несколько дней в "Таймс" появилась его статья, озаглавленная "Исследователи объявили о достижении в области программного обеспечения для распознавания изображений". Он написал: "Две группы ученых, работая независимо друг от друга, создали программное обеспечение для искусственного интеллекта, способное распознавать и описывать содержание фотографий и видео с гораздо большей точностью, чем когда-либо прежде".

В академическом соперничестве нет ничего нового, и конкуренция между исследователями всегда была частью магии, которая делает наш мир такой плодородной почвой для инноваций. Тем не менее было странно, что меня это застало врасплох. Исследовательский мир известен своей открытостью, иногда до предела; если не считать права хвастаться тем, что открыл что-то первым, к нашей работе обычно не относятся как к интеллектуальной собственности, не говоря уже о чем-то конфиденциальном, вроде коммерческой тайны. Она предназначена для того, чтобы

1 ... 67 68 69 70 71 72 73 74 75 ... 95
Перейти на страницу: