Шрифт:
Закладка:
Для обучения нейронных сетей компания Tesla располагала одним из крупнейших в мире суперкомпьютеров. Он работал на графических процессорах (GPU), производимых компанией Nvidia. Целью Маска на 2023 год был переход к использованию суперкомпьютера Dojo, который компания Tesla создавала с нуля, для использования видеоданных для обучения системы искусственного интеллекта. Благодаря чипам и инфраструктуре, разработанным специалистами Tesla, он обладает вычислительной мощностью почти в восемь экзафлопсов (1018 операций в секунду), что делает его самым мощным в мире компьютером для этих целей. Он будет использоваться как для программного обеспечения самодвижущихся автомобилей, так и для робота Optimus. "Интересно работать над ними вместе", - говорит Маск. "Они оба пытаются ориентироваться в мире".
К началу 2023 года проект нейросетевого планировщика проанализировал 10 млн. кадров видео, собранных из автомобилей клиентов Tesla. Означает ли это, что она будет просто не хуже, чем в среднем водители-люди? "Нет, потому что мы используем данные, полученные от людей, только в том случае, если они хорошо справились с ситуацией, - поясняет Шрофф. Люди, многие из которых находятся в Буффало (штат Нью-Йорк), оценивали видеозаписи и выставляли им оценки. Маск сказал им искать то, что "сделал бы пятизвездочный водитель Uber", и именно эти видеозаписи использовались для обучения компьютера.
Маск регулярно проходил по зданию Tesla в Пало-Альто, где инженеры, занимающиеся разработкой автопилота, сидели на открытом рабочем месте, и опускался рядом с ними на колени для импровизированных дискуссий. Однажды Шрофф продемонстрировал ему достигнутые успехи. Маск был впечатлен, но у него возник вопрос: Действительно ли необходим такой новый подход? Может быть, это излишество? Одна из его максим гласила: чтобы убить муху, не стоит использовать крылатую ракету, достаточно воспользоваться мухобойкой. Не является ли использование нейронной сети для планирования траекторий излишне сложным способом решения нескольких очень маловероятных проблем?
Шрофф продемонстрировал на примере Musk примеры, в которых нейросетевой планировщик работает лучше, чем подход, основанный на правилах. В демонстрационном примере была показана дорога, захламленная мусорными баками, упавшими дорожными конусами и случайным мусором. Автомобиль, управляемый нейросетевым планировщиком, мог объезжать препятствия, пересекая полосы движения и нарушая при необходимости некоторые правила. "Вот что происходит, когда мы переходим от правил к сетевому планированию пути", - сказал ему Шрофф. "Машина никогда не столкнется с препятствиями, если вы включите эту штуку, даже в неструктурированной среде". Именно такой прыжок в будущее привел Маска в восторг. "Мы должны провести демонстрацию в стиле Джеймса Бонда, - сказал он, - когда со всех сторон взрываются бомбы и с неба падает НЛО, а автомобиль проносится мимо, ни во что не врезаясь".
Системам машинного обучения, как правило, требуется цель или метрика, которой они руководствуются в процессе самообучения. Маск, который любит управлять, определяя, какие показатели должны быть главными, дал им ориентир: количество километров, которые автомобили с системой полного самообучения Tesla смогли проехать без вмешательства человека. "Я хочу, чтобы последние данные по количеству миль на вмешательство были стартовым слайдом на каждом нашем совещании", - распорядился он. "Если мы обучаем ИИ, что мы оптимизируем? Ответ - увеличение пробега между вмешательствами". Он посоветовал им сделать это как видеоигру, где каждый день можно видеть свой результат. "Видеоигры без счета скучны, поэтому будет мотивирующим наблюдать каждый день за тем, как увеличивается количество миль за вмешательство".
Члены команды установили в своем рабочем пространстве массивные восьмидесятипятидюймовые телевизионные мониторы, на которых в режиме реального времени отображалось, сколько километров в среднем проезжают автомобили FSD без вмешательства. Если они видели, что тот или иной тип вмешательства повторяется - например, водитель хватается за руль во время смены полосы движения, слияния или поворота на сложном перекрестке, - они работали как с правилами, так и с нейросетевым планировщиком, чтобы исправить ситуацию. Рядом с их рабочими столами был установлен гонг, и каждый раз, когда они успешно решали проблему, вызвавшую вмешательство, они должны были бить в гонг.
Тест-драйв искусственного интеллекта
К середине апреля 2023 года Маску пришло время испытать новый нейросетевой планировщик. Он отправился на нем в поездку по Пало-Альто. Шрофф и команда Autopilot сконфигурировали автомобиль таким образом, чтобы он полагался на программное обеспечение, обученное нейронной сетью имитировать вождение человека. Программа содержала лишь минимум традиционного кода, основанного на правилах.
Маск сел в водительское кресло рядом с Ашоком Эллюсвами, директором Tesla по программному обеспечению Autopilot ( ). Шрофф сел сзади вместе с двумя другими членами своей команды, Мэттом Баучем и Крисом Пейном. Эта троица работала за соседними столами в Tesla в течение восьми лет, и все они жили в нескольких кварталах друг от друга в Сан-Франциско. На столах, где у большинства людей стоит семейная фотография, у каждого из них были идентичные снимки, на которых они втроем позировали на вечеринке в честь Хэллоуина. Джеймс Маск был четвертым членом их команды, пока его дядя не возглавил Twitter и не перевел его туда, чего Шроффу удалось избежать.
Приготовившись к выезду с парковки офисного комплекса Tesla в Пало-Альто, Маск выбрал на карте место, куда должен отправиться автомобиль, нажал на кнопку Full Self-Driving и убрал руки с руля. Когда автомобиль свернул на главную дорогу, возникла первая пугающая проблема: навстречу ехал велосипедист. "Мы все затаили дыхание, ведь велосипедисты могут быть непредсказуемы", - говорит Шрофф. Но Маск проявил беспечность и не попытался схватиться за руль. Машина сама уступила дорогу. "Это было похоже на то, как поступил бы водитель-человек", - говорит Шрофф.
Шрофф и его коллеги подробно рассказали о том, как используемое ими программное обеспечение FSD было обучено на миллионах видеоклипов, собранных с камер на автомобилях клиентов. В результате был создан гораздо более простой программный комплекс, чем традиционный, основанный на тысячах правил,